跳到内容

分布式嵌入集群

API 支持将多个 API 实例组合成一个逻辑嵌入索引。下面显示了一个示例配置。

cluster:
    shards:
        - http://127.0.0.1:8002
        - http://127.0.0.1:8003

此配置将上述 API 实例聚合成索引分片。数据在索引时均匀地分配到每个分片。查询并行运行于每个分片,并将结果合并。此方法允许水平扩展,并支持非常大的索引集群。

此方法仅建议用于记录数量超过 10 亿的数据集。ANN 库可以轻松支持较小的数据大小,并且此方法不值得额外的复杂性。目前,在构建初始索引后无法添加新的分片。

请参阅下面的链接,了解有关分布式嵌入集群的详细示例。

Notebook 描述
分布式嵌入集群 在多个数据节点上分发嵌入索引 Open In Colab