跳到内容

配置

以下描述了可用的嵌入配置。这些参数通过 Embeddings 构造函数中的 config 参数或作为关键字参数设置。

配置被设计为可选的,仅在需要时设置。开箱即用时,会选择合理的默认值以便快速启动和运行。例如

from txtai import Embeddings

embeddings = Embeddings()

创建一个新的嵌入实例,使用 all-MiniLM-L6-v2 作为向量模型,Faiss 作为 ANN 索引后端,并禁用内容。

from txtai import Embeddings

embeddings = Embeddings(content=True)

与上述相同,但增加了 SQLite 用于内容存储。

以下部分链接到所有可用的配置选项。

ANN

默认向量索引后端是 Faiss。

嵌入数据库可以选择性地与云存储同步。

数据库

内容存储默认禁用。启用时,SQLite 是默认的存储引擎。

通用

不属于其他部分的通用配置。

可以为嵌入数据库创建一个配套的图索引。这可以实现主题建模、路径遍历等。NetworkX 是默认的图索引。

评分

稀疏关键词索引和词向量项加权。

向量

通过将文本和其他二进制数据转换为嵌入向量来启用向量搜索。这些向量随后存储在 ANN 索引中。向量模型是可选的,未提供时使用默认模型。