配置
以下描述了可用的嵌入配置。这些参数通过 Embeddings 构造函数中的 config
参数或作为关键字参数设置。
配置被设计为可选的,仅在需要时设置。开箱即用时,会选择合理的默认值以便快速启动和运行。例如
from txtai import Embeddings
embeddings = Embeddings()
创建一个新的嵌入实例,使用 all-MiniLM-L6-v2 作为向量模型,Faiss 作为 ANN 索引后端,并禁用内容。
from txtai import Embeddings
embeddings = Embeddings(content=True)
与上述相同,但增加了 SQLite 用于内容存储。
以下部分链接到所有可用的配置选项。
ANN
默认向量索引后端是 Faiss。
云
嵌入数据库可以选择性地与云存储同步。
数据库
内容存储默认禁用。启用时,SQLite 是默认的存储引擎。
通用
不属于其他部分的通用配置。
图
可以为嵌入数据库创建一个配套的图索引。这可以实现主题建模、路径遍历等。NetworkX 是默认的图索引。
评分
稀疏关键词索引和词向量项加权。
向量
通过将文本和其他二进制数据转换为嵌入向量来启用向量搜索。这些向量随后存储在 ANN 索引中。向量模型是可选的,未提供时使用默认模型。