数据库
数据库存储元数据、文本和二进制内容。
内容
content: boolean|sqlite|duckdb|client|url|custom
启用内容存储。当设置为 true 时,将使用默认存储引擎 sqlite
来保存元数据。
通过 client
或完整的连接 URL 支持客户端-服务器连接。当设置为 client
时,必须将 CLIENT_URL 环境变量设置为完整的连接 URL。有关如何构建客户端-服务器数据库连接字符串的更多信息,请参阅 SQLAlchemy 文档。
通过将此参数设置为完全可解析的类字符串来添加自定义存储引擎。
内容存储特定设置通过与内容存储引擎(即 duckdb 或 sqlite)同名的相应配置对象进行设置。这些设置是可选的,如果省略则设置为默认值。
客户端
schema: default database schema for the session - defaults to being
determined by the database
客户端-服务器数据库的其他设置。当 content=url
时也支持。
sqlite
sqlite:
wal: enable write-ahead logging - allows concurrent read/write operations,
defaults to false
SQLite 的其他设置。
对象
objects: boolean|image|pickle
启用对象存储。支持存储二进制内容。需要同时启用内容存储。
对象编码选项包括
standard
: 布尔值设置为 true 时的默认编码器。将对象编码和解码为字节数组。image
: 图像编码器。将对象编码和解码为图像对象。pickle
: Pickle 编码器。使用 pickle 模块对对象进行编码和解码。支持任意对象。
函数
functions: list
带有用户定义的 SQL 函数的函数列表,仅在 内容 启用时使用。列表中的每个元素必须是以下之一
- 函数
- 可调用对象
- 包含 name、argcount 和 function 字段的字典
查询
query:
path: sets the path for the query model - this can be any model on the
Hugging Face Model Hub or a local file path.
prefix: text prefix to prepend to all inputs
maxlength: maximum generated sequence length
查询翻译模型。将自然语言查询翻译为 txtai 兼容的 SQL 语句。