跳到内容

数据库

数据库存储元数据、文本和二进制内容。

内容

content: boolean|sqlite|duckdb|client|url|custom

启用内容存储。当设置为 true 时,将使用默认存储引擎 sqlite 来保存元数据。

通过 client 或完整的连接 URL 支持客户端-服务器连接。当设置为 client 时,必须将 CLIENT_URL 环境变量设置为完整的连接 URL。有关如何构建客户端-服务器数据库连接字符串的更多信息,请参阅 SQLAlchemy 文档。

通过将此参数设置为完全可解析的类字符串来添加自定义存储引擎。

内容存储特定设置通过与内容存储引擎(即 duckdb 或 sqlite)同名的相应配置对象进行设置。这些设置是可选的,如果省略则设置为默认值。

客户端

schema:  default database schema for the session - defaults to being
         determined by the database

客户端-服务器数据库的其他设置。当 content=url 时也支持。

sqlite

sqlite:
    wal: enable write-ahead logging - allows concurrent read/write operations,
         defaults to false

SQLite 的其他设置。

对象

objects: boolean|image|pickle

启用对象存储。支持存储二进制内容。需要同时启用内容存储。

对象编码选项包括

  • standard: 布尔值设置为 true 时的默认编码器。将对象编码和解码为字节数组。
  • image: 图像编码器。将对象编码和解码为图像对象。
  • pickle: Pickle 编码器。使用 pickle 模块对对象进行编码和解码。支持任意对象。

函数

functions: list

带有用户定义的 SQL 函数的函数列表,仅在 内容 启用时使用。列表中的每个元素必须是以下之一

  • 函数
  • 可调用对象
  • 包含 name、argcount 和 function 字段的字典

示例可以在这里找到.

查询

query:
    path: sets the path for the query model - this can be any model on the
          Hugging Face Model Hub or a local file path.
    prefix: text prefix to prepend to all inputs
    maxlength: maximum generated sequence length

查询翻译模型。将自然语言查询翻译为 txtai 兼容的 SQL 语句。