跳到内容

安装

install install

最简单的安装方式是通过 pip 和 PyPI。

pip install txtai

支持 Python 3.10+。建议使用 Python 虚拟环境

可选依赖项

txtai 具有以下可选依赖项,可以作为额外项安装。setup.py 的 install_requires 部分支持以下模式。

注意:提供额外项是为了方便。另外,也可以安装单个包以限制依赖项。

全部

安装所有依赖项。

pip install txtai[all]

ANN

额外的 ANN 后端。

pip install txtai[ann]

API

通过 Web API 提供 txtai 服务。

pip install txtai[api]

与云计算进行交互。

pip install txtai[cloud]

控制台

命令行索引查询控制台。

pip install txtai[console]

数据库

额外的存储内容选项。

pip install txtai[database]

主题建模、数据连接和网络分析。

pip install txtai[graph]

模型

额外的非标准模型。

pip install txtai[model]

流水线

所有流水线 - 默认安装包含最常用的流水线。

pip install txtai[pipeline]

针对流水线类别提供了更精细的额外项:pipeline-audiopipeline-datapipeline-imagepipeline-llmpipeline-textpipeline-train

评分

额外的评分方法。

pip install txtai[scoring]

向量

额外的向量方法。

pip install txtai[vectors]

工作流

所有工作流任务 - 默认安装包含最常用的工作流任务。

pip install txtai[workflow]

组合依赖项

可以同时指定多个依赖项。

pip install txtai[pipeline,workflow]

特定环境的先决条件

下面是特定环境的额外先决条件。

Linux

AudioStream 和 Microphone 流水线需要 PortAudio 系统库。Transcription 流水线需要 SoundFile 系统库。

macOS

较旧版本的 Faiss 在 macOS 上存在对 libomp 的运行时依赖。在这种情况下,运行 brew install libomp

AudioStream 和 Microphone 流水线需要 PortAudio 系统库。运行 brew install portaudio

Windows

可选依赖项需要 C++ Build Tools

当存在其他已知但临时性依赖项问题时,txtai 构建工作流 偶尔会包含变通方案。常见问题 也有常见问题列表,包括常见的安装问题。

仅 CPU

默认安装会添加支持 GPU 的 PyTorch。这会带来一些依赖项。在仅 CPU 环境中运行或使用不依赖 PyTorch 的嵌入/LLM 模型(例如 llama.cpp 或 API 服务)时,可以按如下方式与 txtai 一起安装仅 CPU 的 PyTorch 包。

pip install txtai torch==[version]+cpu \
-f https://download.pytorch.org/whl/torch

其中 [version] 是 PyTorch 的版本(例如 2.4.1)。Docker Hub 上的 txtai-cpu 镜像使用此方法来减小镜像大小。

从源代码安装

还可以直接从 GitHub 安装 txtai 以获取最新的未发布功能。

pip install git+https://github.com/neuml/txtai

可以通过在上述 URL 的末尾添加 #egg=txtai[<name-of-extra>] 来从 GitHub 安装额外项。

Conda

可通过 conda-forge 获得由社区支持的 txtai 包

conda install -c conda-forge txtai

使用容器运行

txtai 提供 Docker 镜像。请参阅本节,了解有关基于容器安装的更多信息。