常见问题
以下是常见问题解答和遇到的常见问题列表。
问题
问题
推荐哪些模型?
回答
请参阅模型指南。
问题
跟踪 embeddings.index
调用的进度的最佳方法是什么?
回答
使用 tqdm 包装传递给索引调用的列表或生成器。有关更多信息,请参阅#478。
问题
分析和调试 txtai 进程的最佳方法是什么?
回答
有关如何在 txtai 进程中启用此功能,请参阅可观测性部分。
txtai 还有一个控制台应用程序。这篇文章有更多详细信息。
问题
如何外部加载模型并将其传递给嵌入和流水线?
回答
嵌入示例。
from transformers import AutoModel, AutoTokenizer
from txtai import Embeddings
# Load model externally
model = AutoModel.from_pretrained("sentence-transformers/all-MiniLM-L6-v2")
tokenizer = AutoTokenizer.from_pretrained("sentence-transformers/all-MiniLM-L6-v2")
# Pass to embeddings instance
embeddings = Embeddings(path=model, tokenizer=tokenizer)
LLM 流水线示例。
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
from txtai import LLM
# Load Phi 3.5-mini
path = "microsoft/Phi-3.5-mini-instruct"
model = AutoModelForCausalLM.from_pretrained(
path,
torch_dtype=torch.bfloat16,
)
tokenizer = AutoTokenizer.from_pretrained(path)
llm = LLM((model, tokenizer))
常见问题
问题
嵌入查询错误如下
SQLError: no such function: json_extract
解决方案
升级 Python 版本,因为它不支持 SQLite 的 json_extract
问题
macOS 上的分段故障和类似错误
解决方案
设置以下环境变量。
- OpenMP 多线程在 macOS 平台上内部处理,但可以通过
export OMP_NUM_THREADS=1
禁用 - 通过
export PYTORCH_MPS_DISABLE=1
禁用 PyTorch MPS 设备 - 通过
export LLAMA_NO_METAL=1
禁用 llama.cpp metal
有关更多详细信息,请参阅 GitHub 上的这个问题。
问题
在 macOS 上运行 SQLite ANN 时出错
AttributeError: 'sqlite3.Connection' object has no attribute 'enable_load_extension'
解决方案
有关如何修复此问题的选项,请参阅此说明。
问题
在 Google Colab 上运行其中一个示例 notebook 时出现 ContextualVersionConflict
和/或 package METADATA 异常
解决方案
重启内核。有关此问题的更多信息,请参阅问题#409。
问题
安装可选/额外依赖项时出错,例如 pipeline
解决方案
默认的 MacOS shell (zsh) 和 Windows PowerShell 需要转义方括号
pip install 'txtai[pipeline]'