导出任务
导出任务将任务输出导出到 CSV 或 Excel。
示例
以下是使用此任务作为工作流一部分的简单示例。
from txtai.workflow import FileTask, Workflow
workflow = Workflow([ExportTask()])
workflow(["Input 1", "Input2"])
配置驱动的示例
此任务也可以通过工作流配置创建。
workflow:
tasks:
- task: export
方法
该任务的 Python 文档。
__init__(action=None, select=None, unpack=True, column=None, merge='hstack', initialize=None, finalize=None, concurrency=None, onetomany=True, **kwargs)
创建一个新任务。任务定义了两种方法,即它接受的数据类型以及对每个数据元素执行的操作。操作可以是可调用函数或可调用函数的列表。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
action
|
对每个数据元素执行的操作 |
None
|
|
select
|
用于选择要处理的数据的过滤器 |
None
|
|
unpack
|
数据元素是否应从 (id, data, tag) 元组中解包 |
True
|
|
column
|
如果元素是元组,要选择的列索引,默认为全部 |
None
|
|
merge
|
合并多操作输出的模式,默认为 hstack |
'hstack'
|
|
initialize
|
处理前执行的操作 |
None
|
|
finalize
|
处理后执行的操作 |
None
|
|
concurrency
|
当执行实例可用时设置并发方法 有效值:"thread" 表示基于线程的并发,"process" 表示基于进程的并发 |
None
|
|
onetomany
|
是否启用一对多数据转换,默认为 True |
True
|
|
kwargs
|
附加关键字参数 |
{}
|
源代码位于 txtai/workflow/task/base.py
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 |
|
register(output=None, timestamp=None)
向任务添加导出参数。检查是否安装了所需的依赖项。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
output
|
输出文件路径 |
None
|
|
timestamp
|
如果输出文件应带有时间戳,则为 true |
None
|
源代码位于 txtai/workflow/task/export.py
24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 |
|