activities
latest
false
- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- FieldValueDetails Class
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- 基本数据点类 - 预览
- 提取结果处理程序类 - 预览
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- 发行说明
- 关于“智能 OCR”活动包
- 项目兼容性
- 加载分类
- 将文档数字化
- 分类文档作用域
- 基于关键词的分类器
- Document Understanding 项目分类器
- 智能关键词分类器
- 创建文档分类操作
- 创建文档验证工件
- 检索文档验证工件
- 等待文档分类操作然后继续
- 训练分类器范围
- 基于关键词的分类训练器
- 智能关键词分类训练器
- 数据提取作用域
- Document Understanding 项目提取程序
- Document Understanding 项目提取程序训练器
- 基于正则表达式的提取程序
- 表单提取程序
- 智能表单提取程序
- 文档脱敏
- 创建文档验证操作
- 等待文档验证操作然后继续
- 训练提取程序范围
- 导出提取结果
- 机器学习提取程序
- 机器学习提取程序训练器
- 机器学习分类器
- 机器学习分类训练器
- 生成分类器
- 生成式提取程序
- 配置身份验证
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式
重要 :
请注意,此内容已使用机器翻译进行了部分本地化。
新发布内容的本地化可能需要 1-2 周的时间才能完成。
Document Understanding 活动
上次更新日期 2026年5月19日
UiPath.DocumentUnderstanding.ML.Activities.GenerativeExtractor
描述
允许您使用生成式模型提取文档。
提示:
有关如何使用生成式提示词的良好实践,请查看“生成式提取程序 - 良好实践”页面。
备注:
- 生成式模型支持的语言与所使用的 OCR 引擎相同。有关更多信息,请查看“OCR 支持的语言”页面。
- “生成式提取程序”活动不支持提取分类管理器或表格提取中定义的表格字段。但是,它可以从文档中提取文本。
项目兼容性
Windows - Legacy | Windows
配置
设计器面板
- “管理字段详细信息” - 选择此选项,可打开生成式提取程序提示向导。
属性面板
身份验证
此活动的身份验证属性允许您通过本地部署的机器人执行身份验证。在配置这些属性之前,请确保您已满足页面中提到的先决条件。完成这些步骤后,您可以继续填写活动的“身份验证”属性。
- 运行时凭据资产
- 在机器人连接到本地 Orchestrator 或来自其他租户的情况下需要访问 Document Understanding 生成式提取功能时,请使用此字段。您可以通过以下方式之一选择输入凭据资产以进行身份验证:
-
从下拉列表中,从 UiPath™ Robot 连接到的 Orchestrator 中选择所需的凭据资产。
-
手动输入 Orchestrator 凭据资产的路径,您将在其中存储用于访问生成式功能的外部应用程序凭据。
路径的格式应为:
<OrchestratorFolderName>/<AssetName>。
- 运行时租户 URL - 使用此字段与“运行时凭据资产”字段。输入机器人将为执行生成式提取而连接的租户的 URL。URL 应采用以下格式:
https://<baseURL>/<OrganizationName>/<TenantName>。
常见
- “显示名称”- 活动的显示名称。
其他
- “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
服务器
- RetryOnFailure - Automatically retries the machine learning model execution, to eliminate transient network errors. If checked, the activity retries the execution.
- Timeout (milliseconds) - Specifies the amount of time (in milliseconds) to wait for a response from the server before an error is thrown. The default value is 100000 milliseconds (100 seconds).
使用生成式提取程序向导
“生成式提取程序提示词”向导允许您选择特定的文档类型和字段。您还可以选择可选值以进一步指定相应字段的详细信息。此外,该向导还可为每种文档类型分配不同的生成式提取程序类型,从而允许进行自定义,以适应不同大小和布局的文档。
提示用于标识要提取的字段,以键值对形式提供,其中键表示字段的名称,值表示字段的说明,以帮助提取程序识别相应的值。相同的字段详细信息不能用于同一文档类型中的不同字段。
图 1.生成式提取程序提示
重要提示:
在“生成式提取程序提示”向导中输入的字段描述已合并到生成式模型使用的提示中。
备注:
生成式模型不使用在“配置提取程序”向导输入框中输入的字段描述。
- 从定义的文档类型列表中选择“文档类型”和“字段” 。已在“配置提取程序”向导中完成字段选择,并在生成式提取程序提示向导中定义了提示。
- 或者,您可以为每种文档类型从三种类型的生成提取程序中进行选择。生成式提取程序选项包括:
- 长文档简单布局提取程序
- 长文档复杂布局提取程序
- 短文档复杂布局提取程序
- 添加可选值以定义字段详细信息。这可以是文档类型的简短说明。允许的最大字符数为 1000。