activities
latest
false
- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- FieldValueDetails Class
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- 基本数据点类 - 预览
- 提取结果处理程序类 - 预览
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- 发行说明
- 关于“智能 OCR”活动包
- 项目兼容性
- 加载分类
- 将文档数字化
- 分类文档作用域
- 基于关键词的分类器
- Document Understanding 项目分类器
- 智能关键词分类器
- 创建文档分类操作
- 创建文档验证工件
- 检索文档验证工件
- 等待文档分类操作然后继续
- 训练分类器范围
- 基于关键词的分类训练器
- 智能关键词分类训练器
- 数据提取作用域
- Document Understanding 项目提取程序
- Document Understanding 项目提取程序训练器
- 基于正则表达式的提取程序
- 表单提取程序
- 智能表单提取程序
- 文档脱敏
- 创建文档验证操作
- 等待文档验证操作然后继续
- 训练提取程序范围
- 导出提取结果
- 机器学习提取程序
- 机器学习提取程序训练器
- 机器学习分类器
- 机器学习分类训练器
- 生成分类器
- 生成式提取程序
- 配置身份验证
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式
重要 :
请注意,此内容已使用机器翻译进行了部分本地化。
新发布内容的本地化可能需要 1-2 周的时间才能完成。

Document Understanding 活动
上次更新日期 2026年4月27日
文档脱敏
UiPath.IntelligentOCR.Activities.Redaction.RedactDocument
描述
“文档脱敏”活动根据原始输入 PDF(以 “文档路径”形式提供)、“提取结果”和“要脱敏的单词”输入字段生成脱敏的 PDF。
“文档脱敏”活动使用文档对象模型来访问 PDF 中标识的所有单词的位置,而“提取结果”和“要脱敏的单词”字段则用作应脱敏数据的输入,如下所示:
- 为了密文目的, “要脱敏的单词”输入数组中的每个条目都被视为一个字符串,用于不区分大小写的连续搜索。
- 系统将根据此参考值(包括作为值参考的客户区域选择)对具有引用的提取结果值进行脱敏。常规字段和表格单元格均已脱敏。
- 缺少引用(添加时未引用对“需要引用”设置为“False”的字段)的提取结果值的视为与“要脱敏的单词”字段中的条目类似。这意味着在输入文档中找到该特定文本的所有出现都将被脱敏。
该活动使用文档对象模型搜索词,并且模糊匹配不可用。
为了处理高度敏感的文档,我们强烈建议对提取结果执行人工验证,并使用基于引用的值和选择。这可确保全面审核需要密文的所有数据,从而最大程度地减少出现 OCR 错误或词序问题影响最终密文输出的机会。
项目兼容性
Windows - Legacy | Windows
配置
设计器面板
输入
- 文档路径(公开预览):要脱敏的文档的路径。
- 文档对象模型 (已记录)从“数字化文档”活动获得的输入的文档对象模型。
- 提取结果(可选):数据提取流程的提取结果,存储在
ExtractionResult变量中。您可以从“数据提取作用域”活动中检索此内容。 - 要脱敏的单词(可选):除了来自“提取结果”输入字段的数据之外,还要脱敏的字符串列表。
- 输出文件:要保存脱敏 PDF 的输出文件路径。
属性面板
常见
- “显示名称” :活动的显示名称。
输入
- 文档路径(公开预览):要脱敏的文档的路径。
- 文档对象模型 (已记录)从“数字化文档”活动获得的输入的文档对象模型。
- 提取结果(可选):数据提取流程的提取结果,存储在
ExtractionResult变量中。您可以从“数据提取作用域”活动中检索此内容。 - 要脱敏的单词(可选):除了来自“提取结果”输入字段的数据之外,还要脱敏的字符串列表。
- 输出文件:要保存脱敏 PDF 的输出文件路径。
其他
- “私有 ” :选中后将不再以“Verbose”级别记录变量和参数的值。
输出
- 输出文件(字符串) :包含已编辑信息的输出文件。
脱敏设置
- 边框颜色(可选) :用于脱敏的边框颜色。
- 边框粗细:用于脱敏的边框粗细。
- Dpi(可选) :表示嵌入在脱敏 PDF 中的图像质量的每英寸点数值。
- “填充颜色” :用于脱敏的填充颜色。