- 概述
- Document Understanding 流程
- 快速入门教程
- 框架组件
- ML 包
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 4506T - ML 包
- 990 - ML 包 - 预览
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 护照 - ML 包
- 工资单 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 硬件要求
- 管道
- Document Manager
- OCR 服务
- 深度学习
- 部署在 Automation Suite 中的 Document Understanding
- 在 AI Center 独立版中部署的 Document Understanding
- 许可
- 活动
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Document Understanding 用户指南
在 GPU 上运行 Document UnderstandingTM ML 包的过程包含一项旨在加速训练流程的优化。
因此,在 GPU 上训练的速度比在 CPU 上训练快 5 倍(以前是 10 到 20 倍)。这也使在 CPU 上训练多达 5000 页(以前最多为 500 页)的模型成为可能。
请注意,在 GPU 上训练 Document Understanding 模型时,GPU 至少需要具有 11GB 的视频 RAM 才能成功运行。
使用下表检查 ML 包、CUDA 版本和 GPU 驱动程序版本之间的兼容性。
|
ML 包版本 |
CUDA 版本 |
cudDNN 版本 |
NVIDIA 驱动程序(最低兼容版本) |
硬件生成 |
|---|---|---|---|---|
|
2023.10 |
CUDA 11.8 or latest |
cuDNN 8.2.0 或最新版本 |
R450.80.04 |
Ampere, Turing, Volta, Pascal, Maxwell, Kepler |
CUDA 向后兼容,这意味着现有的 CUDA 应用程序可以继续与较新的 CUDA 版本一起使用。
有关兼容性的更多信息,请参见此处。
您可以使用 Document Understanding 框架通过 OCR 引擎读取文本、对文档进行分类以及从文档中提取信息。虽然分类和提取任务在 CPU 上运行,但建议在 GPU 上运行 OCR(尽管在 GPU 不可用的情况下,还提供 CPU 版本)。
The On-premises deployment is done using Automation Suite and its hardware requirements.
您可以对提取程序和分类器使用相同类型的虚拟机,唯一的区别是基础架构大小。我们建议将 OCR 引擎与 GPU 虚拟机一起使用。“兼容新矩阵”部分介绍了 ML 包、CUDA 版本和 GPU 驱动程序版本之间的兼容性。
让我们举一个实际中的例子,以更好地了解硬件要求。
| ML 包 | 硬件要求 | 功能 |
|---|---|---|
| 提取程序包(发票、收据、采购订单等) | 使用至少具有 2 个 CPU 内核和 8 GB RAM 的虚拟机 | 假设流量完全恒定(无峰值),每天可以处理 25,000 页或每年可以处理 500 万页文档。 |
| 分类器包(文档分类器) | 使用至少具有 2 个 CPU 内核和 8 GB RAM 的虚拟机 | 假设流量完全恒定(无峰值),每天可以处理 40,000 个或每年可以处理 800 万个文档。 |
| OCR | 如果在 CPU 上运行,则至少需要 8 GB RAM。如果在 GPU 上运行,则无要求。 | 每天可处理 50,000 页。 |
| OCR_CPU | 至少需要 4 GB RAM。 | 每天可以处理 25,000 个页面。 |
示例:如果您每年处理 1000 万页,则需要一个具有 4 个 CPU 内核、16 GB RAM 的虚拟机用于提取程序,还需要一个用于分类器,还需要一个具有 NVIDIA GPU 内核的虚拟机用于 OCR 引擎。
您还可以选择让提取程序和分类器共同使用一个虚拟机,这意味着您需要一个具有 8 个 CPU 内核和 32 GB RAM 的虚拟机。