Document Understanding 活动

上次更新日期 2026年5月19日

生成式分类器 - 良好做法

生成式分类器允许您使用生成模型对文档进行分类。您可以在此页面中找到有关如何使用生成式分类器充分利用工作流的提示和技巧。

对大量文档进行分类

假设您有大量合同，需要将其归入不同类别。要使用生成式分类器优化此流程，请遵循本页中列出的良好做法。

优化输入提示

为了优化您的输入提示，请提供尽可能多的上下文。提供每种文档类型的详细说明。例如，对发票进行分类时可以考虑以下文本： “发票是卖方向买方签发的文件，其中详细说明了所提供的产品或服务、数量和价格。它包括卖方和买方的详细信息、发票编号、日期、到期总金额和付款条件。发票用于在业务事务中请求付款和保存记录”

为了使生成式模型有效运行，有必要提供广泛的上下文，而不是提供简短而模糊的文档式描述，这可能会导致明显的错误。

优化工作流

要优化工作流，请首先创建一个文件夹来移动已分类的文件，以避免冗余分类。

在自动化较大的数据集之前，请创建一个示例文档集。此示例集应包括已损坏且受密码保护的 PDF，以测试工作流。作为一种正确做法，请在工作流中加入“Try Catch异常处理”活动，以防止由于 PDF 文件损坏或受密码保护而可能发生的故障。准备“Try Catch 异常处理”活动后，即可在样本集上测试工作流，以确保其有效性。

在工作流中，缓存数字化结果（文档文本和文档对象模型）可在对同一个文件进行多次测试时节省时间。

在此页面上

对大量文档进行分类
优化输入提示
优化工作流

此页面有帮助吗？

前一个生成式提取程序 - 良好做法

下一个发行说明

Document Understanding 活动

对大量文档进行分类​

优化输入提示​

优化工作流​

此页面有帮助吗？

对大量文档进行分类

优化输入提示

优化工作流