ixp
latest
false
UiPath logo, featuring letters U and I in white

Communications Mining 用户指南

上次更新日期 2025年10月7日

验证的工作原理

注意:您必须以 Automation Cloud 用户的身份分配“源 - 读取”“数据集 - 读取”权限,或者以旧版用户身份分配“查看源”“查看标签”权限。

验证中,平台会评估与数据集关联的标签和常规字段模型的性能。

具体来说,对于标签模型,它会通过测试许多不同的性能因素来计算模型的整体评分,包括:

  • 它使用该数据集中的训练数据子集预测分类中每个标签的能力。
  • 信息丰富的标签预测对整个数据集的覆盖程度。
  • 训练数据的平衡程度(即数据的分配方式及其在多大程度上代表整个数据集)。

评估标签性能

为了评估其对每个标签的预测效果,平台首先将数据集中已审核(即已批注)的消息分为以下几组:
  • 训练数据集的大多数。
  • 少数测试数据集。

在下图中,彩色点表示数据集中已批注的消息。此拆分由将消息添加到数据集时的消息 ID 确定,并在数据集的整个生命周期中保持一致。



然后,平台仅使用该训练集作为训练数据来训练自身。

然后,该系统会基于此训练尝试预测应将哪些标签应用于测试集中的消息,并根据人类用户应用的实际标签评估精度和召回率结果。

除此之外,平台还会考虑标签的分配方式,即在应用标签时使用的训练模式,以了解是否以有偏差或平衡的方式添加了批注。

然后,验证过程会发布有关最新模型版本标签性能的实时统计信息,但您也可以查看先前固定的模型版本的历史性能统计信息。

评估覆盖范围

为了解模型覆盖数据的效果,平台会查看数据集中的所有未审核数据,以及平台对每条未审核消息做出的预测。

然后,它会评估总消息中至少预测有一个信息标签的比例。

信息丰富的标签是平台通过查看与其他标签一起分配的频率认为独立后有用的标签。始终分配有另一个标签的标签。例如,计算分数时,从未单独分配的父标签或始终与其他标签一起分配的“紧急”标签的权重会降低。

评估余额

当平台评估模型的平衡能力时,它本质上是在寻找可能导致训练数据和整个数据集之间不平衡的批注偏差。

为此,它使用批注偏差模型来比较已审核的数据和未审核的数据,以确保已批注的数据能够代表整个数据集。如果数据不具有代表性,则模型性能衡量指标可能会具有误导性,并且可能不可靠。

批注偏差通常是用于分配标签的训练模式不平衡的结果,尤其是在使用过多“文本搜索”且“随机播放”不足的情况下。

“重新平衡”训练模式会显示已审核集中代表性不足的消息。在此模式下批注示例将有助于快速解决数据集中的任何不平衡问题。

何时进行验证

每次在数据集中完成训练时,模型都会更新并针对每条消息提供新的预测。 同时,它还会重新评估模型的性能。 这意味着,在新的预测准备就绪时,还应提供新的验证统计信息(尽管一个流程有时可能比另一个流程花费的时间更长),包括最新的 .

注意:默认情况下,平台会显示已计算的最新验证统计信息,并会在新的统计信息尚未完成计算时告知您。

  • 评估标签性能
  • 评估覆盖范围
  • 评估余额
  • 何时进行验证

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo
信任与安全
© 2005-2025 UiPath。保留所有权利。