Communications Mining 用户指南

上次更新日期 2025年11月10日

数据集状态

每次应用标签或查看数据集中的通用字段时，您的模型都将重新训练，并创建新的模型版本。要了解有关使用不同模型版本的更多信息，请查看固定和标记模型版本。

当模型重新训练时，它会获取获得的最新信息，并重新计算数据集中的所有预测。当您开始训练时，此流程便开始了，通常当 Communications Mining™ 完成对一个模型版本的预测应用时，它已经在重新计算较新模型版本的预测。当您在一段时间后停止训练时，Communications Mining 将很快赶上并应用反映数据集中已完成的最新训练的预测。

此过程可能需要一些时间，具体取决于已完成的训练量、数据集的大小以及分类中的标签数量。 Communications Mining 具有实用的状态功能，可帮助用户了解其模型何时是最新版本，或者模型是否正在重新训练以及预计需要多长时间。

当您位于数据集时，以下图标之一会指示其当前状态：

	数据集是最新的，并且已应用最新模型版本中的预测。
	模型正在重新训练，预测可能不是最新的。

要查看有关数据集状态的更多详细信息，请将鼠标悬停在图标上：

注意：有时，您可能会注意到 Communications Mining™ 处于重新训练过程中，即使您未应用任何标签或审核任何通用字段。这可能是因为 UiPath™ 对平台和模型部署的改进可能需要重新训练。任何依赖特定模型版本号的自动化都不会受到影响。

对模型训练速度慢进行故障排除

模型训练速度慢

请务必区分以下经常混淆的不同流程：

模型训练- 此流程涉及重新训练当前模型版本以创建新模型版本，并纳入任何最近更改（例如分类更新或数据注释）。模型训练的速度通常很快，但持续时间可能会因多个因素而异。
应用预测- 此流程在模型训练后发生，此时平台会从经过训练的模型版本检索预测并将其应用于每条消息。应用预测通常比较慢，并且持续时间主要受数据集的大小和复杂性影响。

有几个因素可能会导致数据集的特定模型版本训练或应用预测所需的时间长于预期：

标签和字段分类的复杂性
影响：数据集中的标签和字段越多，训练模型和在消息中应用预测所需的时间就越长。
使用生成式提取
影响：生成式提取需要理解标签和字段之间的复杂关系，从而需要更大、更强大的模型，而这可能会减慢训练速度。
数据集的大小（已批注的数据和未批注的数据）
影响：大量带批注的消息会增加模型在训练期间必须考虑的数据点，从而延长流程。同样，大量未批注的消息也会延长应用预测所需的时间。

注意:预测可用后会立即显示，因此您无需等待预测完成应用即可添加注释。如果平台在上一个版本的预测完成之前进行训练，则平台将切换为应用最新经过训练的模型版本中的预测。
同时训练的数据集数量
影响：如果多个模型在您的 Communications Mining™ 环境中同时训练，当平台负载平衡所需服务时，这可能会导致暂时变慢。
何时联系支持团队
- 训练- 如果上述原因都无法解释训练变慢，且训练已持续超过 4 小时，请联系 UiPath™ 产品支持团队（团队成员）。
- 应用预测- 对于大型复杂的数据集，应用预测预计需要很长时间。仅当针对单个模型版本的此流程已持续超过 24 小时时，才联系产品支持团队。
注意：这不应阻止数据注释，因为您始终会从推出的新预测中受益。