ixp
latest
false

Communications Mining 用户指南
上次更新日期 2025年8月11日
使用随机播放进行训练
link注意:您必须以 Automation Cloud 用户的身份分配“来源 - 读取和数据集 - 审核”权限,或者以旧版用户的身份分配“查看源”和“审核和标记”权限。
随机播放是“探索”阶段的第一步,其目的是为用户提供随机选择的消息,以供他们查看。在随机播放模式下,平台将显示具有涵盖所有标签的预测的消息,以及没有涵盖所有标签的预测的消息,因此“随机播放”步骤与“探索”中的其他步骤不同,因为它不专注于要训练的特定标签,而是涵盖所有标签。
在 Shuffle 模式下训练的重要性
link使用随机播放模式非常重要,以确保为模型提供足够的训练示例,这些示例能够代表整个数据集,并且不会因仅关注数据的非常特定区域而产生偏差。
总体而言,您在数据集中完成的训练中至少有 10% 应在随机播放模式下完成。
在随机播放模式下批注本质上有助于确保分类很好地覆盖数据集中的数据,并会阻止您创建的模型无法非常准确地仅对数据集中的一小部分数据进行预测。
因此,在随机播放模式下查看消息是了解整个模型运行情况的简单方法,并且可以在整个训练过程中作为参考。在训练良好的分类中,您应该能够浏览Shuffle上任何未审核的消息,并仅接受预测以进一步训练模型。如果您发现很多预测不正确,您可以查看哪些标签需要更多训练。
稍后在训练过程中遍历Shuffle上的多个页面也是一个好方法,可以检查分类法是否本应捕获而未捕获意图或概念。然后,您可以在需要时添加现有标签,或在需要时创建新标签。
关键步骤
link- 从下拉菜单中选择随机播放,以显示 20 条随机消息。
- 筛选未审核的消息。
- 审核每条消息以及任何相关的预测:
- 如果存在预测,您应该确认或拒绝这些预测。通过选择适用的选项进行确认。
- 您还应该添加所有其他适用的附加标签。
- 如果您拒绝预测,则应应用所有正确的标签。确保没有在未应用标签的情况下离开消息。
- 您还可以单击“刷新”按钮以获取一组新的消息,或者选择页码或箭头以继续前往下一页。
建议您在随机播放中至少注释至少 10 页的消息。在包含许多训练示例的大型数据集中,这个数字可能更多。
注意:您应该以在随机播放模式下完成所有训练的大约 10% 或更多为目标。