- 简介
- 访问控制和管理
- 管理来源和数据集
- 模型训练和维护
- 生成式提取
- 使用分析和监控
- Automation and Communications Mining™
- 开发者
- 许可
- 常见问题及解答

Communications Mining 用户指南
指导是“探索”阶段的第二个步骤,其目的是显示模型最混淆的标签的预测(无论是否适用)。与之前的步骤一样,我们需要确认预测是否正确,并借此为模型提供强训练信号。它是最重要的特定于标签的训练模式。
“学习标签”是一种专门用于批注未审核消息的训练模式。因此,所审核的筛选器在此模式下处于禁用状态。
- 从下拉菜单中选择“学习标签” ,如下图所示。
- 选择要训练的标签,指导模式下的默认选择是显示未审核的消息。
- 系统将向您显示一系列消息,其中模型对于是否应用所选标签最感到困惑。这意味着您应该查看预测,如果正确则应用标签,如果不正确则应用其他标签。
备注:
- 预测范围将扩大,从对于没有情感的数据(启用了情感),预测的结果是大约 50%(对于启用了情感的数据),到 66%(对于启用了情感的数据)。
- 确保应用所有其他适用的标签以及您关注的特定标签。
您应根据需要使用此训练模式,将每个标签的训练示例数量增加到 25 个以上,以便平台能够准确地估计标签的性能。
每个标签表现良好所需的示例数量取决于许多因素。在“优化”阶段,我们将介绍如何理解和提高每个标签的性能。
平台会定期建议使用学习标签来提高特定标签的性能,方法是提供更加多样化的训练示例,平台可以使用训练示例来识别数据集中应应用标签的其他实例。
您可能会发现在“发现”和“随机播放”之后,某些标签的示例仍然非常少,并且“学习标签”模式不会显示有用的训练示例。在此情况下,建议您使用以下训练模式,以便为平台提供更多可供学习的示例:
在“探索”中搜索术语或短语的方式与在“发现”中搜索术语或短语的方式相同。两个主要区别之一是,在“探索”中,您必须单独查看和添加搜索结果注释,而不是批量查看和添加搜索结果。您只需在页面左上方的搜索框中输入搜索词,即可在“探索”中进行搜索。
但是,过多的搜索可能会使您的模型产生偏差,这是我们希望避免的情况。在此训练模式下,每个标签添加的示例不超过 10 个,以避免批注偏差。此外,在返回指导模式之前,请确保平台有时间进行重新训练。
有关更多详细信息,请查看“探索”选项卡中的 “使用搜索进行训练” 。
选项 2 - 标签
尽管使用标签进行训练不是“探索”阶段中列出的主要步骤之一,但它在此训练阶段仍然非常有用。在“标签模式”下,平台会按置信度降序显示预测为标签的消息,即置信度最高的预测在前,置信度最低的预测在后。
但是,它仅适用于审核置信度不高(高于 90%)的预测。这是因为当模型的置信度非常高(即高于 90%)时,确认预测并不会告知模型任何新信息,则表示标签已经应用。如有需要,请在页面下方查找置信度较低的示例。不过,如果预测的置信度很高并且是错误的,则请确保应用正确的标签,从而拒绝错误的预测。