
Communications Mining 用户指南
“探索”页面允许您搜索、查看和筛选数据集,以检查和审核各个消息和通用字段。从导航栏中选择“探索”选项卡以导航页面:
默认情况下, “探索”会以“最近”模式显示数据集中的 20 条最新消息。您可以选择下拉模式选取器来更改此设置。
您可以从下拉菜单中选择的不同选项包括:
- 最近– 查看 20 条最近的消息。
- 随机播放– 随机查看 20 条消息。
- 指导– 显示平台不确定如何标注的 20 条消息。
- 低置信度– 显示 20 条未全部包含在信息丰富的标签预测中的消息。
- 再平衡– 显示数据集中训练数据不足的 20 条消息。
- 标签– 查看 20 个已分配或预测已选择所选标签的消息,这是选择标签时的默认模式。
- 检查标签– 查看可能未正确应用所选标签的 20 条消息。
- 缺少的标签– 查看可能缺少所选标签的 20 个消息。
在页面底部,您可以选择移至下一页,共 20 条消息,或返回上一页。
本节介绍 Communications Mining™ 中的筛选器及其应用方法。
“筛选器”栏用于查找特定的消息组,您可以在其中进行筛选:
- 特定日期范围,用于选择确切的日期,或从过去一周、过去一个月、过去 90 天或过去一年等选项中进行选择。
- 已审核或未审核的消息。
- 具有正面或负面情感预测的消息(如果在数据集上启用了情感)。
- 具有预测或分配的特定通用字段的消息。
- 包含或不包含特定标签或预测标签组合的消息。有关更多详细信息,请查看高级预测筛选器。
此外,您可以通过选择“添加新筛选条件”,根据与消息关联的元数据属性添加任何筛选器。
当您选择“添加新筛选器”时,下拉菜单将显示所有可用属性筛选器的完整列表。
这些内容按类别自然分组,有些是数据集中的通信类型所特有的,例如电子邮件。
将属性分组到一起的属性类别包括:
- 来源- 仅在数据集中有多个来源时显示。
- “电子邮件” - 这些特定于单个电子邮件,例如电子邮件的发件人。
- 会话- 这些是特定于电子邮件的,并且与电子邮件会话的特征相关。
- 附件- 特定于消息,主要是电子邮件,具有特定附件属性。
- 用户- 上传的但平台未派生的所有其他元数据属性,与每条消息相关。
图标指示每个属性的属性类型,无论是数字还是字符串。对于字符串用户属性,平台会在您悬停时提供示例值。
为具有字符串格式的元数据字段添加筛选器时,您可以选择要在选择中包含或排除的筛选器,如下图所示:
如果您为具有数字格式的元数据字段添加筛选器,则可以选择最小值或最大值,以创建所选范围,如下图所示:
您可以使用标签筛选器栏来筛选包含或排除特定预测标签的消息。您可以在模型训练期间,也可以在探索和解释数据时执行此操作。有关更多详细信息,请查看高级预测筛选器。
您可以使用“标签”部分中的以下按钮,在显示所有消息、已分配标签的消息或具有预测(未审核)的消息之间进行筛选。图标如下所示,在选中时会改变颜色:
选择已分配标签的消息。 | |
选择具有预测标签的消息。 |
要取消选择筛选器,请再次选择该按钮。
如果您未选择其中任何按钮,但筛选到某个标签,则平台将筛选已固定或预测的所有消息,首先从已审核的消息开始筛选。
“标签”筛选条件栏和 “ +”添加标签筛选条件可用于添加包含和排除筛选条件的复杂组合,例如,显示包含预测 X 和 Y,但不包含 Z 的消息。有关如何使用这些筛选器的更多详细信息,请查看高级预测筛选器。
红色拨号盘训练指示器
- 红色的拨号盘训练指示器会为某些标签显示,并突出显示需要更多训练示例才能让平台准确评估标签性能的标签。如需更多详细信息,请查看审核消息。
- 圆圈的完整性表示还需要多少示例。红色部分越大,需要的示例就越多。
- 一旦您拥有 25 个已批注示例,红色圆圈就会消失,具体取决于标签的复杂性。但是,您可能需要更多示例才能获得准确的预测。
- 您应该查看消息以查找更多训练示例。