ixp
latest
false

Communications Mining 用户指南
上次更新日期 2025年8月11日
验证
link“验证”页面会向用户显示有关其模型性能的详细信息,包括标签和常规字段。
在“标签”选项卡中,用户可以查看其整体标签模型 评分,包括构成其评分的因素的详细细分,以及其数据集的其他指标和单个标签的性能。
在“通用字段”选项卡中,用户可以查看数据集中启用的所有通用字段的通用字段预测性能的统计信息。
您可通过模型版本下拉菜单查看过去模型版本在给定数据集上的所有验证分数。您还可以确定单个事件的优先级或星标,以便它们将来显示在列表顶部。此工具可用于在构建模型时跟踪和比较进度。
标签
link“因素”选项卡显示:
- 影响模型评分的四个关键因素:平衡性、覆盖率、平均标签性能和表现最差标签的性能。
- 对于每个因素,它提供了一个分数以及因素分数贡献者的细分。
- 推荐的次最佳操作可选,以提高每个因素的分数。
“指标”选项卡显示:
- 训练集大小 – 用于训练模型的消息数。
- 测试集大小 – 用于评估模型的消息数量。
- 标签数 – 分类中的标签总数。
- 召回率平均精度– 该图表显示所有标签在给定召回率下的平均精度。
- 平均精度– 显示所有标签平均精度的统计信息。
- 一个图表,显示所有标签中每个标签的平均精度与训练集大小的关系。
“验证”页面还允许用户从其分类中选择单个标签,以深入了解其性能。
选择标签后,用户可以查看该标签的平均精度,以及基于给定置信度阈值(用户可自行调整的置信度阈值)的该标签的精度与召回率。
有关标签验证的实际工作原理及使用方法的更多详细信息,请查看验证的工作原理。
通用字段
link“通用字段”选项卡显示:
- 训练集中的通用字段数– 用于训练验证模型的已注释通用字段数量。
- 测试集中通用字段的数量– 用于评估验证模型的带注释通用字段的数量。
- “训练集中的消息数量” – 训练集中已批注通用字段的消息数量。
- 测试集中的消息数量– 测试集中具有批注通用字段的消息数量
- 平均精度- 所有通用字段的平均精度分数。
- 平均召回率- 所有通用字段的平均召回率分数。
- 平均 F1 分数- 所有通用字段的平均 F1 分数(其中 F1 分数是精度和召回率的调和平均值),对它们进行相等权重。
- 相同的统计信息,但针对每个单独的通用字段。
有关通用字段验证的工作原理和使用方法的更多详细信息,请参阅使用通用字段。