ixp
latest
false

Communications Mining 用户指南
上次更新日期 2025年10月20日
本节概述了平台的核心概念。
要从最终用户的角度了解有关该平台的更多信息,请查看Communications Mining™ 用户指南。
| 概念 | 描述 | 示例 |
|---|---|---|
| 来源 | 在 Communications Mining™ 中,数据按数据源进行组织。通常情况下,一个来源对应于一个渠道。电子邮件邮箱、调查结果或一组客户评论都是可以作为数据源上传到 Communications Mining 的数据示例。可以组合多个来源来构建模型,因此最好选择多个来源,而不是单个整体来源。 | 该图表显示了电子邮件数据(包含单个电子邮件的来源 A)和客户评论数据(包含单个客户评论的来源 B 和 C)。 根据数据来源,客户评论数据分为两个来源,但会合并为一个数据集,以构建通用模型。 |
| 注释 | 在来源中,每段单独的文本通信都表示为注释。注释始终具有 ID、时间戳和文本正文,以及基于其所表示的数据类型的其他字段。例如,电子邮件将具有预期的电子邮件字段,例如发件人、收件人、抄送等。 | The diagram shows how the available comment fields are used by the various comment types. For example, in an email comment the From field contains the sender address, while in a customer review comment it contains the review author. The metadata fields, shown at the bottom of each comment, are user-defined. Note how we use the same set of fields for both customer review sources: since we want to combine them into a single dataset, the data should be consistent in order to ensure good model performance. |
| 数据集 | 数据集允许您批注一个或多个来源,以便构建模型。一个来源可以包含在多个数据集中。数据集中所有标签的集合称为分类。 | 该图表显示了基于支持邮箱数据构建的两个数据集,以及一个结合了客户评论数据的数据集。请注意,即使数据集 1 和数据集 2 基于相同的数据,其标签分类也不同,因为它们的用例(即分析和自动化)需要不同的标签集。 |
| 模型 | 随着用户注释更多数据,模型会不断更新。 为了获得一致的预测,需要在查询模型时指定模型版本号。 | |
| 标签 | 标签在训练模型时应用,并在查询模型进行预测时返回。当标签作为预测返回时,它们具有关联的置信度分数,用于指示模型认为预测适用的可能性。要将预测转换为“是”或“否”答案,需要根据阈值检查置信度分数,选择阈值以表示合适的精度/召回率。 | 标签由 Communications Mining 用户在训练模型时分配。Communications Mining 用户界面可帮助用户注释最相关的注释,确保以一致的方式应用标签,并注释足够的注释,以生成性能良好的模型。 |