ixp
latest
false

Communications Mining 用户指南
上次更新日期 2025年10月7日
在设计分类之前,您需要了解应捕获哪些标签、通用字段和元数据才能实现您的目标。由于它们相辅相成,因此应尽量减少重叠。
标签体现概念、主题和意图。例如,地址变更请求、紧急、状态更新请求等。您不应使用标签来捕获元数据中存在的信息。
通用字段捕获从文本中提取的结构化数据点。例如,保单编号、交易 ID、URL、日期、货币数量等。
元数据提供与每条消息关联的附加结构化信息。元数据属性可以是:
- 用户属性- 定义并添加了预上传,例如 NPS 分数。
- 电子邮件属性- 从电子邮件中捕获,例如发件人、收件人、域等。
- 会话属性- 平台自动为会话数据(例如电子邮件和聊天)派生会话属性。例如,会话中的消息数量、会话持续时间等。
本节列出了标签和通用字段之间的主要区别和相似之处。两者通常组合使用以实现自动化,但单独使用时,它们有不同的用途:
标签
- 捕获意图、主题和概念。
- 将各种表达式规范化为一个结构化数据点,例如,确定概念是否适用。
- 在消息级别分配。
- 从所有通信文本以及某些元数据属性中学习。
- 采用层次结构,以添加专属级别。
通用字段
- 捕获从文本中提取的特定类型的特定值,例如日期。
- 可以完全基于规则,并且遵循非常特定的格式。
- 某些类型可以从各种表达式规范化为结构化格式。
- Communications Mining™ 从通用字段的值、段落所在段落的上下文以及周围的文本中学习。
- 在段落级别分配。
标签和通用字段通用
- 您可以预训练它们,也可以从头开始训练它们。
- 预训练标签和通用字段会在启用后立即被预测,并且平台会自动重新训练。
- 您可以接受和拒绝标签和通用字段预测,并在未预测时对其进行分配。
- 您可以将两者用于分析和自动化用例。
该平台根据消息文本以及一些元数据属性进行标签预测。例如,对于电子邮件,此字段指电子邮件的主题和正文。对于通用字段,它会从分配的文本范围以及该范围的文本上下文中学习。
如下图所示:
- 主题行
- 文本正文- 对于会话数据,Communications Mining™ 仅根据最新的电子邮件进行预测,而不是根据会话 ID 将它们链接到的完整会话进行预测。
- 一些元数据- Communications Mining 从一些可以识别主题的属性中学习,例如发件人域或收件人域、NPS 分数等。它不会学习电子邮件的特定发件人和收件人,即完整的电子邮件地址以及 ID 等唯一属性。