ixp
latest
false
UiPath logo, featuring letters U and I in white

Communications Mining 用户指南

上次更新日期 2025年10月20日

核心概念

本节概述了平台的核心概念。

要从最终用户的角度了解有关该平台的更多信息,请查看Communications Mining™ 用户指南


概念描述示例
来源在 Communications Mining™ 中,数据按数据源进行组织。通常情况下,一个来源对应于一个渠道。电子邮件邮箱、调查结果或一组客户评论都是可以作为数据源上传到 Communications Mining 的数据示例。可以组合多个来源来构建模型,因此最好选择多个来源,而不是单个整体来源。 该图表显示了电子邮件数据(包含单个电子邮件的来源 A)和客户评论数据(包含单个客户评论的来源 B 和 C)。 根据数据来源,客户评论数据分为两个来源,但会合并为一个数据集,以构建通用模型。
注释在来源中,每段单独的文本通信都表示为注释。注释始终具有 ID、时间戳和文本正文,以及基于其所表示的数据类型的其他字段。例如,电子邮件将具有预期的电子邮件字段,例如发件人、收件人、抄送等。 The diagram shows how the available comment fields are used by the various comment types. For example, in an email comment the From field contains the sender address, while in a customer review comment it contains the review author. The metadata fields, shown at the bottom of each comment, are user-defined. Note how we use the same set of fields for both customer review sources: since we want to combine them into a single dataset, the data should be consistent in order to ensure good model performance.
数据集数据集允许您批注一个或多个来源,以便构建模型。一个来源可以包含在多个数据集中。数据集中所有标签的集合称为分类。 该图表显示了基于支持邮箱数据构建的两个数据集,以及一个结合了客户评论数据的数据集。请注意,即使数据集 1 和数据集 2 基于相同的数据,其标签分类也不同,因为它们的用例(即分析和自动化)需要不同的标签集。
模型随着用户注释更多数据,模型会不断更新。 为了获得一致的预测,需要在查询模型时指定模型版本号。  
标签标签在训练模型时应用,并在查询模型进行预测时返回。当标签作为预测返回时,它们具有关联的置信度分数,用于指示模型认为预测适用的可能性。要将预测转换为“是”或“否”答案,需要根据阈值检查置信度分数,选择阈值以表示合适的精度/召回率。 标签由 Communications Mining 用户在训练模型时分配。Communications Mining 用户界面可帮助用户注释最相关的注释,确保以一致的方式应用标签,并注释足够的注释,以生成性能良好的模型。

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo
信任与安全
© 2005-2025 UiPath。保留所有权利。