
Communications Mining 用户指南
生成式注释使用 Microsoft Azure OpenAI 端点生成 AI 建议的标签,以加快分类设计和模型训练的早期阶段,并缩短所有 Communications Mining™ 用例的价值实现时间。
生成式注释包括:
- 集群建议- 根据集群识别的主题为集群提供新标签或现有标签的建议。
- 辅助批注- 根据标签名称或说明自动预测标签。
系统会自动对数据集启用生成式注释功能,无需采取进一步的操作。
创建数据集后,系统会在短时间内自动生成集群建议。如果已上传分类(强烈建议这样做),Communications Mining™ 会为集群提供现有标签和新标签的建议。
当您将分类上传到数据集时,这也会自动触发不使用训练数据,仅使用标签名称和说明来训练初始模型。上传分类后,此操作可能需要几分钟。
- 对于“集群建议” ,转到“训练”选项卡,然后选择一个集群批次。或者,转到“发现”选项卡,然后选择“集群模式”以开始标注。
- 对于辅助批注,请转到“训练”选项卡,然后按照建议的操作进行操作。或者,转到“探索”选项卡,然后选择“随机播放”或“学习标签”模式,以开始注释。
每个“集群”页面都将显示集群建议。这可以是为每个集群提供的一个或多个建议标签。
如果您启用了标签情感分析,则“集群建议”将包含积极或消极情感,并可以以绿色或红色高亮显示。
要识别 AI 建议的标签,请查看下图:
模型训练者应审核每个集群建议,并执行以下一项操作:
- 选择它以接受它。
- 如果他们不同意给定的建议,请分配一个新标签。
通过为每个集群自动生成建议标签,集群建议可以显着加快模型训练过程的第一阶段。如果用户难以定义他们要训练的概念,它还可以帮助进行分类设计。
集群建议是根据在集群中的消息之间共享的已识别主题生成的。
集群的创建和标签建议的生成是一个完全无监督的自动过程,无需人工输入。
在带有或不带有预定义分类的情况下生成集群上的标签建议,但建议会受到影响,并且通常会利用导入或现有的标签而变得更有用。
- 您必须以 Automation Cloud™ 用户身份分配“数据集 - 审核”权限,或以旧版用户分配“审核和标签”权限。
- 导入的标签名称列表。
- 可选,强烈建议导入标签描述列表。
使用标签名称和描述作为训练输入自动训练初始模型后,数据集中的许多消息都会出现预测。
这些预测的工作方式与以前的完全相同,这意味着它们只是在没有训练数据的情况下生成的。
如果启用了标签情感分析,则初始预测将具有积极或消极的情感,并且具有不同的绿色或红色深浅,具体取决于置信度级别。
辅助注释适用于任何训练批处理或模式,但在“随机播放”和“学习标签”中使用最有效。您应该在“训练”或“探索”选项卡中的每个训练批次中遵循常规标注步骤。