
Communications Mining 用户指南
本页介绍 Communications Mining™ 如何使用自然语言处理 (NLP) 和机器学习 (ML) 将非结构化消息转换为结构化数据,从而实现见解、自动化和可扩展性。它介绍了 NLP 的基础知识,以及 Communications Mining 从连接到数据到训练和验证模型的端到端工作方式,并重点介绍了业务价值、集成功能以及为用户和企业带来的收益。
自然语言处理(NLP)是机器学习(ML)的一个领域,专注于构建能够像人类一样自动理解和处理自然语言数据的工具。
NLP 工具的一个重点是获取非结构化通信数据,通过理解其中的意图、主题和概念并提取关键数据点,将其转换为可操作的结构化数据。
业务建立在沟通的基础上,这意味着几乎每个流程在某个阶段都需要对话。电子邮件、工单和 CRM 系统之间的通信是完成流程不可或缺的一部分。
无论是支持、销售、财务还是服务,我们都通过相互沟通来完成业务。
- 处理量太大,无法在不浪费时间和资源的情况下跟上每天的节奏。
- 随着员工和客户沟通空前频繁,该数字呈指数级增长。
- 面向员工和客户的多渠道,例如电子邮件、支持工单、调查、聊天和电话。
- 由员工通过成本高昂、不准确且低效的流程手动理解并采取行动
电子邮件、工单和消息的数量每年都在增加,这使服务达到了崩溃点。它正在增加服务成本,并破坏员工和客户的体验。
值得庆幸的是,NLP 作为 AI 的一个分支,专注于帮助机器读取和理解人类语言,近年取得了长足进步。
NLP 的成熟期已经到来,目前在语言理解和阅读理解方面已超过人类。
这为企业带来了新的解决方案和机会。
借助 NLP 现在可以大规模理解通信,使企业能够:
- 了解每位客户的需求。
- 实时跟踪和衡量所有服务需求。
- 自动化每个事务请求。
NLP 的优势在于,它可以将高技能员工从行政工作中解放出来,从而降低服务成本并改善体验。
Communications Mining 是一个专注于理解通信数据并从中提取价值的领域。
将此数据包含的非结构化信息转换为结构化的计算机可读数据的做法可用于分析和自动化。
- Process Mining可捕获端到端业务流程。它从 ERP 和 CRM 等核心业务应用程序中提取原始数据,并将其转换为直观的流程图和仪表板,以发现流程优化和自动化机会。
- Task Mining捕获单个任务或特定子流程的流程步骤。它可以记录和捕获用户直接在桌面上执行的任务,并将其工作流可视化,以识别最适合自动化的重复性活动及其变体。
- Communications Mining捕获对话数据,例如电子邮件、工单、备注、副本、调查回复等。它将数字通信数据转换为结构化格式,以生成见解并支持下游自动化。
Communications Mining 可自动解释通信,帮助企业在任何渠道上快速大规模理解消息并实现自动化。
此解决方案将机器学习 (ML)、自然语言处理 (NLP) 和员工主导的监督学习结合到任何人都可以使用的强大无代码解决方案中。
它提供对电子邮件、工单和客户反馈等渠道的完整可见性,帮助企业更好地了解客户,以及哪些改进措施将产生最大的影响。
此外,它还可实现通信领域的智能自动化,因为它可以生成下游自动化所需的结构化数据,而无需人工干预。
下图概述了数据在平台中的典型旅程:
- 用于提取到历史通信存储中的预构建连接器。用于清理数据的专有 ML 分段和清理引擎。
- 专有的深度学习句子模型可提取语义,以实现节省数据的学习。
- 专有的无监督学习模型可识别常见意图,并不断搜索新意图。
- 在我们专有的主动学习引擎和界面中高效训练定制的监督模型。
- 针对基于含义的管理信息和分析的实时汇总统计信息。
- 实时模型验证和模型生命周期管理。
以下概述概述了使用 Communications Mining 自动化数据所涉及的步骤:
- 连接- 连接到您的非结构化通信数据渠道。
- 发现- 识别并将具有相似主题和概念的通信组放在一起。
- 训练- 构建模型的训练数据。
- 预测- 预测每次通信的结构化标签和通用字段。
- 验证- 在依赖预测来推动决策之前,平台会通过在每次重新训练时自动验证模型性能,确保完全透明。
- 分析- 一旦对模型性能感到满意,该平台就会将预测与元数据相结合,发现隐藏的流程和沟通渠道,提供可行的见解。
- 自动化- 部署经过训练的模型以实现生产自动化。
首先,Communications Mining 会连接到您的非结构化通信数据渠道,例如共享电子邮件收件箱、工作流工单、调查回复集合等。
您可以通过以下方式将此数据导入平台:
- 与预构建的连接器实时集成,适用于 Microsoft Exchange 或 Salesforce 等渠道。
- 构建 API 集成。
- 通过 CSV 或我们的 API 上传历史数据。
发现
上传数据后,平台会自动启动发现流程。
它使用无监督学习将具有相似主题和概念的通信分组在一起。
这些集群可以链接到重复的流程、请求、问题和情感。它们都可以帮助定义模型的正确结构,并加快模型训练的第一阶段的速度。
通过审核这些集群并应用捕获相关概念和数据点的标签和字段,平台开始对数据有一个清晰的理解。
训练
接下来,我们使用各种训练模式为模型构建训练数据。
下图描述了我们如何训练平台轻松地识别所有可用数据中的这些标签和字段。
这些训练模式旨在最大限度地发挥训练操作的影响,并最大限度地减少训练所花费的时间。同时,该平台的零代码界面意味着模型训练者可以是在通信渠道中工作的任何业务用户。无需数据科学家或工程师。
对于每次训练操作,平台都会不断进行重新训练,以提高对每个概念和数据点的理解,并实时更新其预测。
通过标注少量具有代表性的训练数据样本,该平台能够大规模应用其对每个标签和一般字段的理解,自动解释整个数据集并进行预测。
预测
最终结果是针对每次通信的结构化标签和通用字段预测,每个标签和预测都有自己的置信度分数。下图就是一个示例,描述了 Communications Mining 如何解释电子邮件并从中提取相关的结构化数据:
这些预测可在平台中或通过 API 进行分析,UiPath™ 机器人和其他工具可以将其用于自动化或进一步分析。
验证
在依赖这些预测来影响决策或采取行动之前,我们需要了解模型的性能。
平台的验证功能在性能方面完全透明,可在每次重新训练模型时自动验证您的模型。
我们可以轻松了解模型在关键性能因素中的表现是否符合预期,为简单起见,我们将这些关键性能因素汇总到单个模型评分中。
该平台还指导模型训练器根据需要进行改进,并推荐下一个最佳操作。
分析
一旦我们对模型的性能感到满意,就可以非常快速地从这些业务对话中生成宝贵且可操作的见解。
该平台使用关键元数据聚合标签和字段的所有预测,以提供大量可查询的数据,从而提供对先前隐藏的流程和渠道的可见性。
这允许用户执行以下操作之一,其中包括:
- 创建自定义动态仪表板,以跟踪为客户和客户提供的关键指标以及服务质量。
- 运行分析,以识别改进流程或客户体验的机会。
- 设置警示以监控渠道绩效和风险事件。
除了分析之外,我们还可以部署经过训练的模型来实现生产自动化。
UiPath™ 机器人和下游系统可以使用 Communications Mining™ 创建的结构化数据,将自动化扩展到基于服务和对话的流程中。这使企业能够自动化事务请求和工作流。
UiPath 现在可以自动化端到端任务,例如分类电子邮件、更新客户信息和创建案例。
领先的企业信任 Communications Mining 来分析和自动化其通信,主要原因如下:
- 无代码- 我们让企业用户可以使用 NLP。该平台的零代码界面提供了指导性的用户体验,无论技术能力如何,任何员工都可以使用。
- 完全可自定义- 您可以创建完全自定义模型,以提取业务所需的精确意图、主题和情感。
- 准确- 您可以使用最少的训练数据训练准确的模型,模型性能完全透明,以避免生产中出现意外结果。
- 快速训练- 借助快速训练和适应的模型,您可以降低成本,减少工作量,并获得高可信度。
- 超可扩展- 要成功,您需要从小规模开始,但是您需要一个能够随着您的更大用例的需求快速扩展的解决方案,而我们的平台正是具备这一能力的。
- 实时监控和警示- 借助可配置的仪表板、电子邮件警示和实时跟踪关键指标的报告,您将拥有做出主动且明智的决策所需的所有数据。
- 安全- 最重要的是,您需要一个可靠的解决方案来存储数据,我们对平台的许可和加密功能可确保客户数据安全并受到保护。
- 易于集成- 我们为关键通信渠道预构建了集成,提供了易于使用的 API 以及用于工作流和 RPA 的连接器,可帮助其轻松融入您的技术堆栈。
我们的解决方案旨在为所有企业用户提供 AI 和 NLP 的强大功能,而不仅仅是数据科学家和工程师。其中一些优势包括:
- 比以往更了解客户 - 大规模发现推动客户需求的问题,以及可为客户带来更好成果的行动。
- 享受更有趣的工作 - 受益于强大的自动化,可处理单调的重复性通信工作。
- 专注于重要的工作 - 将更多时间投入到客户和创造实际业务价值的工作流中。