ixp
latest
false

Communications Mining 用户指南
上次更新日期 2025年8月11日
备注:
- 您必须以 Automation Cloud™ 用户身份分配“来源 - 管理”和“注释 - 管理”权限,并以旧版用户分配“来源管理”和“编辑消息”权限,才能将 CSV 文件上传到来源。
- 有关如何从 .csv 文件上传数据的更多详细信息,以及常见的错误消息,请查看将 CSV 文件上传到来源。
将数据上传到 Communications Mining™ 之前,在准备供平台提取的数据时需要考虑一些因素。
重要事项:请务必上传具有 .csv 文件的。,而不是 Excel 文件 。
如果您一直在 Excel 中打开 .csv 并进行更改,则可能会导致格式问题,从而影响上传过程。为避免这种情况,请直接在 .csv 文件中进行更新。
此外,在上传 .csv 之前,请检查下表中列出的项目加载到平台。这有助于您避免在上传时出现任何错误,或避免对模型性能产生负面影响的数据质量问题。
项目 | 描述 |
重复行 | 在数据提取内容中多次重复相同的数据。 |
标头不匹配 | 将错误的标头与错误的数据字段对齐。 |
悬空行或列 | 连续行中未包含所有数据。例如,所有消息都在第 1 到 10,000 中,但有一行的单元格包含行 19,999 中的数据。 |
日期格式不一致 | 不同的行具有不一致的日期格式。例如,如果同一个数据集存在多条采用美国日期格式的消息,以及多条采用欧盟日期格式的消息,因为这会在规范化下游时产生问题。 |
句子语无伦次 | 这些句子包含各种单词,没有明确的语法或语义结构。
例如:
|
间距不一致 | 单词之间的空格数量不规则时。
例如:
|
单词中断 | 单词中间有换行符时。
例如:
|
字符编码错误 | 文本数据未正确编码,导致出现乱码或无法读取的字符。
例如:
|
空白消息 | 主题或正文中不包含任何内容的通信。 |
包含大量拼写错误的消息 | 包含大量拼写错误的文本数据。 |
页眉/页脚 | 当包含页眉或页脚时。例如,垃圾邮件警告、病毒扫描警告等。 |
元数据包含在主题/正文中,而不是作为元数据属性 | 主题或正文中包含元数据时。例如:
|
多条消息合并为一条消息 | 当改为将应拆分为单独线程消息的多条消息合并到单个通信时。 |