ixp
latest
false

Communications Mining 用户指南
上次更新日期 2025年8月11日
平衡
link“平衡”这一术语用于描述模型的训练数据在整体上在多大程度上代表数据集。
当平台评估模型的平衡能力时,它会查找可能导致训练数据与整个数据集之间不平衡的偏差。
为此,平台使用批注偏差模型来比较已审核的数据和未审核的数据,以确保已批注的数据可代表整个数据集。如果数据不具有代表性,则模型性能衡量指标可能会具有误导性,并且可能不可靠。
批注偏差通常是用于分配标签的训练模式不平衡的结果,尤其是在使用过多文本搜索且改组不足的情况下。
“重新平衡”训练模式会显示已审核集中代表性不足的消息。在此模式下批注示例将有助于快速解决数据集中的任何不平衡问题。