- 发行说明
 - 在开始之前
 - 管理访问权限
 - 入门指南
 - 集成
 - 使用流程应用程序
 - 创建应用程序
 - 正在加载数据
 - Transforming data
 - 自定义仪表板
 - 发布流程应用程序
 - 应用程序模板
 - 通知
 - 其他资源
 

Process Mining
Process Mining 应用程序的响应时间由许多因素决定。 但是,通常遵循以下原则:
- 
                  
数据越少,执行速度就越快
 
在“Process Mining”中,有两个区域具有不同的性能特征:用于加载数据的数据运行和用于查看数据的仪表板。
以下用例会触发 Process Mining 中的数据运行:
- 
                     
创建应用程序
 - 
                     
上传数据
 - 
                     
触发“ 应用到 数据转换 编辑器中的仪表板”、 “全部 运行”或 “运行文件 ”。
 - 
                     
发布在数据转换中有更改的应用程序。
 
数据运行通常包含以下步骤,每个步骤具有不同的性能特征:
1. 上传数据
上传数据时,磁盘上上传数据的总体大小是影响速度的最重要因素。 请查看加载数据。 影响性能的因素包括:
- 
                        
表格数量;
 - 
                        
表格中的记录数;
 - 
                        
表格中的列数;
 - 
                        
表格中的数据。 例如,多行描述列比简单的“布尔值”列慢。
 
2. 转换数据
数据转换将输入数据更改为仪表板所需的数据模型。请查看数据转换编辑器。
.sql文件都会运行一个附加的 SQL 查询。 以下因素会影响数据转换的速度:
                  - 
                        
.sql文件的数量; - 
                        
每个表格中的记录数;
 - 
                        
每个表格中的列数;
 - 
                        
SQL 查询的复杂性:联接条件、通用表表达式 (CTE) 的数量、SQL 查询中的表达式。
 
3. 数据模型
数据模型决定了向仪表板公开的一组表格。 在数据运行期间,系统将运行测试以验证数据模型中这些表的结构。 但是,最耗时的部分是为加快稍后查看仪表板的速度而进行的预计算。
此步骤的总体速度由以下因素决定:
- 
                        
数据模型中表格的数量;
 - 
                        
输出表之间的关系;
 - 
                        
输出表中的列数
 - 
                        
输出表中的记录数。
 
4. 流程模型
数据运行的最后一部分是运行预计算,以加快流程图的速度。
- 
                        
变体数量;
 - 
                        
事件的数量。
 
如果您使用导入 BPMN 模型来显示流程,则 BPMN 模型的复杂性也会影响性能。 活动和边越多,计算就越慢。
如何提高数据运行性能
减少数据量
要提高数据上传速度,请将数据大小减少到所需的最小值。 此建议适用于数据的所有阶段:
- 
                           
仅提取所需的输入数据;
 - 
                           
仅转换所需的数据;
 - 
                           
仅在数据分析需要时将表格添加到数据模型。
 
执行此操作的最简单方法通常是减少用于数据提取的时间窗口,因为这会减少大多数数据表从输入到转换再到输出的记录数。
减少数据大小越早,效率就越高:
- 
                           在数据转换中(如有可能,在数据提取中)尽早筛选
sql文件。 - 
                           
对于开发,通常使用更小的数据集,以加快测试查询的速度,请参阅开发数据与生产数据。
 
减少数据表和列
此外,请注意仅加载实际使用的列。 在流程中越早将其排除在外越好。
- 
                           
根据需要减少提取的数据列集。
 - 
                           删除输出数据模型不需要的任何
.sql文件。 - 
                           
删除查询中任何不必要的数据列。
 - 
                           
从事件集中删除任何不必要的活动。
 
降低复杂性
数据转换和数据模型中的计算越复杂,数据运行的速度就越慢。 降低复杂性可能是一项挑战,但可能会对数据运行时产生重大影响。
- 
                           
在可能的情况下降低 SQL 语句的复杂性,请查看有关编写 SQL 的提示。
 - 
                           
将数据模型中的数据减少到数据分析所需的数据。 应删除数据分析不需要的任何表格或列。
 - 
                           
如果您使用导入 BPMN 模型来显示流程,则保持较低的活动和边线数量将提高性能。
 
通常,仪表板加载时间受图表和计算的指标使用的数据量的影响。
每次在 Process Mining 中加载仪表板时,都会并行计算每个图表。 加载图表的速度受以下因素影响:
- 
                     
图表中显示的指标数量。
 - 
                     
对于每个指标,计算指标所需的联接大小很重要。 这由用于对图表进行分组的表格与指标的表格结合确定。
- 
                           
这两个表之间关系的复杂性。
 - 
                           
数据模型中这两个表之间的距离。
 
 - 
                           
 - 
                     
所用字段的数据类型。 数字字段比文本字段更快。
 - 
                     
指标本身的复杂性。 指标可以基于多个字段。
 
如何提高仪表板性能
删除图表不需要的任何指标将加快加载时间。
- 
                        
考虑顶部栏中显示的 KPI;
 - 
                        
考虑图表中显示的指标。 如果图表显示多个指标,则每个指标都会增加额外的计算时间。
 
简化指标的定义还可以加快图表加载时间。
- 
                        
考虑是否可以简化指标定义;
 - 
                        
考虑在数据转换中预计算部分指标。 之前已经完成的任何静态计算都不需要在运行时完成。