ProcessExplorer:智能流程挖掘指南
立即解锁
发布时间: 2025-10-23 00:10:38 阅读量: 10 订阅数: 28 AIGC 

业务流程智能分析实践
### ProcessExplorer:智能流程挖掘指南
#### 1. 流程性能指标(PPIs)
流程性能指标(PPIs)对于衡量流程的潜在瓶颈、低效率和合规性违规等方面具有重要意义。主要分为基于案例和基于子集的PPIs,具体如下表所示:
| PPI 类型 | 描述 |
| --- | --- |
| 案例 - 控制流 | 直接/最终跟随循环 |
| 案例 - 资源 | 资源数量/分布 |
| 案例 - 数据 | 案例/事件属性值 |
| 案例 - 时间 | 事件/轨迹持续时间 |
| 案例 - 功能 | 事件数量/(共同)发生次数 |
| 子集 - 控制流 | 开始/结束事件分布 |
| 子集 - 资源 | 属性资源 |
| 子集 - 数据 | 案例/事件属性值分布 |
#### 2. 洞察建议的发现
在这一步骤中,系统会自动获取相关的流程性能指标(PPIs),仅为每个子集建议提供最有趣的洞察。具体操作如下:
1. **计算与比较PPIs**:借鉴SEEDB的思想,通过计算所选子集的PPIs并与参考集进行比较,评估其有趣性。参考集可以是不同的事件日志、历史数据或其他子集。
2. **统计显著性测试**:对所选的PPIs进行统计显著性测试,判断子集和参考集的PPI值是否来自不同的分布。
- **零假设**:两个PPI值集来自相同的分布。
- **测试方法**:对于基于案例的PPIs,使用Kolmogorov - Smirnov测试;对于基于子集的PPIs,使用Jensen - Shannon散度。
- **决策依据**:根据p值和预先设定的显著性水平,决定是否拒绝零假设。若拒绝零假设,则相应的PPI被视为洞察建议。
3. **计算Cohen's d效应大小**:由于显著性值不一定能表明偏差的大小,因此计算Cohen's d效应大小。计算公式如下:
\[d = \frac{\bar{x_1} - \bar{x_2}}{\sqrt{(s_1^2 + s_2^2)/2}}\]
其中,
\[s_i^2 = \frac{1}{n_i - 1} \sum_{j = 1}^{n_i} (x_{j,i} - \bar{x_i})^2\]
Cohen定义了效应大小的范围:0.2 < d ≤ 0.5表示小效应,0.5 < d ≤ 0.8表示中等效应,d > 0.8表示大效应。
4. **聚类相关洞察**:实验发现一些PPIs之间存在强相关性,导致额外的冗余洞察。通过计算所有相关PPIs的成对Spearman相关矩阵,并使用肘部方法确定最佳聚类数,将相关洞察分组在一起。
#### 3. 建议的排名
系统会根据子集建议的相关性对其进行排名,生成排名靠前的前k个建议列表。具体步骤如下:
1. **计算子集得分**:每个子集的得分是其中识别出的洞察的平均得分,由效应大小和覆盖率的乘积定义。覆盖率是子集中满足特定洞察的案例比例。
2. **多样化排名**:应用多样化的top - k排名方法,避免top - k列表中顶部项目过于相似的问题。定义多样性为子集中案例的轨迹和案例属性相似性的组合,使用与生成子集建议相同的相似性函数来识别最具多样性的子集。
#### 4. ProcessExplorer实现系统
将上述方法实现为一个交互式探索系统,以BPI Challenge 2019的公开事件日志为例进行说明。该事件日志包含一家荷兰跨国涂料和油漆公司的采购订单处理流程数据,共有1,595,923个事件,涉及42个活动,251,734个案例,由627个不同用户执行。系统的用户界面主要包括以下组件:
1. **流程地图**:类似于其他流程挖掘工具,直观展示底层流程,用户可以使用右下角的相对发生滑块隐藏活动和转换。
2. **子集建议**:从事件日志中获取子集建议,以列表形式呈现给用户,并按分配的分数排序。用户可以通过添加额外的过滤器(如变体过滤器、开始和结束活动过滤器或快乐路径过滤器)来修改子集建议,也可以应用或删除这些建议。
3. **子集统计**:提供包含案例的活动分布、变体、轨迹和转换的概述。
4. **洞察建议**:是用户决定应用的子集的洞察。基于轨迹的PPIs以文本形式呈现,描述识别出的偏差;基于聚类的PPIs以条形图形式呈现,显示值的分布。
5. **阶段视图**:允许在子集建议之间进行简化导航,以层次结构记录应用的子集建议。应用一个子集会创建一个新阶段,并根据包含的案例计算新的建议。
下面是系统操作的mermaid流程图:
```mermaid
graph LR
A[获取事件日志] --> B[发现洞察建议]
B --> C[排名建议]
C --> D[显示子集和洞察建议]
D --> E[用户交互]
E --> F{是否修改子集建议}
F -- 是 --> G[添加过滤器修改子集建议]
G --> D
F -- 否 --> H[分析子集和洞察]
```
0
0
复制全文


