ProcessExplorer：智能流程挖掘指南

立即解锁

发布时间: 2025-10-23 00:10:38 阅读量: 10 订阅数: 28

业务流程智能分析实践

### ProcessExplorer：智能流程挖掘指南 #### 1. 流程性能指标（PPIs）流程性能指标（PPIs）对于衡量流程的潜在瓶颈、低效率和合规性违规等方面具有重要意义。主要分为基于案例和基于子集的PPIs，具体如下表所示： | PPI 类型 | 描述 | | --- | --- | | 案例 - 控制流 | 直接/最终跟随循环 | | 案例 - 资源 | 资源数量/分布 | | 案例 - 数据 | 案例/事件属性值 | | 案例 - 时间 | 事件/轨迹持续时间 | | 案例 - 功能 | 事件数量/(共同)发生次数 | | 子集 - 控制流 | 开始/结束事件分布 | | 子集 - 资源 | 属性资源 | | 子集 - 数据 | 案例/事件属性值分布 | #### 2. 洞察建议的发现在这一步骤中，系统会自动获取相关的流程性能指标（PPIs），仅为每个子集建议提供最有趣的洞察。具体操作如下： 1. **计算与比较PPIs**：借鉴SEEDB的思想，通过计算所选子集的PPIs并与参考集进行比较，评估其有趣性。参考集可以是不同的事件日志、历史数据或其他子集。 2. **统计显著性测试**：对所选的PPIs进行统计显著性测试，判断子集和参考集的PPI值是否来自不同的分布。 - **零假设**：两个PPI值集来自相同的分布。 - **测试方法**：对于基于案例的PPIs，使用Kolmogorov - Smirnov测试；对于基于子集的PPIs，使用Jensen - Shannon散度。 - **决策依据**：根据p值和预先设定的显著性水平，决定是否拒绝零假设。若拒绝零假设，则相应的PPI被视为洞察建议。 3. **计算Cohen's d效应大小**：由于显著性值不一定能表明偏差的大小，因此计算Cohen's d效应大小。计算公式如下： \[d = \frac{\bar{x_1} - \bar{x_2}}{\sqrt{(s_1^2 + s_2^2)/2}}\] 其中， \[s_i^2 = \frac{1}{n_i - 1} \sum_{j = 1}^{n_i} (x_{j,i} - \bar{x_i})^2\] Cohen定义了效应大小的范围：0.2 < d ≤ 0.5表示小效应，0.5 < d ≤ 0.8表示中等效应，d > 0.8表示大效应。 4. **聚类相关洞察**：实验发现一些PPIs之间存在强相关性，导致额外的冗余洞察。通过计算所有相关PPIs的成对Spearman相关矩阵，并使用肘部方法确定最佳聚类数，将相关洞察分组在一起。 #### 3. 建议的排名系统会根据子集建议的相关性对其进行排名，生成排名靠前的前k个建议列表。具体步骤如下： 1. **计算子集得分**：每个子集的得分是其中识别出的洞察的平均得分，由效应大小和覆盖率的乘积定义。覆盖率是子集中满足特定洞察的案例比例。 2. **多样化排名**：应用多样化的top - k排名方法，避免top - k列表中顶部项目过于相似的问题。定义多样性为子集中案例的轨迹和案例属性相似性的组合，使用与生成子集建议相同的相似性函数来识别最具多样性的子集。 #### 4. ProcessExplorer实现系统将上述方法实现为一个交互式探索系统，以BPI Challenge 2019的公开事件日志为例进行说明。该事件日志包含一家荷兰跨国涂料和油漆公司的采购订单处理流程数据，共有1,595,923个事件，涉及42个活动，251,734个案例，由627个不同用户执行。系统的用户界面主要包括以下组件： 1. **流程地图**：类似于其他流程挖掘工具，直观展示底层流程，用户可以使用右下角的相对发生滑块隐藏活动和转换。 2. **子集建议**：从事件日志中获取子集建议，以列表形式呈现给用户，并按分配的分数排序。用户可以通过添加额外的过滤器（如变体过滤器、开始和结束活动过滤器或快乐路径过滤器）来修改子集建议，也可以应用或删除这些建议。 3. **子集统计**：提供包含案例的活动分布、变体、轨迹和转换的概述。 4. **洞察建议**：是用户决定应用的子集的洞察。基于轨迹的PPIs以文本形式呈现，描述识别出的偏差；基于聚类的PPIs以条形图形式呈现，显示值的分布。 5. **阶段视图**：允许在子集建议之间进行简化导航，以层次结构记录应用的子集建议。应用一个子集会创建一个新阶段，并根据包含的案例计算新的建议。下面是系统操作的mermaid流程图： ```mermaid graph LR A[获取事件日志] --> B[发现洞察建议] B --> C[排名建议] C --> D[显示子集和洞察建议] D --> E[用户交互] E --> F{是否修改子集建议} F -- 是 --> G[添加过滤器修改子集建议] G --> D F -- 否 --> H[分析子集和洞察] ```

最低0.47元/天解锁专栏

买1年送1年

继续阅读点击查看下一篇

400次会员资源下载次数

300万+ 优质博客文章

1000万+ 优质下载资源

1000万+ 优质文库回答

复制全文

相关推荐

SW_孙维

开发技术专家

知名科技公司工程师，开发技术领域拥有丰富的工作经验和专业知识。曾负责设计和开发多个复杂的软件系统，涉及到大规模数据处理、分布式系统和高性能计算等方面。

最低0.47元/天解锁专栏

买1年送1年

百万级高质量VIP文章无限畅学

千万级优质资源任意下载

千万级优质文库回答免费看

专栏简介

本专栏《BPM前沿：流程智能新视界》聚焦业务流程管理（BPM）领域的最新理论突破与技术实践，涵盖流程挖掘、形式化建模、智能优化与合规性分析等核心议题。专栏深入探讨Petri网、BPMN语义、区块链编排、自然语言推理与数据感知流程建模等前沿技术，融合物联网、机器学习与SMT验证等跨学科方法，推动流程智能化与自动化发展。同时关注医疗、监管合规、组织改进与信任设计等实际应用场景，强调数据质量、过程一致性与业务对齐的系统性研究，展现流程科学在数字化转型中的关键作用，为学术研究与产业实践提供全新洞察与方法支持。

立即解锁

专栏目录

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

ProcessExplorer：智能流程挖掘指南

相关推荐

docker-process-mining:用于流程挖掘的Docker映像

IBM Process Mining流程挖掘

ProcessExplorer

SAP BW配置与操作详解：中文实战教程

【性能监控与分析指南】：利用工具深入挖掘.NET Framework 4.8性能

【Excel中OPC数据处理】：从采集到分析的完整流程指南

【MATLAB中gpstoolbox的高级应用】：深度挖掘10个不为人知的技巧

深度文献挖掘：揭示研究趋势的文本挖掘技术

【Mstar软件工具的性能调优】：提升调试效率的终极指南

【大数据与数据挖掘】：Weka与Hadoop的协同工作详解

connect-openapi-jersey2-1.4-sources.jar

专栏目录

最新推荐

RESTful API设计规范：构建可扩展、易集成的ESP32远程控制接口

蓝牙开发初探：ESP-IDF中BLE外设模式实现与GATT服务配置详解（新手速成指南）

多节点ESP32部署能耗危机：深度睡眠同步与信道竞争的6种优化应对策略

跨平台兼容性设计：让ESP32语音助手无缝对接Home Assistant与米家生态的桥接方案（稀缺实现）

FreeRTOS在ESP32视觉项目中的应用：3个关键任务划分与优先级设置最佳实践

外设驱动时序竞争揭秘：RTOS任务调度如何影响GPIO翻转的μs级偏差研究

ESP32 + DHT11实战详解：手把手教你完成温湿度采集与上传代码实现

ESP32蓝牙BLE与Wi-Fi双模切换策略：为AI数据上报节省每毫安时的精细控制术

CI_CD流水线实战：GitHub Actions + PlatformIO 实现自动编译与远程部署

低功耗ESP32调光控制器设计：电池供电场景下的3种省电模式优化策略