不完备日志的过程挖掘算法研究
【摘要】:现代企业为了生产高效化、服务优质化,不断地改善其业务过程运营,引入了工作流管理系统、ERP等过程信息感知系统。过程挖掘可以利用系统实施过程保存下来的信息系统日志挖掘出客观知识。这些被发现的客观知识有助于新业务系统的部署,或者作为一种反馈工具,改善已经存在的业务过程。本文主要研究过程挖掘中的控制流、组织视角。首先,通过了解过程挖掘领域国内外的研究现状,对过程挖掘的不同算法有了深入理解,发现在挖掘控制流视角方面存在着不完备日志问题。为了解决这一问题,本文将业务领域人员的先验知识定义成一套约束规则,以依赖图为基础,提出了一种不完备日志的过程挖掘算法,并就算法中初始依赖图的构造、满足消极和积极约束,以及绑定操作等几个关键性步骤进行了详细的阐述和论证;在挖掘组织视角方面,传统过程挖掘算法在发现带有多重角色身份资源的能力上存在着缺陷,本文在获取一个社会网的基础上,以优化网的模块为目标,获得资源社区的划分。同时还可以将社会网进一步转换成带权社区网,在带权社区网的基础上,探寻社区的最大适应度邻居,以进而形成资源角色网,找到资源在不同社区中所扮演的角色;最后通过实验验证了算法的正确性。在日志不完备的情况下,本文的算法以形式化的方式对消极路径约束的关系进行了分类,简化了满足该类约束所需要采取的操作步骤,即增加和删除边的数量变少了。满足积极约束的过程时,算法采用权值更新操作寻找满足积极约束的最优路径,有效地提高了算法的执行效率。绑定操作对模型的行为进行了必要的限制,减少了非原始日志轨迹的生成,最终挖掘到的过程模型更贴切原始模型。在挖掘日志中的资源方面,本文中的算法解决了传统算法不能挖掘重叠社区的问题,社区划分后网的模块性更高,且能发现具有多重角色身份的资源。