作者归档:毛徐晗

2022.4.21 组会报告摘要—03

这次组会主要介绍《基于CPU-GPU架构的流程挖掘算法的性能优化》的实验进展。

科研背景

  • 对于企业来说,业务流程在信息系统中留下足迹,而流程挖掘则可以从这些足迹中抽取有用的信息,为企业自身业务流程的理解、改进和重构提供事实依据。
  • 在过去几年中,记录的数据量大幅增加。与这种数据爆炸现象相关的主要挑战不是存储,而是从这些庞大的数据集合中提取有价值的信息。后一个挑战也适用于业务流程的分析。

科研问题

虽然分布式计算框架和平台可以有效地利用数据并行性,但由于它们的计算是在CPU上进行的,它们的并行性仍然受到可用计算资源的限制。因此,如何提高事件数据处理的并行度,成为流程挖掘技术性能提升的重要问题。

科研目的

为了在有限的计算资源中实现高性能,我们提出了使用CPU-GPU架构进行大规模流程挖掘的方法。

整体流程框架

实验结果

下一步计划

完成中文论文的表达方式和逻辑结构修改

2022-03-03 组会报告摘要-03

本次组会将会介绍有关《基于CPU-GPU架构的流程挖掘算法的性能优化》的有关内容。主要从一下几个方面介绍:

科研背景

流程挖掘是一门相对年轻的研究学科,它一方面位于机器学习和数据挖掘之间,另一方面又位于过程建模与分析中。流程挖掘的理念是通过从事件日志中提取出知识,从而去发现、监控和改进实际过程。

科研问题

近几年,因为数据量异常庞大导致的算法性能下降,使得现目前的流程挖掘算法逐渐不符合人们的预期。因此利用GPU的高度并行化解决流程挖掘性能问题是一个值得思考的热点。

科研内容

  • 完成流程挖掘算法的图形化。
  • 完成inductive miner算法的性能优化。
  • 使用异步操作来减少事件日志从CPU向GPU转移的时间。

进度报告

流程挖掘算法的优化前后时间对比。

2021-12-09 组会报告摘要-04

本次组会将会介绍有关《基于CPU-GPU架构的α算法的性能优化》的有关内容。主要从一下几个方面介绍:

科研背景

α算法是流程挖掘早期的发现算法之一,可以将事件日志转换为一个能够重演日志的petri网。同时α算法是完全开源的,我们可以在此基础上进行一些修改及优化操作。

科研问题

近几年,记录的数据量大幅度增加,使得事件日志变得庞大,再加上流程挖掘任务本身计算密集,导致流程挖掘性能逐渐不符合人们的预期。现有的提高α算法性能的方法——分布式计算架构也因为受到计算机资源的限制,导致遇到瓶颈。因此利用GPU的高度并行化解决流程挖掘性能问题是一个值得思考的热点。

科研目的

使用CPU-GPU架构实现α算法的并行化,减少petri网生成所需要的时间

使用方法

CPU-GPU架构