基于深度强化学习的高效云工作流调度研究
本次汇报对基于深度强化学习的高效云工作流调度研究的研究内容进行总结介绍,并提出下一步研究思路。
科研背景:
随着各行业自动化和流程化改革的不断发展,工作流普遍应用于各类应用程序当中,由多个具有依赖关系任务组成的工作流的调度问题一直以来是分布式系统领域的重要问题。
近年来,能够提供多样化的在线计算、存储、应用等服务的云计算,因其低成本和弹性拓展的性质成为各类应用程序构建基础服务架构的最受欢迎的选择之一。然而,在影响因素更多,资源类型设置更复杂的云计算环境中,工作流调度变得更加困难,成为影响云计算服务质量和应用用户服务质量要求的关键问题。
科研问题:
工作流由于复杂结构和依赖关系,难以直接进行调度运行。同时,在动态变化的云环境中很难通过传统方法为工作流分配计算资源,实现工作流的高效执行。
科研目的:
本次研究旨在提出一种工作流高效调度框架,通过设计一种动态任务选择方法,对工作流任务进行拆分,结合深度强化学习DQN算法,实现在云环境中,对工作流进行高效并行执行,提升工作流执行效率并降低工作流执行成本。

研究思路:
设计一个两层工作流调度框架,第一层通过从不断变化的可执行任务中动态选择一个任务(元启发式或DQN算法),第二层通过DQN算法为选择的任务选择最优虚拟机进行执行,最小化该任务的执行时间和成本,实现高效云工作流调度。