作者归档:张敬伟

2022-3-17组会报告摘要03

本次组会将会介绍关于基于深度强化学习的工作流任务云调度研究,主要内容如下:

科研背景:
近几年来,云计算技术的飞速发展,国内外涌现了大量云计算服务提供商,他们提供了大量计算和存储资源,为众多应用程序开发者提供了便捷,低成本的基础服务平台,使得越来越多的应用程序供应商将应用程序迁移至云平台。随着云计算的覆盖程度不断加深,应用程序对于云计算的要求也不断提高。

云计算环境受网络、负载等因素影响,具有动态性和不确定性,这使得实现云计算资源管理和性能优化成为了重要问题。在过去几年的研究中,针对云任务调度问题,提出的算法大多是批处理任务,而不是实时处理任务,这对于用户服务质量要求高的应用,如购物应用,竞拍应用等,批处理往往难以达到用户要求。

科研问题:
在实际情况中,云应用提供者希望能满足用户的服务质量要求,在很多场景中,如购物等,任务请求不断随时间变化,批任务处理往往无法满足用户要求。因此,如何实现实时任务调度,提高任务调度和处理速度,成为云计算研究领域的重要问题。

科研目的:
为了实现云计算实时任务调度,我们针对workflow(工作流)任务提出使用深度强化学习和元启发式算法相结合的方法DQN-GA。该方法以深度强化学习DQN算法作为智能任务调度器进行任务实时调度,以元启发式算法遗传算法作为部署模块在虚拟机中部署workflow任务,通过训练DQN算法,实现对workflow任务的实时调度。

流程框架:


2021-12-02 组会报告摘要-04

本次组会将会介绍有关《DRL-Scheduling-一种面向云应用的智能Qos感知作业调度框架》的有关内容以及自己的一些理解,主要从以下几个方面介绍:

科研背景:
随着云计算技术的不断发展,Iaas供应商(如Amazon EC2和Microsoft Azure)能为用户提供强大的计算和存储资源,使得应用程序供应商能以更低的成本构建自己的IT基础设施。因此,越来越多的应用程序迁移至云环境。基于云的应用程序的资源管理特别是实现高效的作业调度,满足用户的服务质量要求成为备受关注的问题之一。

科研问题:
不同于传统操作系统调度和分布式计算调度, 云环境下的任务调度环境更加复杂,影响因素更多,任务和虚拟机种类繁多,基于理论研究和启发式算法不能很好的实现云计算作业调度。因此,解决云环境下作业调度问题,实现高效,实时并尽量满足用户QoS要求的作业调度是主要解决的问题。

科研目的:
构建基于深度强化学习的智能调度框架,实现对云环境实时作业调度的优化,减少作业平均响应时间并尽量满足用户QoS要求。

使用方法:
深度强化学习DQN算法