本次组会将对《A Deep Reinforcement Learning-based Preemptive Approach for Cost-aware Cloud Job Scheduling》的研究工作做总结报告,并分享工作过程中的个人思考和总结。
科研背景
1. 云计算是一种计算服务,具有按需分配、可扩展、可靠和灵活等特性。企业使用云平台不仅可以降低IT基础设施的部署成本,也可以简化企业管理和机器维护等工作,提高工作效率。因此,越来越多的企业选择使用云平台部署他们的应用程序,从而为用户提供服务。
2. 云计算中一个核心的研究问题就是作业调度问题。以一种高效的方式实时调度作业请求,不仅可以满足用户的需求,也能为服务提供商节省成本,提高效率。因此,如何以一种合理的方式将作业分配到虚拟机上执行是云计算中的重点研究问题。
科研问题
1.由于作业的高度动态性和复杂性,云服务商很难动态捕捉到实时变化,也就很难找到一种最佳的方式来分配作业。
2.基于DRL的作业调度算法可以解决实时调度问题,但是它只考虑了分配决策的问题,没有考虑到作业在虚拟机中的其他优化问题。
科研目的
我们提出了一个基于DRL的云抢占式成本感知作业调度框架,它不仅可以尽可能的满足用户的响应时间需求,实现实时作业调度,还能够通过抢占机制优化调度性能,提高作业执行成功率,并在此基础上降低虚拟机的执行成本。
研究框架
实验结果
本次实验从不同作业平均到达率、不同作业类型占比和不同虚拟机类型占比三方面进行,实验指标为作业执行成功率、成本和平均响应时间,具体实验结果如下图:
个人思考与总结
本部分重点分享个人在论文写作方面的新的学习心得,通过文章对比找出逻辑漏洞,深入学习写作。