2022年7月21日 组会报告摘要-01

本次组会将介绍个人近期设计实施的一个GAN网络参数更新优化算法:GAN-optimization。 该算法参考工业控制领域中的PID算法,将其结合深层网络的参数梯度更新优化算法,尝试以此解决GAN网络中因为生成器与判别器在对抗训练过程中某一方太强导致模型崩溃的问题。该方案在我们的分布式GAN架构中进行了实验, 在MNIST数据上的结果表明我们的该优化方案能够稳定的训练GAN。

内容主要包括

1.分析GAN网络训练失败的原因,参考其他研究者的解决思路,提出自己的解决方案,

2.回顾梯度,参数更新的基本内容,总结常用的参数更新的策略:SGD,SGD-Momentum, Nesterov Momentum等内容,

3.介绍工业控制领域常用的控制策略PID,

4.比较PID针对误差的控制策略与SGD等参数更新的方案,分析两者之间的区别与联系,将PID优化策略纳入到GAN网络的参数优化过程中。

通过本次组会介绍,我们希望大家能有如下一些收获

1.自动控制领域的闭环控制,PID控制策略

2.回顾梯度,梯度更新,SGD,SGD-Momentum, Nesterov Momentum等深度学习模型的更新策略

3.GAN网络的参数更新策略

4.GAN网络面临的问题以及解决方案