本次组会将会继续针对我上次汇报的内容《基于AC-TimeGAN-GP模型的电力时序数据生成研究》进行汇报。
科研背景
随着新一轮能源技术革命的兴起,我国提出以碳达峰、碳中和为目标的能源战略,建立清洁、低碳、安全、高效的能源体系。对于这些目标,电力行业正在经历着多维度的转型,在用电侧,消费者的消费方式也朝着数字化、个性化、便捷化、开放化的方向转变。
2020年,我国首次将数据纳入五大生产要素之一,数据作为战略性和基础性资源的价值已经得到社会的广泛认可。无论是数据收集、分析还是使用,都已经成为现在社会各行各业的核心工作,其中电力行业也不例外。截至到2022年底,我国已经部署了7亿个智能电表。因此,使用人工智能技术对细粒度的用户用电数据进行分析,可以为消费者提供更多个性化的能源使用服务,帮助电力供应商训练更加准确的负荷预测模型,制定更加高效的电力调度决策,提高新能源的消纳量。
科研问题
因此,在电力行业中,智能电表的广泛部署使得使用人工智能技术来细致分析用户的用电数据变得可行。这种分析尤其在处理短期电力负载变化时显得至关重要。这不仅帮助消费者获得更加个性化的能源使用服务,而且还能帮助电力供应商更准确地预测电力负荷,从而制定出更有效的电力调度策略,并提高新能源的利用效率。然而,这些技术为了高效训练通常需要大量有代表性的数据集。然而,收集这些数据面临着显著的安全和隐私挑战,同时,高质量的公开数据集也相对稀缺。
因此,为了解决上述的矛盾,使用合成数据(Synthetic Data)代替原始数据来训练训练机器学习算法成为了一种可行的方案。而生成式对抗网络(Generative Adversarial Networks, GANs)身为目前最好的合成数据解决方案,展现出了其独特的优势。继GAN之后,时间序列生成对抗网络(Time-series Generative Adversarial Networks,TimeGAN)这一GAN的变种进一步扩展了这一领域,为时间序列数据的合成提供了创新的解决方案。
家庭智能电表的时间序列数据通常包含丰富的信息,如能源消耗模式、峰值使用时段等。这些数据通常与社会人口统计数据(如家庭大小、位置、收入水平)有关联,使得数据的特征非常复杂和多变。尽管TimeGAN是一种有效的时间序列数据生成模型,但其在处理具有丰富特征和复杂关联的真实世界数据时仍然存在局限性。例如,它无法充分捕捉到社会人口统计特征与能源消耗之间的关系。
科研目的
提出了时间序列生成模型Auxiliary Classifier Wasserstein TimeGAN with Gradient Penalty(AC-TimeGAN-GP),在保护用户隐私的同时,实现数据价值属性的流通。相比于传统的TimeGAN模型,本文提出的模型同时通过引入Wasserstein距离和ACGAN的辅助分类器,提高模型的稳定性和数据的质量,从而能够更好地处理和生成复杂的时间序列数据。
这种改进的模型可以更有效地处理复杂的真实世界时间序列数据。在家庭智能电表数据中,AC-WGAN-GP能够模拟和生成符合实际社会人口统计特征的能源使用模式的高质量合成数据,从而在能源需求预测、用户行为分析等方面提供洞察。