2022年11月17日组会报告摘要-02 | 电力大数据研究院

这次组会主要介绍《基于深度强化学习的用户侧用电行为数据压缩研究》思路进展，从科研背景、科研问题、科研目的、研究内容等几个方面展开。

科研背景：

随着人工智能、云计算、大数据等技术的广泛应用，传统电网逐渐朝着智能电网方向发展。

电力用户侧大数据主要来源于智能电表的广泛使用、各类传感器的普及、智能家电的使用和用户消费模式的改变，导致电力用户侧大数据分析的任务量加大。据不完全统计，截止2020年12月，国家电网智能电表覆盖率达到99.03%，累计采集4.47亿户。

电力物联网末端不断接入传感器、智能电表等电力设备，电力用户侧用电数据呈现指数级剧增。通常，传感器的存储预算较小，计算能力较低，网络带宽有限。随之而来的问题是缓冲区会频繁被占用，传输点的工作量会很大。此外，在某些地区的智能电网中，可能会有数十万个乃至数百万传感器同时收集用电数据。一旦所有这些传感器收集到的用电数据在一个服务器上积累起来，其数量将是巨大的。

巨大容量增加了存储成本，更重要的是使数据的查询处理变得昂贵。

科研问题：

针对用户侧用电行为数据的数据量大、种类繁多与采集速度快等特点。

①电力领域的数据价值挖掘于电网内部和电源端，用户侧庞大且蕴含丰富价值的电力数据而未能得到很好利用。

②目前电网采用云计算技术，将终端设备采集到的用户侧数据先汇总到数据中心再进行处理和应用等工作，这使得电网实时处理数据的能力不足。加之海量数据集中于数据中心，传统的数据分析模式已无法满足需求，迫切需要解决电力用户侧的大数据在数据存储、分析与处理方面的难题。

科研目的：

在有限的通信和存储能力下，一边是云中心有限的数据存储和实时处理能力，一边是 TB级别增长的用户侧数据中亟待挖掘的巨大数据价值。

①对云中心数据进行可靠的存储和实时处理

②对用户侧数据进行高效准确的查询、分析。

研究内容：

解决上述两个问题的一种常见做法是进行数据压缩，数据压缩是指在不丢失有用信息的前提下，缩减数据量以减少存储空间，提高其传输、存储和处理效率，或按照一定的算法对数据进行重新组织，减少数据的冗余和存储的空间的一种技术方法。

拟考虑将电力用户侧用电数据时序图像看成是一条运动轨迹，数据压缩的本质上是丢弃给定轨迹的一些点，并将剩余的点保持为简化轨迹。

在线方式逐个输入点，而只有大小为W的缓冲器可用，即在整个轨迹简化过程中最多可以保留W个点。我们采用了一种现有的策略，对于前W个点，我们将其直接存储在缓冲区中，对于剩余的每个点，由于缓冲区已满，我们需要将一个点丢弃以获得一些空间，然后将新点存储在缓冲中。与现有的策略不同，这些策略使用一些人工设计的启发式值来决定缓冲区已满时要丢弃哪个点。

我们的目标是为这项决策任务实现一种更智能的方法。具体而言，我们将轨迹简化问题视为一个顺序决策过程，并将其建模为马尔可夫决策过程。

深度强化学习方法建模：

在组会ppt中展示。

实验结果：

在组会ppt中展示。

后续研究计划：

11.17-12.30 增加对比算法，优化实验结果

1.1-1.22 撰写小论文