2022-06-02 组会报告摘要-01 | 电力大数据研究院

本次组会将介绍个人近期实施的一次成员推理攻击案例，通过这个真实的案例推导出差分隐私的公式；并进一步将介绍差分隐私应用到分布式GAN训练中遇到的一系列问题以及目前的解决方案。

内容主要包括：1.针对kaggle比赛的一次成功成员推理的案例，2.由思考如何应对这种攻击而推导出我们的差分隐私公式，3.将差分隐私机制加入到分布式GANs训练的方案，4. 针对原始数据与加入差分隐私后的合成数据D’之间,隐私损失评估方案落地过程中遇到的一系列实际困难和解决方案。

通过本次组会介绍，我们希望大家能有如下一些收获

1.知道什么是成员推理攻击，何种情况下可以实施这种攻击

2.通过应对成员推理攻击，理解什么是差分隐私机制，能够自己推导出差分隐私公式

3.一个现实的数据集的表示方式（经验累积概率分布函数ECDF），它为何无法使用通用的理论分布形式表示（即为何无法用累积概率分布函数CDF，和概率密度函数PDF）

4.如何比较两个数据集之间的差异，J-S散度为什么可用以及它的局限性

5.解决原始数据集D和生成数据集D’的隐私损失评估方案可行性的直观表达

6.如何将数据集的表示、数据集之间的差异性比较从点数据迁移到高维数据