2022-11-24组会报告摘要-01

本次组会将介绍《数据合成技术综述》,内容包括:

1.什么是合成数据

2.为什么需要合成数据?主要从隐私性方面展开,与其他的匿名化技术进行比较

3. 介绍合成数据的优势

4. 常用的合成技术有哪些?包括基于插值法,统计模型法和GAN模型,由于开题时以着重介绍了GAN的生成方法,本次分享将重点介绍基于统计模型的数据生成方法。

本次分享,重点介绍统计模型的建立和特点,希望通过本次介绍,将机器学习理论中常用的模型、方法、技术梳理出来它们的由来和解决的问题,包括参数估计模型和非参数估计模型中的:矩估计,极大似然估计(MLE)贝叶斯估计(BE)极大后验估计(MAP)
直方图法(Histogram)核密度估计(KDE)高斯混合模型(GMM)