本次将会介绍有关《基于小波降噪和模糊聚类的漂移数据流自适应预测》的进展情况。主要内容如下:
科研背景:
当前的模型和算法越来越需要在非平稳环境中学习,因为可能会出现概念漂移(或模式转移)的现象,也就是说,数据分布相同的假设在数据流中可能是无效的。一旦数据模式发生变化,建立在以前的、现在已经过时的数据基础上的训练有素的模型就无法为未来的数据提供准确的预测。为了获得可靠的预测,理解数据流中现有的模式以及在建模过程中了解当前示例所属的模式非常重要。
科研问题:
1.网络流量是非平稳数据,存在突变的几率高,现有的模型在个体数据突变时,应对能力不强。
2.现有的模型或方法难以准确预测非平稳环境中可能会发生模式转移的数据。
3.在进行模式归类时,将一个实例明确归为某一种模式是不明确的,会导致预测精度下降。
科研目的:
提出一种基于小波和模糊聚类的预测方法,能够有效的解决模式变换带来的预测精度下降问题,缓解非平稳数据中噪音对模型的影响,综合提高预测精度。
实验流程:
未来计划:
1.3.31之前完善实验,填补论文实验部分。
2.针对窗口长度的选择或者是自适应变化还有待进一步研究,可变长度的窗口必然可以提升精度,但是如何可变,还需要阅读相关论文进一步研究。
3.对于概念漂移来说,噪音的影响巨大,虽然用小波降噪来解决,可以查看是否有变体小波,可以针对该数据集,达到较好的效果。