2022-07-07 组会报告摘要02

科研背景

随着信息技术与互联网科技的髙速发展,我们的日常生活越来越离不开互联网,但与此同时,网络攻击也变得更加频繁。目前市面上已经有不少网络安全设备,如IDS,然而,由于IDS所产生的警报数量非常庞大,少部分的有用信息隐藏在海量的告警日志中。因此,通过对告警日志进行误报消除、关联分析,挖掘出隐藏其中的攻击模式,还原攻击场景,从而发现攻击的真实意图,能够更加有效的防范攻击行为。

科研问题

告警信息冗余:IDS产生海量的告警数据,使得安全管理人员不能聚焦到关键的告警。

现有的告警关联方法大多存在需要不同程度的专家知识。

科研方法

引入网络安全事件知识图谱来处理告警信息,并与通用安全事件知识图谱进行融合。

采用多因素分析的告警关联方式。

主要思路

2022-07-07 组会报告摘要-01

基于知识的虚假信息检测

科研背景

  • 近年来,随着社交媒体与社交平台的发展与普及,极大地改善了人们的生活质量,改变了人们对于信息的获取方式。然而,谣言、骗局、阴谋论等虚假信息的泛滥给社交网络和现实世界产生了恶劣的社会影响。因此,虚假信息检测作为目前热门的一个研究领域,受到了极大的关注。
  • 对于网络上存在的大量信息进行人工核查显然是不现实的。因此如何利用模型进行自动的虚假信息检测且检测结果具有较高的准确性是目前研究的一个热点。

科研问题

  • 如何有效且准确的借助外部信息。
  • 如何对词进行恰当的表示。

虚假信息检测流程

虚假信息检测流程图

整体思路

组会汇报内容

本次组会汇报的主要内容是关于融合文本的实验进展情况以及如何利用集成学习方法去融合知识图谱的一些想法。

2022-06-30-组会报告摘要-01

本次组会将会介绍关于基于时空图的综合能源系统短期电力多负荷预测的思路想法

科研背景:

  • 综合能源系统是一个集供电、供气、供冷和供热于一体的系统,是能源发展的重要趋势。
  • 构建综合能源系统,有助于(1)促进能源结构优化(2)激励可再生能源消费(3)提高能源利用率
  • 综合能源负荷的精确预测是对综合能源系统进行设计、运行和调度的基础,具有十分重要的现实意义。
  • 电力负荷:用电设备所消耗的电功率。热负荷:为保持建筑物要求的室内温度,补偿损失热量向房间供应的热量。冷负荷:为保持建筑物要求的室内温度,单位时间内需向房间供应的冷量。

科研问题:

对于现有综合能源多负荷的时空特征进行充分地挖掘利用.

科研目的:

通过构建时空特征图卷积的方法来对负荷的时空以及其他特性进行提取隐藏信息,提高负荷预测精度。

整体流程:

2022-06-30组会报告摘要-03

本次将会介绍有关《客服中心场景下基于情感分析的业务流程预测研究》的进展情况。主要内容如下:

科研背景:

  • 针对大型、复杂的业务流程,业务流程管理(BPM)有利于降低流程执行成本、有助于管理人员进行决策。预测性的业务流程监控(PBPM)是业务流程管理中的重要研究领域,近年来涌现出很多相关的研究工作与成果。
  • 业务流程预测分析已完成流程实例的事件日志,对正在运行的实例进行预测,以采取更为有效的资源调度等执行策略,避免不必要的损失,提升业务系统的整体性能。
  • 随着技术的发展和消费模式的升级,对于面向过程的服务,客服中心直接与客户交流互动,能够直接、客观地获取客户数据。企业通过分析对应的客户数据,及时发现问题改善问题,能优化流程,降低企业成本。客服中心已成为推动企业和政府等组织机构开展数字化和智能化转型的重要切入点。

科研问题:

  • 现有的研究认为,客户情绪与认知具有相关性,且明显影响着顾客满意度及后续行为。当前研究没有有效探索客服中心通话中的客户情绪对业务流程状态的影响;现有的业务流程预测方法多数针对特定的单任务预测问题。

科研目的:

  • 创新性的提出将客服中心感知的客户情绪数据应用到业务流程预测中,提出一种客服中心场景下基于情感分析技术的业务流程预测方法,对客户的发问意图、抒发情感、表达语义等进行识别和理解;
  • 此外,应用多任务学习方法实现模型参数共享,多个目标的模型联合训练,实现多个任务并行预测,缓解模型的过拟合,提高模型的泛化能力,并提升任务的预测精度。

流程框架:

实验结果-一维特征:

多任务学习:

实验结果-多任务学习:

2022-06-22组会报告摘要-01

本次组会将会介绍关于基于深度强化学习的工作流任务云调度研究进度并对未来研究进行展望,主要内容如下

科研背景
虚拟化技术推动了云计算的飞速发展。云计算为用户提供了提供了强大且低成本的计算和存储资源和各种平台化服务和优化功能,使得云服务逐渐成为搭建应用程序的主流选择之一。
随着越来越多的应用选择云环境,云服务面临的服务环境愈发复杂,不断增加的任务种类对云服务的服务质量要求不断提高,实现高效的资源管理成为云服务发展的主要方向之一,其中,任务调度优化对于提高资源利用率,降低服务成本,满足用户要求等方面具有关键作用。

科研问题:
如何实现云环境下对复杂任务的实时,高效,提供满足用户QoS要求的调度。

科研目的:
我们以工作流任务为研究对象,对于应用程序用户实时发出工作流任务请求,通过使用遗传算法和深度强化学习,优化任务响应时间和执行成本,实现在动态变化的云环境下高效的工作流任务调度。

研究框架

实验结果:

2022-06-23 组会报告摘要-02

这次组会主要介绍《融合LDA模型和情感特征的hashtag推荐》实验进展,《电力投诉文本数据挖掘及可视化》的后续想法分享。


研究背景:

在微博和其他社交媒体平台中,主题标签被用来给用户方便搜索,分类和传播帖子。帖子对用户来说并不总是那么容易,因此帖子通常没有主题标签情况下发布。


科研问题
推荐系统如何更充分地挖掘深层内容特征在下面三个方面:信息量、信息维度、提取能力。信息量:不同模态输入信息不同;信息维度:存在诸多影响因素;提取能力:去除噪声信息,强化重要信息特征。

研究目的:
让推荐系统更充分地挖掘用户或者话题深层内容特征信息,生成更加符合用户需求的hashtag。

实验说明:

此次组会一共做了两个实验,实验数据均为自己爬取构建。

实验一:融合LDA模型和文本情感特征的hashtag推荐;

实验二:电力投诉文本数据挖掘及可视化。

实验数据集:

实验一:

从近期热点话题中选择了四个情感色彩浓烈的热点话题:

情感正向积极的两个话题:

#遇见美好#时光温柔

#说走就走的旅行#带着微博去旅行

情感负向消极的两个话题:

#向航班失事遇难者默哀#愿你我起落平安

#长沙居民自建房倒塌#逝者安息

每个话题爬取100页各2000条左右数据(实际爬下来的数据略少),总共近8000条数据,大致按照8:2进行训练集和测试集划分,构建数据集进行实验。

实验二:

总共近4196条数据,包含三个特征,被投诉单位,投诉内容,投诉处理结果。

实验结果

实验一:

实验二:

后续研究计划

5.21-6.05 将目前多分类的标签预测,做成多标签预测

6.05-6.21 试着给模型增加情感向量 

6.23-7.23  提取更好LDA和情感特征向量,优化模型

7.23-8.23  开始构思论文框架

8.23-9.23   学习命名体识别、知识图谱构建相关知识

9.23-10.23  构建电力投诉文本知识图谱