分类目录归档:报告摘要

2022-07-07 组会报告摘要-01

基于知识的虚假信息检测

科研背景

  • 近年来,随着社交媒体与社交平台的发展与普及,极大地改善了人们的生活质量,改变了人们对于信息的获取方式。然而,谣言、骗局、阴谋论等虚假信息的泛滥给社交网络和现实世界产生了恶劣的社会影响。因此,虚假信息检测作为目前热门的一个研究领域,受到了极大的关注。
  • 对于网络上存在的大量信息进行人工核查显然是不现实的。因此如何利用模型进行自动的虚假信息检测且检测结果具有较高的准确性是目前研究的一个热点。

科研问题

  • 如何有效且准确的借助外部信息。
  • 如何对词进行恰当的表示。

虚假信息检测流程

虚假信息检测流程图

整体思路

组会汇报内容

本次组会汇报的主要内容是关于融合文本的实验进展情况以及如何利用集成学习方法去融合知识图谱的一些想法。

2022-06-30-组会报告摘要-01

本次组会将会介绍关于基于时空图的综合能源系统短期电力多负荷预测的思路想法

科研背景:

  • 综合能源系统是一个集供电、供气、供冷和供热于一体的系统,是能源发展的重要趋势。
  • 构建综合能源系统,有助于(1)促进能源结构优化(2)激励可再生能源消费(3)提高能源利用率
  • 综合能源负荷的精确预测是对综合能源系统进行设计、运行和调度的基础,具有十分重要的现实意义。
  • 电力负荷:用电设备所消耗的电功率。热负荷:为保持建筑物要求的室内温度,补偿损失热量向房间供应的热量。冷负荷:为保持建筑物要求的室内温度,单位时间内需向房间供应的冷量。

科研问题:

对于现有综合能源多负荷的时空特征进行充分地挖掘利用.

科研目的:

通过构建时空特征图卷积的方法来对负荷的时空以及其他特性进行提取隐藏信息,提高负荷预测精度。

整体流程:

2022-06-30组会报告摘要-03

本次将会介绍有关《客服中心场景下基于情感分析的业务流程预测研究》的进展情况。主要内容如下:

科研背景:

  • 针对大型、复杂的业务流程,业务流程管理(BPM)有利于降低流程执行成本、有助于管理人员进行决策。预测性的业务流程监控(PBPM)是业务流程管理中的重要研究领域,近年来涌现出很多相关的研究工作与成果。
  • 业务流程预测分析已完成流程实例的事件日志,对正在运行的实例进行预测,以采取更为有效的资源调度等执行策略,避免不必要的损失,提升业务系统的整体性能。
  • 随着技术的发展和消费模式的升级,对于面向过程的服务,客服中心直接与客户交流互动,能够直接、客观地获取客户数据。企业通过分析对应的客户数据,及时发现问题改善问题,能优化流程,降低企业成本。客服中心已成为推动企业和政府等组织机构开展数字化和智能化转型的重要切入点。

科研问题:

  • 现有的研究认为,客户情绪与认知具有相关性,且明显影响着顾客满意度及后续行为。当前研究没有有效探索客服中心通话中的客户情绪对业务流程状态的影响;现有的业务流程预测方法多数针对特定的单任务预测问题。

科研目的:

  • 创新性的提出将客服中心感知的客户情绪数据应用到业务流程预测中,提出一种客服中心场景下基于情感分析技术的业务流程预测方法,对客户的发问意图、抒发情感、表达语义等进行识别和理解;
  • 此外,应用多任务学习方法实现模型参数共享,多个目标的模型联合训练,实现多个任务并行预测,缓解模型的过拟合,提高模型的泛化能力,并提升任务的预测精度。

流程框架:

实验结果-一维特征:

多任务学习:

实验结果-多任务学习:

2022-06-22组会报告摘要-01

本次组会将会介绍关于基于深度强化学习的工作流任务云调度研究进度并对未来研究进行展望,主要内容如下

科研背景
虚拟化技术推动了云计算的飞速发展。云计算为用户提供了提供了强大且低成本的计算和存储资源和各种平台化服务和优化功能,使得云服务逐渐成为搭建应用程序的主流选择之一。
随着越来越多的应用选择云环境,云服务面临的服务环境愈发复杂,不断增加的任务种类对云服务的服务质量要求不断提高,实现高效的资源管理成为云服务发展的主要方向之一,其中,任务调度优化对于提高资源利用率,降低服务成本,满足用户要求等方面具有关键作用。

科研问题:
如何实现云环境下对复杂任务的实时,高效,提供满足用户QoS要求的调度。

科研目的:
我们以工作流任务为研究对象,对于应用程序用户实时发出工作流任务请求,通过使用遗传算法和深度强化学习,优化任务响应时间和执行成本,实现在动态变化的云环境下高效的工作流任务调度。

研究框架

实验结果:

2022-06-23 组会报告摘要-02

这次组会主要介绍《融合LDA模型和情感特征的hashtag推荐》实验进展,《电力投诉文本数据挖掘及可视化》的后续想法分享。


研究背景:

在微博和其他社交媒体平台中,主题标签被用来给用户方便搜索,分类和传播帖子。帖子对用户来说并不总是那么容易,因此帖子通常没有主题标签情况下发布。


科研问题
推荐系统如何更充分地挖掘深层内容特征在下面三个方面:信息量、信息维度、提取能力。信息量:不同模态输入信息不同;信息维度:存在诸多影响因素;提取能力:去除噪声信息,强化重要信息特征。

研究目的:
让推荐系统更充分地挖掘用户或者话题深层内容特征信息,生成更加符合用户需求的hashtag。

实验说明:

此次组会一共做了两个实验,实验数据均为自己爬取构建。

实验一:融合LDA模型和文本情感特征的hashtag推荐;

实验二:电力投诉文本数据挖掘及可视化。

实验数据集:

实验一:

从近期热点话题中选择了四个情感色彩浓烈的热点话题:

情感正向积极的两个话题:

#遇见美好#时光温柔

#说走就走的旅行#带着微博去旅行

情感负向消极的两个话题:

#向航班失事遇难者默哀#愿你我起落平安

#长沙居民自建房倒塌#逝者安息

每个话题爬取100页各2000条左右数据(实际爬下来的数据略少),总共近8000条数据,大致按照8:2进行训练集和测试集划分,构建数据集进行实验。

实验二:

总共近4196条数据,包含三个特征,被投诉单位,投诉内容,投诉处理结果。

实验结果

实验一:

实验二:

后续研究计划

5.21-6.05 将目前多分类的标签预测,做成多标签预测

6.05-6.21 试着给模型增加情感向量 

6.23-7.23  提取更好LDA和情感特征向量,优化模型

7.23-8.23  开始构思论文框架

8.23-9.23   学习命名体识别、知识图谱构建相关知识

9.23-10.23  构建电力投诉文本知识图谱

2022-06-23 组会报告摘要-03

上一次组会报告中我介绍了我对我的研究《基于区块链的隐私保护电动汽车充电桩推荐系统》的研究进展报告,主要介绍了系统框架,系统流程,数学模型以及实验安排等。

本次汇报主要介绍,我自己对科研问题的理解,上次组会后对于系统框架的一些修改,以及实验结果。

本次汇报主要分为:科研背景、科研问题、科研目的、进度报告、实验结果、研究计划六大部分。

科研背景
传统的充电桩推荐算法并没有提供用户隐私保护方案,并且他们所采用的集中式架构存在着服务信任问题,恶意中心节点的存在会影响充电桩推荐系统结果,同时也会对用户隐私安全产生巨大威胁。

l目前车联网与区块链结合的研究中还没有针对电动汽车充电桩推荐过程的方案。将区块链技术引入电动汽车充电桩推荐过程中,用以解决可能会产生的服务信任问题,并且利用激励机制来鼓励用户参与到推荐过程中,保障系统的运行。

科研问题
1.传统集中式服务架构存在恶意中心节点影响系统服务质量;
2.用户位置信息隐私安全。

科研目的
提出基于区块链的电动汽车充电桩推荐系统,并且使用基于k匿名的电动汽车充电桩推荐算法来保证数据隐私。该系统能够在保证服务可信的同时为用户提供隐私安全的充电桩推荐服务。

进度报告

系统整体架构图
工作流

优化模型
采用多目标优化的方法确定目的充电桩,从车辆行驶距离与充电站车辆数目两大方面进行优化,优化目标函数为:                                              

1)车辆行驶距离优化目标

该优化目标是为了尽可能的缩短车辆行驶里程,减少用户行驶时间,具体优化函数如下:

2)充电站车辆数目优化目标

该优化目标是为了尽可能的利用充电站的充电资源,平均充电站车辆数目,具体优化函数如下:

实验结果

不同车辆数的系统通信成本
不同车辆数的系统时间成本
车辆隐私泄露概率
隐私保护算法对推荐结果的影响
优化前后车辆行驶里程对比
优化前后充电站利用情况

研究计划

时间任务
6.20-7.4完善论文,7.10前投递
7.4-7.18开展下一阶段工作,针对恶意用户提出解决方案并设计实验。

2022-06-16 组会报告摘要-02

在上一次组会报告中,我对我的研究《A QoS-Aware Job Scheduling Framework for Applications in Clouds: DQN Based Reinforcement Learning Algorithm with Preemption
》进行了初步的介绍。目前该研究的相关实验已经基本完成,并且正在撰写论文,因此本次组会汇报将围绕我的研究内容以及写作分为三部分介绍,首先是对于文章背景,科研目的,公式以及框架等内容的回顾;其次是对于实验最终结果的汇报;最后会和大家分享一些最近写作的感想以及分享比较好用的写作网站。具体内容如下:

第一大部分

研究背景:

因此,随着云服务市场规模的不断扩大,越来越多的公司选择将自己的应用迁移到云服务平台上进行,然而,这同时也带来了相应的挑战,首先由于在云平台上加载的工作流的大小在不断的变化,对于云服务供应商而言难以去追踪每一个工作流的服务质量。其次,云服务供应商可以提供多种类型的虚拟机,例如高计算性能或高内存的虚拟机实例,并且每一个虚拟机实体的计算性能各不相同,与此同时,基于云服务平台的应用不仅需要执行用户所提交的任务,同时也需要满足用户对于该应用的服务质量要求。

科研目的:

因为云服务供应商无法提供类似的优化,因此我们希望设计基于深度强化学习的框架,能够让应用学会自己来进行实时任务的调度,并且能够满足用户的期望,即在用户所期待的最长执行之间之内完成任务。

与此同时,为了进一步提升任务执行的成功率,我们提出了一种抢占机制,并把这种抢占机制应用到了即将超过用户期待时间的任务中,从而进一步提高任务的成功率。

框架:

第二大部分实验结果:

首先是在不同任务到达率情况下任务的成功率以及任务的相应时间,其中肉色的bar代表我们自己的方法:

在不同任务到达率的情况下,不同任务调度方法的任务成功率
在不同任务到达率的情况下,不同任务调度方法的平均响应时间

其次是在任务类型(computing intensive/ I/O intensive)比例不同的情况下,不同任务调度方法的成功率与响应时间:

在不同任务类型比例的情况下,不同任务调度方法的任务成功率
在不同任务类型比例的情况下,不同任务调度方法的平均响应时间

在最终的第三部分,想和大家分享一下最近写文章的时候,通过自己的一些亲身体会,谈谈对于先写英文再翻译成中文与直接用英文写的差别,以及如何克服类似一用英文写文章就没有什么头绪等等的问题。

2022-06-16 组会报告摘要-01

本次组会将会介绍阅读论文后产生的想法思路《基于索引的区块链数据快速查询方法》,主要从以下几个方面介绍:

科研背景

  • 区块链数据管理:区块链本质上是一种多方参与共同维护的分布式数据库,采用去中心化或者弱中心化的数据管理模式,分布式数据管理是区块链系统的主要功能之一。
  • 区块链数据查询处理:数据索引是解决数据查询访问性能的关键技术,区块链系统也同样使用索引来提高交易记录的访问效率。数据查询服务必须满足的要求:查询结果集未被篡改;完整性可验证。
  • 区块链链上查询:区块查询;追溯查询;关系查询

科研问题

  • 针对全节点,数据语义的缺失使得区块链系统难以支持复杂查询。
  • 追溯查询可以通过扫描所有区块并检查区块中的所有交易实现,但这种方式查询效率低。

科研目的

  • 针对全节点,通过添加语义信息,支持区块数据上的丰富查询。
  • 对于追溯查询,设计索引提升查找效率。

研究内容

区块链链式结构

索引设计

2022-06-09 组会报告摘要02

基于比特币交易混合服务中的异常用户检测

作为第一个去中心化点对点加密货币系统,比特币近年来变得越来越流行。然而,比特币的 P2P 和匿名性质使得该平台上的交易非常难以追踪,从而引发了比特币生态系统中各种非法活动的出现。特别是,比特币中的混合服务,最初旨在增强交易匿名性,但目前已被广泛用于洗钱,被盗的比特币通常需要通过混合服务清洗成“干净”的比特币,然后兑现。如BitcoinLaunder、HelixMixer、BitcoinFog等都参与了这一洗钱过程,并被视为隐藏比特币非法利润的重要工具,使追踪非法资金的过程复杂化。

框架