2022-06-23 组会报告摘要-03

上一次组会报告中我介绍了我对我的研究《基于区块链的隐私保护电动汽车充电桩推荐系统》的研究进展报告,主要介绍了系统框架,系统流程,数学模型以及实验安排等。

本次汇报主要介绍,我自己对科研问题的理解,上次组会后对于系统框架的一些修改,以及实验结果。

本次汇报主要分为:科研背景、科研问题、科研目的、进度报告、实验结果、研究计划六大部分。

科研背景
传统的充电桩推荐算法并没有提供用户隐私保护方案,并且他们所采用的集中式架构存在着服务信任问题,恶意中心节点的存在会影响充电桩推荐系统结果,同时也会对用户隐私安全产生巨大威胁。

l目前车联网与区块链结合的研究中还没有针对电动汽车充电桩推荐过程的方案。将区块链技术引入电动汽车充电桩推荐过程中,用以解决可能会产生的服务信任问题,并且利用激励机制来鼓励用户参与到推荐过程中,保障系统的运行。

科研问题
1.传统集中式服务架构存在恶意中心节点影响系统服务质量;
2.用户位置信息隐私安全。

科研目的
提出基于区块链的电动汽车充电桩推荐系统,并且使用基于k匿名的电动汽车充电桩推荐算法来保证数据隐私。该系统能够在保证服务可信的同时为用户提供隐私安全的充电桩推荐服务。

进度报告

系统整体架构图
工作流

优化模型
采用多目标优化的方法确定目的充电桩,从车辆行驶距离与充电站车辆数目两大方面进行优化,优化目标函数为:                                              

1)车辆行驶距离优化目标

该优化目标是为了尽可能的缩短车辆行驶里程,减少用户行驶时间,具体优化函数如下:

2)充电站车辆数目优化目标

该优化目标是为了尽可能的利用充电站的充电资源,平均充电站车辆数目,具体优化函数如下:

实验结果

不同车辆数的系统通信成本
不同车辆数的系统时间成本
车辆隐私泄露概率
隐私保护算法对推荐结果的影响
优化前后车辆行驶里程对比
优化前后充电站利用情况

研究计划

时间任务
6.20-7.4完善论文,7.10前投递
7.4-7.18开展下一阶段工作,针对恶意用户提出解决方案并设计实验。

2022-06-16 组会报告摘要-02

在上一次组会报告中,我对我的研究《A QoS-Aware Job Scheduling Framework for Applications in Clouds: DQN Based Reinforcement Learning Algorithm with Preemption
》进行了初步的介绍。目前该研究的相关实验已经基本完成,并且正在撰写论文,因此本次组会汇报将围绕我的研究内容以及写作分为三部分介绍,首先是对于文章背景,科研目的,公式以及框架等内容的回顾;其次是对于实验最终结果的汇报;最后会和大家分享一些最近写作的感想以及分享比较好用的写作网站。具体内容如下:

第一大部分

研究背景:

因此,随着云服务市场规模的不断扩大,越来越多的公司选择将自己的应用迁移到云服务平台上进行,然而,这同时也带来了相应的挑战,首先由于在云平台上加载的工作流的大小在不断的变化,对于云服务供应商而言难以去追踪每一个工作流的服务质量。其次,云服务供应商可以提供多种类型的虚拟机,例如高计算性能或高内存的虚拟机实例,并且每一个虚拟机实体的计算性能各不相同,与此同时,基于云服务平台的应用不仅需要执行用户所提交的任务,同时也需要满足用户对于该应用的服务质量要求。

科研目的:

因为云服务供应商无法提供类似的优化,因此我们希望设计基于深度强化学习的框架,能够让应用学会自己来进行实时任务的调度,并且能够满足用户的期望,即在用户所期待的最长执行之间之内完成任务。

与此同时,为了进一步提升任务执行的成功率,我们提出了一种抢占机制,并把这种抢占机制应用到了即将超过用户期待时间的任务中,从而进一步提高任务的成功率。

框架:

第二大部分实验结果:

首先是在不同任务到达率情况下任务的成功率以及任务的相应时间,其中肉色的bar代表我们自己的方法:

在不同任务到达率的情况下,不同任务调度方法的任务成功率
在不同任务到达率的情况下,不同任务调度方法的平均响应时间

其次是在任务类型(computing intensive/ I/O intensive)比例不同的情况下,不同任务调度方法的成功率与响应时间:

在不同任务类型比例的情况下,不同任务调度方法的任务成功率
在不同任务类型比例的情况下,不同任务调度方法的平均响应时间

在最终的第三部分,想和大家分享一下最近写文章的时候,通过自己的一些亲身体会,谈谈对于先写英文再翻译成中文与直接用英文写的差别,以及如何克服类似一用英文写文章就没有什么头绪等等的问题。

2022-06-16 组会报告摘要-01

本次组会将会介绍阅读论文后产生的想法思路《基于索引的区块链数据快速查询方法》,主要从以下几个方面介绍:

科研背景

  • 区块链数据管理:区块链本质上是一种多方参与共同维护的分布式数据库,采用去中心化或者弱中心化的数据管理模式,分布式数据管理是区块链系统的主要功能之一。
  • 区块链数据查询处理:数据索引是解决数据查询访问性能的关键技术,区块链系统也同样使用索引来提高交易记录的访问效率。数据查询服务必须满足的要求:查询结果集未被篡改;完整性可验证。
  • 区块链链上查询:区块查询;追溯查询;关系查询

科研问题

  • 针对全节点,数据语义的缺失使得区块链系统难以支持复杂查询。
  • 追溯查询可以通过扫描所有区块并检查区块中的所有交易实现,但这种方式查询效率低。

科研目的

  • 针对全节点,通过添加语义信息,支持区块数据上的丰富查询。
  • 对于追溯查询,设计索引提升查找效率。

研究内容

区块链链式结构

索引设计

2022-06-09 组会报告摘要02

基于比特币交易混合服务中的异常用户检测

作为第一个去中心化点对点加密货币系统,比特币近年来变得越来越流行。然而,比特币的 P2P 和匿名性质使得该平台上的交易非常难以追踪,从而引发了比特币生态系统中各种非法活动的出现。特别是,比特币中的混合服务,最初旨在增强交易匿名性,但目前已被广泛用于洗钱,被盗的比特币通常需要通过混合服务清洗成“干净”的比特币,然后兑现。如BitcoinLaunder、HelixMixer、BitcoinFog等都参与了这一洗钱过程,并被视为隐藏比特币非法利润的重要工具,使追踪非法资金的过程复杂化。

框架

2022-06-09 组会报告摘要03

本次组会将进行《网络安全威胁情报文本信息抽取研究》研究进展情况,报告内容分为:科研背景,科研问题,提示学习方案选择、提示学习训练的步骤,提示学习实验结果和最近遇到的问题。其主要内容如下:

科研背景:

  • 由于攻击或者恶意软件的变种层出不穷,为了应对这些攻击或者恶意软件而产生的网络威胁情报也与日俱增。随之而来的是各种专有名词不断涌现,而且普遍存在大量的缩写词,人工识别费时费力,并且实体之间的关系难以界定。
  • 作为信息提取任务的基本组成部分,命名实体识别在自然语言处理 (NLP) 任务中发挥着非常重要的作。NER 任务由两部分组成:识别实体类型和检测实体边界。实体边界检测是指确定一个实体的范围。检测实体边界是将相应类别的标签赋予文本中待识别的实体。
  • l提示学习通过使用人工设计提示模板 (prompt template) 和 答案模板 (answer template)使用预训练模型,在最近的几项NLP相关任务中取得了很好的效果。

科研问题:

  • 对网络安全威胁情报的即时分析是安全专家面临的一个挑战,因为每天生成的网络信息量无法估量。这就需要自动化的信息抽取工具来准确地抽取威胁情报所隐含的信息,继而构建网络安全三元组构建知识图谱来方便查询和检索数据。

提示学习:

宏观图景框架:

由于提示学习的特性,准备利用提示学习构建命名实体识别模型,构造命名实体识别模板,通过提示学习完成威胁情报句子中的实体类型。之后对于存在两个实体以上的句子利用提示学习方法来完成网络安全三元组的抽取。

2022-06-09组会报告摘要-01

本次组会汇报最近关于区块链项目以及论文的一些进展情况:

主要从科研背景、异常交易监测相关研究、方法、个人思考和总结几个方面展开介绍

科研背景

区块链交易存在各类异常交易,比如钓鱼攻击、ICO攻击等异常交易类型,这类交易和普通交易的问题存在以下差异:
交易品类
数字货币:去中心化
流通货币 :中心化
交易特点
流通货币:犯罪分子会尽可能地隐藏手机号、电子邮箱、银行账号等敏感信息来实施非法交易活动
数字货币:匿名性 无需使用以上敏感信息即可开展活动,提高了对违法犯罪活动的监测难度
交易机制
数字货币:基于加密算法进行研究

相关工作 目前针对异常交易检测的方法可以归纳为以下类别:

参考文献方法方法描述
基于聚类或者分类模型检测异常交易
2基于One Class SVM, K-means 应用交易特征行为分析,利用SVM分类出正常以及异常交易地址,并进一步检测出攻击类型;
5高斯混合模型根据交易分析用户特征,对用户进行分类并区分出正常用户或者异常用户;验证异常交易;
6基于机器学习异常交易检测算法使用“椭圆数据集”,使用各类机器学习算法验证检测比特币异常交易并选择合适的超参数。
基于网络特征分析的异常交易检测方法
8提出BTCOut检测算法融合“网络结构”+“属性”的相似性结构综合策略,衡量网络之间的特征,获取较好的特征挖掘效果;
9基于注意力机制的GNN模型综合交易网络的结构信息和交易记录中的时间信息,采用注意力机制细化网络结构,并捕获隐藏的时间特征以实现精确结果;
3基于特征融合的异常检测在交易网络中,融合自身特征以及相邻特征,基于交互关系形成的机制挖掘网络信息
基于随机游走网络嵌入的异常交易检测方法
1NetWalk通过学习网络拓扑结构特征,并动态更新网络结构并检测网络异常
10基于多重图和时间-金额游走 将交易记录构造成包含时间、金额的网络,并基于随机游走保留交易图中这两个重要属性,随后对向量化的图进行模型训练。

方法:

针对已有模型关键问题有

数据不平衡以及负采样问题这是目前可以迭代优化的地方

个人思考和总结

目前使用的是针对网络结构随机游走,目前效果较好的应用于属性-结构二部图网络学习模型等方法,可以作为进一步研究点。

2022-06-02 组会报告摘要-03

本次将会介绍有关《客服中心场景下基于情感分析的业务流程预测研究》的进展情况。主要内容如下:

科研背景:

  • 针对大型、复杂的业务流程,业务流程管理(BPM)有利于降低流程执行成本、有助于管理人员进行决策。预测性的业务流程监控(PBPM)是业务流程管理中的重要研究领域,近年来涌现出很多相关的研究工作与成果。
  • 业务流程预测分析已完成流程实例的事件日志,对正在运行的实例进行预测,以采取更为有效的资源调度等执行策略,避免不必要的损失,提升业务系统的整体性能。
  • 随着技术的发展和消费模式的升级,对于面向过程的服务,客服中心直接与客户交流互动,能够直接、客观地获取客户数据。企业通过分析对应的客户数据,及时发现问题改善问题,能优化流程,降低企业成本。客服中心已成为推动企业和政府等组织机构开展数字化和智能化转型的重要切入点。

科研问题:

  • 现有的研究认为,客户情绪与认知具有相关性,且明显影响着顾客满意度及后续行为。当前研究没有有效探索客服中心通话文本中的客户情绪对业务流程状态的影响。
  • 没有对比多种主流深度学习模型对业务流程预测效果的影响。

科研目的:

  • 引入客户情感:创新性的提出将客服中心感知的客户情绪数据应用到业务流程预测中,提出一种客服中心场景下基于情感分析技术的业务流程预测方法,对客户的发问意图、抒发情感、表达语义等进行识别和理解,针对多个任务提高流程预测精度。
  • 多模型比较:对比CNN、LSTM、Transformer预测模型在业务流程预测上的效果。

流程框架:

实验结果: