收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于图神经网络的二进制函数相似度检测算法研究及实现

赵朋磊  
【摘要】:二进制函数相似度检测是指检测不同平台,不同编译器,不同优化选项,不同软件版本的两个二进制函数是否相似。因其能够在无法获得源码的情况下分析二进制函数,所以常用在网络安全和知识产权保护领域中,例如恶意软件分析,漏洞检测,版权纠纷等问题。现有检测方法一部分依赖于图匹配算法,这种方法时间复杂度高且难以迁移到新任务;另一部分是基于神经网络的图嵌入方法,这种方法将二进制函数转换成属性控制流程图,并将其输入到神经网络转换成高维向量。它通过将图匹配过程转换成向量之间的数值运算,提高了相似度的检测效率。但在当前的图嵌入方法中,对属性流程图的特征抽取方法通常是人工提取,会引入人为偏差,且在转换过程中没有考虑到不同结点的重要性差异,因此降低了转换过程的准确性。为了改进人工提取特征引入人为偏差的缺陷,本文设计并实现了基于标准化的无监督特征提取方法。该方法不仅能够避免产生人为偏差,还能够更好的迁移到不同的应用领域。另外本文基于传统的structure2vec网络,通过引入注意力机制来自动学习函数属性流程图中不同结点之间的影响权重。进一步提高了检测精确度。本文主要工作如下:1.提出通用的二进制函数相似度检测框架FuncSim。该框架兼容当前主流的检测方法,并具有高度的模块化和可扩展性。FuncSim将检测过程分为三个模块:流程图抽取模块,基本块特征提取模块及语义转换模块。2.提出基于标准化的无监督特征提取方法。将自然语言处理中的无监督表示方法引入到指令特征的学习过程,同时对指令进行标准化处理,降低指令的特异性,从而提高了指令特征学习性能。实验表明,相比于人工特征提取的方法,相似度检测AUC提升约5%。3.提出基于注意力机制的图语义转换网络。相比于传统的structure2vec,该网络在结点表示过程中不仅能够通过迭代学习邻域结点的信息,还能够自动学习邻域中不同结点对当前结点的权重系数,增强语义转换的准确性。实验表明,相比于structure2vec,本文提出的转换网络的相似度检测AUC提升约3%。


知网文化
【相似文献】
中国期刊全文数据库 前18条
1 张明红;佘廉;耿波;;基于情景的结构化突发事件相似度研究[J];中国管理科学;2017年01期
2 陈叶斐;张学军;黄卫东;;基于干扰相似度的多话题演化模型[J];电信科学;2017年09期
3 任雪利;代余彪;;软件相似度在成本估算中的应用[J];计算机应用与软件;2015年06期
4 谭明超;刁兴春;曹建军;冯径;;一种基于函数依赖的属性相似度调整算法[J];上海交通大学学报;2015年08期
5 陈立凤;;河马找亲戚[J];学生之友(童花果);2016年12期
6 周娴莉;;十个中文流行语翻译[J];初中生辅导;2016年36期
7 杜碧涵;;母爱[J];少年月刊;2017年05期
8 张呈宇;;热点话题相似度常用算法比较[J];好家长;2017年12期
9 仇丽青;陈卓艳;;基于共同邻居相似度的社区发现算法[J];信息系统工程;2014年05期
10 詹雪艳;林兆洲;段天璇;李磊;乔延江;;色谱指纹图谱相似度方法的适应性研究[J];中国中医药信息杂志;2012年05期
11 杨松;楼新远;;基于向量空间模型附加词义特征的句子相似度研究[J];成都信息工程学院学报;2012年03期
12 方文超;马怀礼;;中国-东盟自贸区二周年的比较研究——基于出口相似度与显性比较优势的分析[J];安徽行政学院学报;2012年03期
13 詹雪艳;史新元;段天璇;乔延江;;色谱指纹图谱相似度方法的研究进展[J];中国实验方剂学杂志;2011年02期
14 许鹏远;党延忠;;基于元相似度的推荐算法[J];计算机应用研究;2011年10期
15 支力佳;张少敏;赵大哲;赵宏;林树宽;;互信息启发的相似度组合图像检索算法[J];中国图象图形学报;2011年10期
16 吴雅妮;;相似度法在综合分析投资环境中的应用[J];统计与决策;2009年15期
17 徐晓静;李健;;静态粗相似度的特征[J];山东大学学报(理学版);2006年06期
18 霍明远 ,汪培庄;相似度求解的一般方法与应用[J];求是学刊;1986年01期
中国重要会议论文全文数据库 前10条
1 张乃岳;张学燕;;基于个体词语相似度的定制化动态信息检索[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 李红莲;潘建军;范京;;音节相似度及其在语音识别中的应用[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
3 丁维龙;吴水生;陈琦;程志君;;基于树形结构相似度的植物种类识别系统[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年
4 董刊生;方金云;;基于向量距离的词序相似度算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 郭瑛媚;史晓东;陈毅东;高燕;;基于词的话题分布相似度的无监督日文旅游意见词翻译[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
6 王茜;张卫星;;基于分类树相似度加权的协同过滤算法[A];2008年计算机应用技术交流会论文集[C];2008年
7 Peng Ding;Xin Yan;Zhihong Liu;Jiewen Du;Yuehua Xu;Qiong Gu;Jun Xu;;TarExplorer:基于三维相似度的活性小分子寻靶平台(英文)[A];中国化学会第30届学术年会摘要集-第二十五分会:化学信息学与化学计量学[C];2016年
8 刘晓平;陆劲挺;;任意功能树的物元相似度求解方法[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
9 刘海波;郑德权;赵铁军;;基于相似度线性加权方法的检索结果聚类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
10 罗辛;欧阳元新;熊璋;袁满;;通过相似度支持度优化基于K近邻的协同过滤算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
中国博士学位论文全文数据库 前10条
1 王玉标;基于动态信任建模的云服务可信性评估与选择研究[D];重庆大学;2018年
2 高欣健;多模态相似度学习方法研究[D];合肥工业大学;2017年
3 夏云庆;IHSMTS系统中启发式类比翻译处理机制(HATM)的设计与实现[D];中国科学院研究生院(计算技术研究所);2001年
4 武威;异质数据相似度学习及其在网络搜索中的应用[D];北京大学;2012年
5 张明西;信息网络中的相似度搜索问题研究[D];复旦大学;2013年
6 朱娜斐;基于RTT相似度的网络延迟估测理论和方法[D];北京工业大学;2012年
7 钱鹏飞;基于模糊相似度的异构本体映射、合并及校验方法的研究[D];上海交通大学;2008年
8 朱笑尘;异质过程数据集成与修复[D];清华大学;2015年
9 贾连印;内存数据库中集合相似度及集合包含问题的研究[D];华南理工大学;2012年
10 崔晓兰;面向在线抱怨自动处理的推荐方法研究[D];华中科技大学;2017年
中国硕士学位论文全文数据库 前10条
1 靳莉亚;基于威胁情报多维度分析的攻击组织关联与研判系统[D];国际关系学院;2019年
2 赵朋磊;基于图神经网络的二进制函数相似度检测算法研究及实现[D];浙江大学;2019年
3 薛曌;基于文本相似度的主观题自动评分系统的设计与实现[D];北京邮电大学;2019年
4 徐鑫鑫;基于WMD距离的文本相似度算法研究[D];太原理工大学;2019年
5 顾冲;社会化问答网站的社区发现及其服务推送研究[D];武汉理工大学;2018年
6 方敏;基于节点相似度的线要素匹配方法设计[D];北京建筑大学;2018年
7 张学理;基于多因子标签相似度的标签聚类算法的研究[D];辽宁大学;2018年
8 李凯翔;产科知识图谱的构建与研究[D];郑州大学;2018年
9 李超男;基于节点相似度的社会网络社团发现的算法研究[D];重庆师范大学;2018年
10 花凌锋;面向位置的移动新闻推荐研究[D];安徽理工大学;2018年
中国重要报纸全文数据库 前10条
1 杨林;住宿按“相似度”分 体现学生视角[N];北京日报;2017年
2 证券时报记者  韩如冰;基金投资相似度趋高[N];证券时报;2006年
3 胡可;婚姻VS事业相似度揭秘[N];中国妇女报;2019年
4 本报记者 王斌 本报实习生 蒲晓磊;版权局官员:相似度极高的不受保护[N];法制日报;2012年
5 记者 李学梅;研究证实:父亲“偏爱”与自己相像的孩子[N];新华每日电讯;2009年
6 天相投资顾问公司 张新文;风格稳定基金业绩更胜一筹[N];证券时报;2007年
7 记者 刘妮;曾维会见日本新任驻沈总领事[N];沈阳日报;2012年
8 小新;妊娠中毒症与夫妇HLA基因相似度有关[N];中国医药报;2007年
9 海潮;俄研究发现妊娠中毒症疑与夫妇HLA基因相似度有关[N];中国医药报;2007年
10 栾海;妊娠中毒症可能与夫妇 HLA基因相似度有关[N];医药经济报;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978