收藏本站
收藏 | 论文排版

基于信息增益的软件特征技术研究

李菲菲  
【摘要】:软件产品是一种具有易复制、易篡改、易散布等特性的数字产品,使得软件盗版蕴含着巨大的经济利益。针对软件盗版在我国呈现猖獗势头,软件版权保护技术成为近年来软件开发商和学术界的研究热点。软件特征技术以自身所固有的属性或属性集作为研究对象,并采用特定的方法将其提取出来作为软件产品的唯一标识,是软件版权保护的重要手段之一。本文首先对软件特征技术的研究现状进行论述,在现有技术的基础上,然后针对SKB(Static k-gram based Software Birthmark)特征鲁棒性差的问题,利用信息检索时文本分类进行特征选择的思想,引入了一种新的软件特征选择方法--信息增益;最后又针对信息增益方法自身存在的问题和不足提出了解决方案。具体内容包括:(1)本文构建由盗版软件类别和无版权争议的软件类别组成的软件集,首先对软件集中每个软件进行静态分析,采用k-gram算法进行软件特征提取,由此得到的特征碎片集合维度高,采用信息增益方法对特征碎片集进行筛选和降维,去除冗余碎片,减少计算量,有效提升软件特征的整体性能。(2)信息增益方法选取的是在两类软件集中频数差别大的特征碎片,因此具有高信息增益的特征碎片是整个特征碎片集中具有最高区分度的碎片。但此方法仅考虑特征碎片在某类别中出现的样本数,忽视了特征碎片具体在软件样本中出现的频数,影响结果的精准度。其次,特征碎片的信息增益值越大,说明特征碎片在两类软件集中出现的频数差别越大,这将导致最终选出的特征碎片集可能会出现分布不平衡的问题。针对这些不足本文还考虑特征碎片类别频率(在所属类别中出现的频率)这一影响因子,对传统信息增益方法进行了改进。(3)进行设计实验,从可信性和鲁棒性两个方面对特征选择算法进行评估,并与两个典型的软件特征技术WPP特征和TaNaMM特征进行比较。从实验结果可以看出,本文提出的基于信息增益的软件特征,具有很高的可信性和鲁棒性,可以有效的检测软件盗版。


知网文化
【相似文献】
中国期刊全文数据库 前16条
1 董立岩;李真;周灵艳;;特定信息增益决策森林分类器研究[J];计算机工程与应用;2010年26期
2 孟保成,苏莉华;应用综合信息增益法提取短期地震前兆[J];华南地震;1998年04期
3 沈萍,冯国政;信息增益在地震趋势估计中的应用[J];中国地震;1996年04期
4 李丹华;袁晔;王帅军;;基于数字几何信息增益的服装3D人体特征识别[J];北京服装学院学报(自然科学版);2016年02期
5 范艳峰;杨志晓;;可信网络中基于动态信息增益的多维属性决策[J];计算机应用研究;2012年01期
6 陈彤生;胡雪琴;李绍滋;周昌乐;;以信息增益模式探讨在高维数据上的多类别证型分类[J];心智与计算;2007年03期
7 张永兵;杨理伟;吴永丽;张永飞;;利用熵信息增益分析疾病诊断因子作用[J];中国卫生统计;2006年06期
8 白云晖;;基于信息增益特征选取和覆盖的中文文本分类[J];福建电脑;2008年07期
9 王亚东,郭茂祖,钱国良;一种基于信息增益与费用评价函数的特征选择准则[J];计算机研究与发展;1999年07期
10 刘亚琦;;基于属性相关分析中的信息增益计算——五年制高职与三年制高职教育的比较[J];科技创新导报;2008年27期
11 任永功;杨荣杰;尹明飞;马名威;;基于信息增益的文本特征选择方法[J];计算机科学;2012年11期
12 李文斌;刘椿年;陈嶷瑛;;基于特征信息增益权重的文本分类算法[J];北京工业大学学报;2006年05期
13 邱宁佳;高鹏;王鹏;陶跃;;基于改进信息增益的ACO-WNB分类算法研究[J];计算机仿真;2019年01期
14 任永功;杨雪;杨荣杰;胡志冬;;基于信息增益特征关联树的文本特征选择算法[J];计算机科学;2013年10期
15 潘若愚,韩晓峰;一种基于信息增益的产品评价系统模型[J];合肥工业大学学报(自然科学版);2003年S1期
16 李虹利;蒙祖强;;运用信息增益和不一致度进行填补的属性约简算法[J];计算机科学;2018年10期
中国重要会议论文全文数据库 前10条
1 戚犇;王梦迪;;基于信息增益的贝叶斯态势要素提取[A];第32次全国计算机安全学术交流会论文集[C];2017年
2 王孟;白清源;谢丽聪;谢伙生;张莹;;基于信息增益规则排序的关联文本分类[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
3 陈晶晶;;C4.5经典分类算法的研究与改进[A];荆楚学术2016年第四期 (总第五期)[C];2016年
4 覃朗;朱建军;衣柏衡;周新民;;非均衡数据下基于信息增益的SMOTE改进SVM模型研究[A];第十八届中国管理科学学术年会论文集[C];2016年
5 邓宾;余正涛;韩露;车文刚;郭剑毅;;基于信息增益改进贝叶斯词义消歧模型[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 陆玉清;洪宇;陆军;姚建民;朱巧明;;基于上下文的真词错误检查及校对方法[A];第六届全国信息检索学术会议论文集[C];2010年
7 胡海斌;邱明;姜青山;胡海龙;赵新星;;一种基于数据继承关系的C4.5分类优化算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
8 田伟;丁妮;;基于决策树的入侵检测技术[A];普适计算及其软件新技术——第三届长三角计算机科技论坛文集[C];2006年
9 刘惠;邱天爽;;基于模糊集理论和信息增益分析技术的分类算法[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
10 刘鹏;雷蕾;张雪凤;;缺失数据处理方法的比较研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
中国博士学位论文全文数据库 前1条
1 赵冲冲;基于支持向量机的旋转机械故障诊断[D];西北工业大学;2003年
中国硕士学位论文全文数据库 前10条
1 李菲菲;基于信息增益的软件特征技术研究[D];郑州大学;2014年
2 张方钊;基于改进的信息增益和LDA的文本分类研究[D];吉林大学;2018年
3 辛雅斐;蚁群算法中基于信息增益的信息素值的分析与改进[D];暨南大学;2008年
4 亓孟雅;基于信息增益的决策树算法的分析与改进[D];华中科技大学;2015年
5 施欢欢;面向招标项目名称的中文短文本分类技术研究[D];南京财经大学;2017年
6 邓蓓蓓;基于信息增益的量化算法及其在决策树中应用的研究[D];广东工业大学;2016年
7 陈小莉;基于信息增益的中文特征提取算法研究[D];重庆大学;2008年
8 王荣;分类技术及其在客户关系管理中的应用[D];浙江大学;2006年
9 朱琳;基于分类算法的用户推荐方法研究及应用[D];北京邮电大学;2017年
10 甄灵敏;基于属性权重和标记记录的实体解析技术[D];东北大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978