收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

中文Web信息作者同一认定技术研究

马建斌  
【摘要】: 随着互联网的日益普及,网上出现了各种各样的Web信息,比如:网上论坛、博客、电子邮件等,这些信息成为人们生活和工作中重要的信息来源。然而,这些Web信息给人们带来便利的同时,也产生许多问题,比如:某些人通过网上论坛、博客及电子邮件等手段发布反动、诈骗、色情、威胁、赌博等违法信息,网络为违法犯罪分子提供了新的犯罪空间和手段,造成极其恶劣的影响,严重影响社会的稳定以及国家和政府的安全。 目前,抵制这种现象的主要方法就是安装过滤软件,把包含敏感词汇的信息过滤掉,但是,这种被动防御的方法不能杜绝非法Web信息的现象,因为,犯罪分子会使用一些替代词汇,突破过滤软件的防御。通过立法手段,追究犯罪分子的刑事责任,可以有力地打击这种犯罪行为,国家已经出台多项相关法律,有法可依,但是,由于缺乏有效的证据,而使类似案件无法立案侦查。如果能同一认定Web信息的作者,找出犯罪分子的犯罪证据,为计算机取证提供证据,对司法办案和促进社会的安全与稳定、净化网络环境都具有重要的应用价值和现实意义。 本文利用写作风格学的原理和技术,研究Web信息作者的写作风格,提取能代表作者写作特点的写作特征,利用机器学习算法自动辨别出作者的真实身份。本文的研究集中在以下几个方面:(1)对Web信息作者身份识别相关研究领域的国内外现状进行了全面、详细地调研和分析,提出Web信息作者身份识别的系统模型和系统框架;(2)针对Web页面和E-mail信息,提出本文对Web信息内容的提取方法;(3)提取能表达Web信息作者的写作特点的三方面特征,包括语言特征、结构特征和格式特征;(4)对支持向量机算法进行了改进,提出基于相似度的渐进直推支持向量机算法(PSTSVM),使其适合小样本分类识别;(5)研究和开发了中文Web信息作者识别实验系统;(6)为了调查犯罪分子的社会关系,对社会关系网络进行了研究,提出了基于作者身份真实性判断的社会关系网络建立方法。 为了验证本文提出的研究方法的有效性,搜集大量数据,设置多个实验,对本研究各种影响因素进行了验证。实验结果表明,本研究提出的三种特征提取方法是有效的,而且各种特征的特征组合比用单个特征的效果更好,文学作品、Blog、电子邮件数据集的分类识别正确率超过86%,实验结果表明本研究所提出的方法是有效的,此方法用于计算机取证是切实可行的。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 周粤,钱士钧;一种用gform程序实现主页中交互性表格数据的方法[J];微型机与应用;1998年01期
2 李方敏;CGI的安全编程[J];计算机工程与应用;1999年06期
3 宋如顺,姜乃松;基于Web的远程考试系统设计与实现[J];计算机工程;1999年06期
4 王红霞,姚家亮;利用ASP构建新型信息系统的方法与实现[J];计算机应用;1999年09期
5 邓劲生,张银福;面向对象的多媒体信息WEB发布[J];计算机应用研究;1999年09期
6 刁兴春,李赤红;Intranet环境下事务处理的理论研究和实现[J];小型微型计算机系统;1999年06期
7 高昆;基于ASP的WEB站点开发技术分析[J];北华大学学报(社会科学版);1999年05期
8 王清心,胡建华;经贸数据库的WEB集成发布[J];昆明理工大学学报;1999年02期
9 李晶,朱秋萍;Web页制作中的动态表现技术[J];计算机工程;2000年06期
10 刘波,代亚非,杜跃进;远程协同教学系统中课程搜索子系统设计[J];计算机应用;2000年06期
11 武庄,刘友丹;基于Web的企业内部质量审核系统设计与实现[J];计算机应用研究;2000年05期
12 梁开健,刘新民;基于ASP的图书馆Web数据库开发[J];高校图书馆工作;2000年04期
13 张睿光,黄玉超;基于ASP技术的气象信息系统软件设计[J];河南气象;2000年01期
14 张少敏,王保义;基于Web的管理信息系统方案及其安全性[J];华北电力大学学报;2001年01期
15 刘国华,包宏,李文超;基于WEB的人工神经网络材料设计系统[J];计算机工程与应用;2001年20期
16 冯晓君,李也白;构建Internet环境下的CAI课件数据库系统[J];计算机应用;2001年03期
17 陈扬枝,张见威;基于Web的机械设计材料库系统[J];现代制造工程;2001年12期
18 沈祥玖,李作纬,宋义发,尹涛;利用ASP实现对Web数据库的访问[J];济南交通高等专科学校学报;2001年02期
19 张静芳,陶跃军;刍议《中文期刊数据库》Web版全文检索系统[J];图书馆学研究;2001年02期
20 曹向东,邓毅华,李斯伟;一种网络化教学信息管理系统的开发与设计[J];中国数据通信;2001年03期
中国重要会议论文全文数据库 前10条
1 石晶;龚震宇;裘杭萍;;基于Web挖掘的个性化服务技术[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 李利波;刘明利;;一种改进的无回溯反向Web服务动态组合方法[A];2011年全国通信安全学术会议论文集[C];2011年
3 游争光;刘建勋;唐明董;;分布式Web服务测试系统的设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
4 殷华蓓;李通;唐常杰;张天庆;左志松;;从Web文件中挖掘个性化导航知识[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
5 ;基于广义对话的Web用户的聚类(英文)[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
6 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
7 ;WTCA:A Web Text Clustering Algorithm Based on DFSSM[A];第二十七届中国控制会议论文集[C];2008年
8 胡建强;周斌;尹刚;邹鹏;;基于角色的Web服务访问控制技术研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
9 黄建波;丁扬;方芳;;基于代理服务器的Web加速的实现[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(上册)[C];2010年
10 陶冶;刘建勋;唐明董;;基于Map/Reduce的分布式Web服务搜索引擎设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
2 张建武;面向Web应用的安全评测技术研究[D];北京邮电大学;2012年
3 李常宝;基于索引的web服务发现研究[D];北京邮电大学;2011年
4 魏登萍;语义Web服务发现中匹配策略的研究与实现[D];国防科学技术大学;2011年
5 朱俊武;基于本体的Web服务语义支撑技术研究[D];南京航空航天大学;2008年
6 许笑;分布式Web信息采集关键技术研究[D];哈尔滨工业大学;2011年
7 杨卉;Web文本观点挖掘及隐含情感倾向的研究[D];吉林大学;2011年
8 陈世展;服务网络:基于语义和社会化关系的Web服务计算基础设施[D];天津大学;2010年
9 胡佳;语义Web服务自动组合及验证的研究[D];天津大学;2010年
10 王辉;面向互联网的Web服务基础设施构建和应用[D];天津大学;2010年
中国硕士学位论文全文数据库 前10条
1 高洁;基于Web信息的内容及其特征提取方法的研究[D];电子科技大学;2010年
2 唐黎;Deep Web页面结构分析与核心内容提取研究[D];重庆大学;2011年
3 吴新勇;基于需求群组的Web服务调度模型研究[D];上海交通大学;2011年
4 徐卫;Web新闻热点发现系统的设计与实现[D];华中科技大学;2011年
5 姜本臣;基于嵌入式Web服务器应用技术的研究[D];沈阳工业大学;2012年
6 温梨梨;基于零拷贝的Web服务器技术研究[D];中国海洋大学;2011年
7 焦燕廷;一种基于领域本体的语义Web服务匹配和组合方法[D];山东科技大学;2011年
8 黄亮;Web漏洞扫描系统中的智能爬虫技术研究[D];杭州电子科技大学;2012年
9 赵春娟;Web服务组合方法的研究与实现[D];天津理工大学;2011年
10 任强;基于谓词抽象与精化技术的Web服务验证研究[D];苏州大学;2011年
中国重要报纸全文数据库 前10条
1 本报记者 边歆;八大安全威胁预示Web安全新变化[N];网络世界;2010年
2 张承东;Web智能考核广告[N];网络世界;2009年
3 本报记者 于翔;企业级协作拥抱Web 2.0[N];网络世界;2010年
4 赵晓涛;Web安全 服务为王[N];网络世界;2008年
5 本报记者 赵晓涛;Web安全:历史的命题[N];网络世界;2008年
6 彭敏;企业级Web2.0迎来应用高潮[N];电脑商报;2009年
7 本报记者 毛江华;安启华联手赛门铁克 掘金Web安全[N];计算机世界;2009年
8 闫冰;“推”出Web交付新天地[N];网络世界;2009年
9 赵晓涛;中国成全球Web安全新看点[N];网络世界;2009年
10 边歆;动态阻断Web2.0威胁[N];网络世界;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978