收藏本站
《电子科技大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于Web信息的内容及其特征提取方法的研究

高洁  
【摘要】: 随着全球信息化的程度日益加深,种类多样的Web信息已经成为人们日常生活和工作中获取信息的重要形式。Web信息资源的迅速增长,一方面提供给了人们一个方便快捷获取全球各种信息的途径,给人们的工作、学习和生活带来了极大便利;但另一方面,Web信息的滥用也日益成为互联网领域的一大难题,如:在互联网上出现的许多色情、反动、暴力等不健康的内容,还有不法分子利用BBS、电子邮件等形式进行反动宣传、诈骗、敲诈勒索和恐怖威胁等非法活动,这些非法信息在浪费宝贵网络资源的同时,还破坏了网络文明,给社会秩序和人身安全等方面造成了极大的危害。为了维护网络文明和社会秩序,就需要找出这些非法信息的发布源并予以处置。然而这些非法信息的发布者总是想方设法掩盖其真实身份以逃避侦查,如何在海量的信息中找出这些非法信息的发布源,还原他们的真实身份并依法处置,是亟待解决的关键问题。 在对Web信息发布源进行同一认定的过程中,特征的提取是关键性的问题。Web信息中包含的许多与主题无关的信息,在一定程度上影响了Web信息特征提取的效率。所以在各种Web信息处理系统中,Web信息内容的提取是必需解决的基础问题。 考虑到这种社会需求和研究背景,本研究决定针对Web信息的内容及其特征提取方法展开研究。本研究的目的就是以中文Web信息文本为研究对象,借鉴中文电子邮件特征提取的方法[9],分析研究Web信息的内容及其特征提取方法,为Web信息发布源同一认定的研究奠定基础,从而达到识别Web信息发布者真实身份的目的,为计算机取证提供依据,追究Web信息作者的责任,具有重要的应用价值和现实意义。
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP393.09

【参考文献】
中国期刊全文数据库 前2条
1 许文;都云程;李渝勤;施水才;;一种通用HTML网页主题信息提取方法[J];现代图书情报技术;2007年01期
2 刘明吉,王秀峰,饶一梅,黄亚楼;Web文本信息的特征获取算法[J];小型微型计算机系统;2002年06期
【共引文献】
中国期刊全文数据库 前10条
1 李爽;;以话语分析理论为依据建构语篇意义[J];聊城大学学报(社会科学版);2009年02期
2 孙丰果;;话语分析整合研究[J];聊城大学学报(社会科学版);2010年02期
3 张维峰;刘英峰;;替代衔接手段的翻译策略[J];聊城大学学报(社会科学版);2010年04期
4 欧阳星明;刘云胜;;一种新的增量决策树算法[J];微处理机;2008年05期
5 梅高蓓,何畏,张红燕;浅析英德语序的差异[J];武汉科技学院学报;2005年01期
6 肖胜文;项莉;;论文答辩中的连贯是如何形成的[J];武汉科技学院学报;2005年12期
7 徐薇;;Web信息采集中页面分块技术的研究[J];武汉科技学院学报;2007年05期
8 傅慧丽;;语篇分析中的语法衔接手段在汉英翻译中的应用[J];潍坊教育学院学报;2009年02期
9 徐珺;;《儒林外史》汉英文人际功能对比研究[J];外国语言文学研究;2004年01期
10 阎喜;;汉英法律翻译中的衔接转换个案研究[J];外国语言文学研究;2008年01期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 章曙光;;基于CBR的电力负荷预测系统的研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 韩露;余正涛;邓锦辉;章程;毛存礼;郭剑毅;;领域知识关系对领域文本分类的影响[A];第二十七届中国控制会议论文集[C];2008年
4 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
5 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
6 查星云;;一种钢铁企业金属损耗平衡分析方法[A];全国冶金自动化信息网2012年年会论文集[C];2012年
7 鲁松;;英文介词短语归并歧义的RMBL分类器消解[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
8 汤广富;马春实;刘欢;付强;;模糊聚类快速实用方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
9 刘海霞;钟晓妮;周燕荣;田考聪;;决策树在居民就诊卫生服务利用影响因素研究中的应用[A];重庆市预防医学会2010年论文集[C];2011年
10 刘子豪;庄毅;;一种电子邮件敏感信息检测算法[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年
2 张喜荣;英汉叙述语篇参与者标识手段对比研究[D];上海外国语大学;2010年
3 胡洁;建构视角下的外宣翻译研究[D];上海外国语大学;2010年
4 仇贤根;外宣翻译研究[D];上海外国语大学;2010年
5 汤春艳;篇章类型语用研究[D];上海外国语大学;2010年
6 原雪;二语/外语语境下的批判性阅读理论构建研究[D];上海外国语大学;2010年
7 杨石乔;基于语料库的汉语医患会话修正研究[D];上海外国语大学;2010年
8 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
9 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
10 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 王丽敬;地理案例的空间相似性计算[D];山东科技大学;2010年
2 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
3 孙岭;一种基于前缀表达式的Web信息抽取方法的关键问题的实现[D];山东科技大学;2010年
4 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
5 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
6 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
7 于娜;政治演讲中主位及主位推进模式分析[D];广西师范学院;2010年
8 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
9 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
10 陈文华;从标记主位视角看小说《鸡蛋》[D];上海外国语大学;2010年
【二级参考文献】
中国期刊全文数据库 前2条
1 张晓辉,邵华,常桂然;WWW上的信息发现与搜索引擎技术[J];小型微型计算机系统;1998年06期
2 张月杰,姚天顺;基于特征相关性的汉语文本自动分类模型的研究[J];小型微型计算机系统;1998年08期
【相似文献】
中国期刊全文数据库 前10条
1 张晶;周明全;耿国华;王小凤;;音乐哼唱检索技术在WEB上的应用[J];计算机应用与软件;2008年12期
2 贺文,顾训穰;基于Web的客户端电子邮件系统的实现[J];计算机工程与应用;2001年08期
3 周粤,钱士钧;一种用gform程序实现主页中交互性表格数据的方法[J];微型机与应用;1998年01期
4 张波 ,王继成 ,王强 ,张福炎;Web图像清洗技术的研究与实现[J];计算机研究与发展;2002年11期
5 李方敏;CGI的安全编程[J];计算机工程与应用;1999年06期
6 宋如顺,姜乃松;基于Web的远程考试系统设计与实现[J];计算机工程;1999年06期
7 王红霞,姚家亮;利用ASP构建新型信息系统的方法与实现[J];计算机应用;1999年09期
8 邓劲生,张银福;面向对象的多媒体信息WEB发布[J];计算机应用研究;1999年09期
9 刁兴春,李赤红;Intranet环境下事务处理的理论研究和实现[J];小型微型计算机系统;1999年06期
10 高昆;基于ASP的WEB站点开发技术分析[J];北华大学学报(社会科学版);1999年05期
中国重要会议论文全文数据库 前10条
1 石晶;龚震宇;裘杭萍;;基于Web挖掘的个性化服务技术[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 李利波;刘明利;;一种改进的无回溯反向Web服务动态组合方法[A];2011年全国通信安全学术会议论文集[C];2011年
3 游争光;刘建勋;唐明董;;分布式Web服务测试系统的设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
4 殷华蓓;李通;唐常杰;张天庆;左志松;;从Web文件中挖掘个性化导航知识[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
5 ;基于广义对话的Web用户的聚类(英文)[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
6 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
7 ;WTCA:A Web Text Clustering Algorithm Based on DFSSM[A];第二十七届中国控制会议论文集[C];2008年
8 胡建强;周斌;尹刚;邹鹏;;基于角色的Web服务访问控制技术研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
9 黄建波;丁扬;方芳;;基于代理服务器的Web加速的实现[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(上册)[C];2010年
10 陶冶;刘建勋;唐明董;;基于Map/Reduce的分布式Web服务搜索引擎设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
中国重要报纸全文数据库 前10条
1 本报记者 边歆;八大安全威胁预示Web安全新变化[N];网络世界;2010年
2 张承东;Web智能考核广告[N];网络世界;2009年
3 ;有关社交Web的安全建议[N];网络世界;2009年
4 本报记者 于翔;企业级协作拥抱Web 2.0[N];网络世界;2010年
5 赵晓涛;Web安全 服务为王[N];网络世界;2008年
6 本报记者 赵晓涛;Web安全:历史的命题[N];网络世界;2008年
7 彭敏;企业级Web2.0迎来应用高潮[N];电脑商报;2009年
8 本报记者 毛江华;安启华联手赛门铁克 掘金Web安全[N];计算机世界;2009年
9 闫冰;“推”出Web交付新天地[N];网络世界;2009年
10 赵晓涛;中国成全球Web安全新看点[N];网络世界;2009年
中国博士学位论文全文数据库 前10条
1 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
2 张建武;面向Web应用的安全评测技术研究[D];北京邮电大学;2012年
3 李常宝;基于索引的web服务发现研究[D];北京邮电大学;2011年
4 魏登萍;语义Web服务发现中匹配策略的研究与实现[D];国防科学技术大学;2011年
5 朱俊武;基于本体的Web服务语义支撑技术研究[D];南京航空航天大学;2008年
6 许笑;分布式Web信息采集关键技术研究[D];哈尔滨工业大学;2011年
7 杨卉;Web文本观点挖掘及隐含情感倾向的研究[D];吉林大学;2011年
8 陈世展;服务网络:基于语义和社会化关系的Web服务计算基础设施[D];天津大学;2010年
9 胡佳;语义Web服务自动组合及验证的研究[D];天津大学;2010年
10 王辉;面向互联网的Web服务基础设施构建和应用[D];天津大学;2010年
中国硕士学位论文全文数据库 前10条
1 高洁;基于Web信息的内容及其特征提取方法的研究[D];电子科技大学;2010年
2 唐黎;Deep Web页面结构分析与核心内容提取研究[D];重庆大学;2011年
3 吴新勇;基于需求群组的Web服务调度模型研究[D];上海交通大学;2011年
4 徐卫;Web新闻热点发现系统的设计与实现[D];华中科技大学;2011年
5 姜本臣;基于嵌入式Web服务器应用技术的研究[D];沈阳工业大学;2012年
6 温梨梨;基于零拷贝的Web服务器技术研究[D];中国海洋大学;2011年
7 焦燕廷;一种基于领域本体的语义Web服务匹配和组合方法[D];山东科技大学;2011年
8 黄亮;Web漏洞扫描系统中的智能爬虫技术研究[D];杭州电子科技大学;2012年
9 赵春娟;Web服务组合方法的研究与实现[D];天津理工大学;2011年
10 任强;基于谓词抽象与精化技术的Web服务验证研究[D];苏州大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026