收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于WordNet的本体构建及其在安全领域应用关键技术研究

周子力  
【摘要】: 信息技术的知识化和智能化发展趋势,使得信息和数据的表示不只是停留在语法层面,更要聚焦到语义及语用层面。本体作为一种能在语义层面上描述信息和数据的概念模型,为解决该类问题提供了一种良好途径。然而,现有本体构建方法基本上是人工处理,该类方法尽管本体概念和概念间关系比较准确,但其构建效率不能满足当今信息技术发展的速度要求。因此,自动本体构建方法成了迫切需求,目前的自动本体构建方法尽管在构建效率上取得了一定的提高,但是所构建本体中的概念及其关系由于所采用技术性能差等原因导致准确度较差。针对以上不足,本文充分利用现有资源,提出一种基于WordNet的本体构建方法,该方法基于所给初始本体,自动从WordNet抽取出相关领域的本体。该方法因为采用了自动化技术,所以在构建效率上有了较大的提高:由于所构建本体中的概念和概念间关系来自WordNet,而WordNet中的概念及关系是由专家选择和建立,因此所构建本体中的概念及关系比较准确。该方法使得本体构建效率及所构建本体内容的准确度都有所提高。 更进一步,从应用需求来看,互联网的开放性使得信息内容安全问题日益严重,快速构建出与信息内容安全信息相关的安全领域本体是解决内容安全问题的有效途径,也是对本文的基于WordNet的本体构建方法的进一步的需求:再加上信息内容安全相关信息具有涉及面广、领域跨度大、更新速度快等特点,这也为本文的本体构建方法提出了更大的挑战,增加了一定的难度。本文成功将本体构建方法应用到了安全领域,构建了与信息内容安全信息相关的安全领域本体,并且针对该领域信息更新快等特点,对安全领域本体进化中的关键技术进行了研究,提出了基于Markov的概念自动抽取算法及基于MI矩阵的分类关系学习方法,本文还将生成的安全领域本体应用到Web信息服务系统当中,目的是从互联网中准确检索并抽取用户所需的信息内容安全相关的信息,放入到本地数据库,供用户分析和决策。 本文对基于WordNet的本体构建方法中的关键技术进行了研究,同时对将该方法应用到安全领域生成与信息内容安全相关的安全领域本体以及该本体的进化和应用中的关键技术进行了探讨,具体各项研究内容如下: 1.提出了基于WordNet的本体的构建方法,该方法的提出是针对现有构建方法中的不足,尤其是人工构建方法的构建效率低及自动本体构建生成的本体中内容准确度差等缺点。本文具体阐述了构建方案:以现有资源WordNet为基础,基于初始本体,采用抽取算法从WordNet中抽取出本体。 2.为了提高本体构建方法中所采用的语义相似度算法的性能,本文的从最基本的语义相似度参数入手,构建了的信息内容IC参数DN模型。该模型的求值只与WordNet自身结构相关,不需要其它资源的参与。DN模型不只是考虑了概念在WordNet中is_a关系分类树中的子节点数,还考虑了概念所处分类树中的深度,使得概念的IC参数值更为精确,实验数据表明DN模型与其它参数模型相比具有一定的优越性。 3.基于语义相似度参数,本文对语义相似度算法进行了研究。在对已有相似度算法研究的基础上,给出了语义相似度算法的改进模型,该模型以IC参数为基础,同时将概念对间的路径考虑在内,使概念间语义相似度值的准确性有所提高,在与其它语义相似度算法比较后,显示该算法模型具有更好的性能。 4.语义相似度算法是从WordNet中抽取本体概念和关系的基础,本文抽取算法基于所给出的语义相似度算法的改进模型,分别求出初始本体中的概念与WordNet中的概念的语义相似度值,按照所给定阈值,抽取出本体概念及关系。然后,根据本文制定的is_a关系添加规则,对初始本体进行概念和is_a关系扩展,最终生成本体。 5.安全领域本体的构建是对本文基于WordNet的本体构建方法的进一步的需求,本文成功地将基于WordNet的本体构建方法应用到安全领域,并生成了与信息内容安全相关的安全领域本体。 6.信息的发展使得信息内容安全相关的新概念和新关系不断产生,因此,生成的安全领域本体需要不断丰富和完善。本文针对安全领域本体进化中的关键技术进行了研究,提出了基于Markov的概念抽取算法和基于MI矩阵的分类关系学习方法。 7.最后,本文将生成的安全领域本体应用到WEB信息服务系统,对互联网中的信息内容安全相关信息进行检索和抽取,并将数据存储到本地数据库供用户分析和研究。 本文提出了基于WordNet的本体的构建方法并成功应用到了安全领域当中,该方法同样也适用于其它领域。对于其中的关键技术,如语义相似度算法以及基于Markov的概念抽取算法等都进行了性能测试与比较,显示出较好的性能,这些关键技术也可以应用到其它如自然语言理解、网页分类等其它应用当中。因此,本文的研究成果具有较大的实用价值。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李熙;徐德智;;基于WordNet的概念语义相似度研究[J];湖南科技学院学报;2008年12期
2 唐一之;;基于知网的领域概念抽取与关系分析研究[J];湘潭大学自然科学学报;2009年01期
3 边振兴;;WordNet中概念语义相似度IC参数模型研究[J];计算机工程与应用;2011年19期
4 董发花;黄宏斌;邓苏;刘震;;跨本体概念间相似度的计算方法——MD4模型[J];科学技术与工程;2007年20期
5 黄果;周竹荣;周亭;;基于领域本体的语义相似度计算研究[J];计算机工程与科学;2007年05期
6 黄果;周竹荣;;基于领域本体的概念语义相似度计算研究[J];计算机工程与设计;2007年10期
7 顾榕,王小平,曹立明;一种基于潜在语义分析的查询扩展算法[J];计算机工程与应用;2004年18期
8 骆正华,樊孝忠,夏天;基于结构化问句实例的自动问答系统[J];微电子学与计算机;2005年07期
9 张承立;陈剑波;齐开悦;;基于语义网的语义相似度算法改进[J];计算机工程与应用;2006年17期
10 徐德智;C.Onyango;王怀民;;上位本体中语义相似度的计算及其实现[J];计算技术与自动化;2007年02期
11 张晓孪;王西锋;;FCA中的概念语义相似度计算[J];现代图书情报技术;2007年03期
12 聂卉;龙朝晖;;结合语义相似度与相关度的概念扩展[J];情报学报;2007年05期
13 路松峰;冯玲;刘芳;胡和平;;SSW:一种语义相关的P2P网络资源检索机制[J];小型微型计算机系统;2008年08期
14 王惠敏;聂规划;付魁;;领域本体中基于多维特征的语义相似度算法研究[J];情报杂志;2008年10期
15 周粉;夏幼明;;一种改进的基于知网的语义相似度计算方法[J];云南大学学报(自然科学版);2008年S2期
16 申改英;李建华;;基于语义的Web服务自动组合算法[J];计算机工程;2009年16期
17 黄宏斌;刘志忠;张维明;邓苏;马丽丽;;基于层次本体模型(HOM)的语义相似度计算方法[J];系统工程与电子技术;2009年07期
18 史斌;闫健卓;王普;方丽英;;基于本体的概念语义相似度度量[J];计算机工程;2009年19期
19 吴飞珍;马文丽;王旺迪;陈启龙;郑文岭;;一种新的基因注释语义相似度计算方法[J];生物信息学;2010年01期
20 刘卫;刘金岭;;基于《知网》的词语语义相似度改进及应用[J];福建电脑;2010年05期
中国重要会议论文全文数据库 前10条
1 陈静;朱巧明;贡正仙;李培锋;;特定本体指导的信息抽取技术研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 焦芬芬;章勇;;基于聚类分析的过滤算法在RSS信息服务中的研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
3 颜伟;荀恩东;;基于WordNet的英语词语相似度计算[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 徐庆飞;张新;;空地作战中基于马尔可夫蒙特卡罗算法的目标移动预测研究[A];2011航空试验测试技术学术交流会论文集[C];2010年
5 余超;蔡东风;张桂平;;词汇语义相似度计算中相关技术的分析[A];第三届学生计算语言学研讨会论文集[C];2006年
6 关毅;王晓龙;;基于统计的汉语词汇间语义相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 郎君;忻舟;秦兵;刘挺;李生;;集成多种背景语义知识的共指消解[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
8 哈斯那顺乌日图;;蒙古文WordNet名词同义词集合构建算法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 刘扬;俞士汶;;CCD构造模型及VACOL辅助软件的设计与实现[A];第一届学生计算语言学研讨会论文集[C];2002年
10 白媛;;分组语音流的马尔可夫调制泊松模型[A];中国航海学会船舶机电与通信导航专业委员会2002年学术年会论文集(通信导航分册)[C];2002年
中国博士学位论文全文数据库 前10条
1 周子力;基于WordNet的本体构建及其在安全领域应用关键技术研究[D];华东师范大学;2009年
2 刘宏哲;文本语义相似度计算方法研究[D];北京交通大学;2012年
3 宋玲;语义相似度计算及其应用研究[D];山东大学;2009年
4 黄宁;遥感图象中模式分类技术的研究[D];中国科学院电子学研究所;2001年
5 陶菁;后MFA全球产业网络重构中的中国纺织出口增长结构分析[D];东华大学;2011年
6 侯波;基于小波变换消除遥感图像噪声[D];中国科学院研究生院(遥感应用研究所);2002年
7 俞政;马尔可夫化方法在时间序列和排队模型中的应用[D];中南大学;2003年
8 罗交晚;马尔可夫调制的随机泛函微分系统与脉冲泛函微分系统的稳定性[D];中南大学;2001年
9 郑义;多媒体信息自动摘要及其相关技术研究[D];复旦大学;2003年
10 孙钰;基于奇异摄动理论的马尔可夫机制转换波动模型下的期权定价[D];东华大学;2011年
中国硕士学位论文全文数据库 前10条
1 秦鹏;基于WordNet的本体匹配关键技术研究与实现[D];华东师范大学;2010年
2 王曙光;基于蚁群的文本聚类算法的改进研究[D];大连理工大学;2006年
3 李熙;基于WordNet的本体映射研究[D];中南大学;2008年
4 李壮;汉英平行语料库的词义自动标注方法研究[D];哈尔滨工业大学;2007年
5 张凯勇;基于WordNet的词语及短文本语义相似度算法研究[D];吉林大学;2011年
6 张加龙;一种检测鉴别假冒网页的方法[D];吉林大学;2008年
7 孙爽;基于语义相似度的文本聚类算法的研究[D];南京航空航天大学;2007年
8 刘春辰;基于本体的玉米病虫害防治语义检索系统的研究[D];吉林大学;2008年
9 郑丽萍;本体映射的研究[D];山东科技大学;2005年
10 张红宇;数据集成中本体映射的研究[D];中南大学;2005年
中国重要报纸全文数据库 前10条
1 彭超 任匆匆 冯秀杰 李晋 贺文良 尚明洲;信息开发呼唤适度整合[N];人民邮电;2006年
2 胡其峰;开放联合:突破信息服务产业瓶颈[N];光明日报;2007年
3 本报记者  张凤莎;信息内容导航自主创新[N];科技日报;2006年
4 柳士发;IC为王[N];中国文化报;2003年
5 唐红娟 陈奕;固本强基提升信息质量[N];科技日报;2007年
6 中国电信股份有限公司上海研究院 蒋力;拓展信息服务的“蓝海”[N];人民邮电;2007年
7 史湘岚;uniLink:实现信息安全的新思路[N];计算机世界;2008年
8 记者 韩雪洁;规范信息服务 抵制低俗之风[N];吉林日报;2009年
9 高雪娟;信息内容服务水到渠成[N];中国计算机报;2004年
10 阳光;囚笼中的信息内容产业[N];计算机世界;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978