收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

同义词挖掘及其在概念信息检索系统中的应用研究

曹晶  
【摘要】: 随着Internet的飞速发展,Internet的应用深入到各行各业,Internet上的信息变得繁杂,信息的查找与获取也就变得越来越困难,如何从这个浩瀚的信息资源库中获取用户需要的信息,是人们面临的一个重要问题。传统的信息检索服务已不能满足用户的检索需求,因此智能信息检索成为重要的研究课题。概念检索是实现智能信息检索的重要方式之一。 本文研究了搜索引擎特别是中文搜索引擎的相关现状,以及下一代智能搜索引擎即基于概念的检索系统的功能特点,并利用《同义词词林》作为语义体系实现了基于《同义词词林》的同义词扩展检索。并对同义词识别的算法进行了深入的研究,利用基于语义体系的相似度算法实现智能搜索引擎中的同义概念的识别,和相关词语的联想搜索。关键词检索是大多数搜索引擎的主要检索手段,然而多数搜索引擎对此不加控制。从情报语言学研究的成果以及网络信息检索的现状来看,自然语言不加以控制,检索效率与效果是不能尽如人意的。应该说,要克服关键词检索系统的弊病,必须对关键词进行有效的控制,变字面检索为概念检索。本文在分析目前概念检索系统的基础上,提出了基于同义词(概念)挖掘的概念检索系统。 同义词的自动发现和识别在基于概念的信息检索领域有着重要的研究意义和应用价值,本文对国内和国外同义词识别算法进行研究和分析的基础上,对基于语义体系的同义词识别算法,即基于《同义词词林》的同义词识别算法和基于《知网》的同义词识别算法进行了深入的研究,利用词汇间的语义相似度度量来进行同义词识别,挖掘出大量的复合词形的同义词。基于《同义词词林》的同义词识别算法的实验结果表明,该算法具有较高的识别率。同义词的自动发现和识别,可以用于扩充同义词词典,提高同义词扩展检索的检准率和检全率。本文还在基于《知网》的词汇语义相似度算法的基础上提出了词语相关度计算方法,从而实现了相关概念联想功能。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 聂卉;龙朝晖;;结合语义相似度与相关度的概念扩展[J];情报学报;2007年05期
2 魏凯斌;冉延平;余牛;;语义相似度的计算方法研究与分析[J];计算机技术与发展;2010年07期
3 唐一之;;基于知网的领域概念抽取与关系分析研究[J];湘潭大学自然科学学报;2009年01期
4 刘卫;刘金岭;;基于《知网》的词语语义相似度改进及应用[J];福建电脑;2010年05期
5 吴学军;何丰;;一种计算组合词汇语义相似度的方法[J];计算机应用与软件;2010年08期
6 章成志;基于多层特征的字符串相似度计算模型[J];情报学报;2005年06期
7 王海东;李娜;刘继文;;小议传统的语义相似度算法[J];福建电脑;2010年06期
8 顾榕,王小平,曹立明;一种基于潜在语义分析的查询扩展算法[J];计算机工程与应用;2004年18期
9 王惠敏;聂规划;付魁;;领域本体中基于多维特征的语义相似度算法研究[J];情报杂志;2008年10期
10 申改英;李建华;;基于语义的Web服务自动组合算法[J];计算机工程;2009年16期
11 黄宏斌;刘志忠;张维明;邓苏;马丽丽;;基于层次本体模型(HOM)的语义相似度计算方法[J];系统工程与电子技术;2009年07期
12 吴飞珍;马文丽;王旺迪;陈启龙;郑文岭;;一种新的基因注释语义相似度计算方法[J];生物信息学;2010年01期
13 骆正华,樊孝忠,夏天;基于结构化问句实例的自动问答系统[J];微电子学与计算机;2005年07期
14 张承立;陈剑波;齐开悦;;基于语义网的语义相似度算法改进[J];计算机工程与应用;2006年17期
15 徐德智;C.Onyango;王怀民;;上位本体中语义相似度的计算及其实现[J];计算技术与自动化;2007年02期
16 张晓孪;王西锋;;FCA中的概念语义相似度计算[J];现代图书情报技术;2007年03期
17 路松峰;冯玲;刘芳;胡和平;;SSW:一种语义相关的P2P网络资源检索机制[J];小型微型计算机系统;2008年08期
18 周粉;夏幼明;;一种改进的基于知网的语义相似度计算方法[J];云南大学学报(自然科学版);2008年S2期
19 史斌;闫健卓;王普;方丽英;;基于本体的概念语义相似度度量[J];计算机工程;2009年19期
20 刘景方;邹平;张朋柱;齐峰;;一种改进的本体概念语义相似度算法研究[J];武汉理工大学学报;2010年20期
中国重要会议论文全文数据库 前10条
1 章成志;章成敏;王萍;;基于语义的同义词识别算法研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 陆勇;侯汉清;;基于词典注释的汉语同义词自动识别[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
3 张书娟;董喜双;关毅;;基于电子商务用户行为的同义词识别[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 章成志;;词语的语义相似度计算及其应用研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
5 刘晓平;沈冠町;;协同讨论观点影响度分析方法及其应用[A];全国第22届计算机技术与应用学术会议(CACIS·2011)暨全国第3届安全关键技术与应用(SCA·2011)学术会议论文摘要集[C];2011年
6 邱立坤;邵艳秋;;语义词典归类不当现象自动发现[A];第六届全国信息检索学术会议论文集[C];2010年
7 严灿勋;刘慧敏;;从语义关系的复杂性看语义词典建设[A];第五届全国青年计算语言学研讨会论文集[C];2010年
8 关毅;王晓龙;;基于统计的汉语词汇间语义相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 章成志;李斌;;基于混合策略的查询串相似度计算方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 余超;蔡东风;张桂平;;词汇语义相似度计算中相关技术的分析[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 刘宏哲;文本语义相似度计算方法研究[D];北京交通大学;2012年
2 宋玲;语义相似度计算及其应用研究[D];山东大学;2009年
3 刘慧;信息检索中用户需求的概念分析研究[D];上海交通大学;2009年
4 王兰成;基于XMARC信息描述的知识标引与概念检索研究[D];东华大学;2004年
5 蒋本蓉;“意思—文本”模式的词库理论与词库建设[D];黑龙江大学;2008年
6 王鑫印;无结构和半结构信息检索相关技术研究[D];复旦大学;2007年
7 周子力;基于WordNet的本体构建及其在安全领域应用关键技术研究[D];华东师范大学;2009年
8 潘建国;基于语义的用户建模技术与应用研究[D];上海大学;2009年
9 李赟;基于中文维基百科的语义知识挖掘相关研究[D];北京邮电大学;2009年
10 胡晓;支持机械产品概念设计的功能知识聚类方法研究[D];上海交通大学;2011年
中国硕士学位论文全文数据库 前10条
1 曹晶;同义词挖掘及其在概念信息检索系统中的应用研究[D];东北师范大学;2006年
2 郑丽萍;本体映射的研究[D];山东科技大学;2005年
3 张红宇;数据集成中本体映射的研究[D];中南大学;2005年
4 常晓环;基于概念图的语义检索方法研究[D];吉林大学;2009年
5 吴旭东;主客观结合的语义相似度算法及其应用研究[D];南京邮电大学;2013年
6 朱毅华;智能搜索引擎中的同义词识别算法研究[D];南京农业大学;2001年
7 任波;基于语义的Web服务发现研究[D];浙江工业大学;2005年
8 秦鹏;基于WordNet的本体匹配关键技术研究与实现[D];华东师范大学;2010年
9 郭嘉琦;领域本体的构建及其在信息检索中的应用研究[D];北京邮电大学;2007年
10 陈爱明;本体复合映射发现技术研究[D];中南大学;2008年
中国重要报纸全文数据库 前5条
1 赵志荣;专题性搜索引擎[N];计算机世界;2000年
2 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
3 钱平;我国农业网站的差距[N];农民日报;2001年
4 张颖;拯救被信息“淹没”的企业[N];计算机世界;2003年
5 戴丽昕;轻轻点击:掌握世界知识产权信息[N];上海科技报;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978