收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

同义词挖掘及其在概念信息检索系统中的应用研究

曹晶  
【摘要】: 随着Internet的飞速发展,Internet的应用深入到各行各业,Internet上的信息变得繁杂,信息的查找与获取也就变得越来越困难,如何从这个浩瀚的信息资源库中获取用户需要的信息,是人们面临的一个重要问题。传统的信息检索服务已不能满足用户的检索需求,因此智能信息检索成为重要的研究课题。概念检索是实现智能信息检索的重要方式之一。 本文研究了搜索引擎特别是中文搜索引擎的相关现状,以及下一代智能搜索引擎即基于概念的检索系统的功能特点,并利用《同义词词林》作为语义体系实现了基于《同义词词林》的同义词扩展检索。并对同义词识别的算法进行了深入的研究,利用基于语义体系的相似度算法实现智能搜索引擎中的同义概念的识别,和相关词语的联想搜索。关键词检索是大多数搜索引擎的主要检索手段,然而多数搜索引擎对此不加控制。从情报语言学研究的成果以及网络信息检索的现状来看,自然语言不加以控制,检索效率与效果是不能尽如人意的。应该说,要克服关键词检索系统的弊病,必须对关键词进行有效的控制,变字面检索为概念检索。本文在分析目前概念检索系统的基础上,提出了基于同义词(概念)挖掘的概念检索系统。 同义词的自动发现和识别在基于概念的信息检索领域有着重要的研究意义和应用价值,本文对国内和国外同义词识别算法进行研究和分析的基础上,对基于语义体系的同义词识别算法,即基于《同义词词林》的同义词识别算法和基于《知网》的同义词识别算法进行了深入的研究,利用词汇间的语义相似度度量来进行同义词识别,挖掘出大量的复合词形的同义词。基于《同义词词林》的同义词识别算法的实验结果表明,该算法具有较高的识别率。同义词的自动发现和识别,可以用于扩充同义词词典,提高同义词扩展检索的检准率和检全率。本文还在基于《知网》的词汇语义相似度算法的基础上提出了词语相关度计算方法,从而实现了相关概念联想功能。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 闵可锐;唐悦;胡运发;赵泽宇;闫华;;动态调整的Web文档增量聚类算法[J];计算机辅助工程;2006年03期
2 程涛;施水才;王霞;吕学强;;基于同义词词林的中文文本主题词提取[J];广西师范大学学报(自然科学版);2007年02期
3 田久乐;赵蔚;;基于同义词词林的词语相似度计算方法[J];吉林大学学报(信息科学版);2010年06期
4 丁建立;慈祥;黄剑雄;;网络评论倾向性分析[J];计算机应用;2010年11期
5 吕震宇;林永民;赵爽;朱卫东;;基于同义词词林的文本特征选择与加权研究[J];情报杂志;2008年05期
6 梅立军,周强,臧路,陈祖舜;知网与同义词词林的信息融合研究[J];中文信息学报;2005年01期
7 施水才;程涛;王霞;吕学强;;基于网页内容的广告推介研究[J];中文信息学报;2007年04期
8 张宝剑;一种基于无指导的词义排歧方法[J];河南职业技术师范学院学报;2002年01期
9 张俊林,孙乐,孙玉芳;一种改进的基于记忆的自适应汉语语言模型[J];中文信息学报;2005年01期
10 陈登;小议“五词”[J];实验室研究与探索;1986年03期
11 李有梅;基于词义的关键词抽取方法研究[J];情报理论与实践;2000年02期
12 王晓龙;拼音语句汉字输入系统InSun[J];中文信息学报;1993年02期
13 张琪玉;情报语言漫笔(K)[J];图书馆理论与实践;2003年05期
14 齐璇,王挺,陈火旺;义类自动标注方法的研究[J];中文信息学报;2001年03期
15 陆勇,侯汉清;用于信息检索的同义词自动识别及其进展[J];南京农业大学学报(社会科学版);2004年03期
16 苑春法,黄锦辉,李文捷;基于语义知识的汉语句法结构排歧[J];中文信息学报;1999年01期
17 李军,王鑫,常荣清;基于机器学习的兼类词词性标注[J];信息技术;1999年12期
18 郑家恒,钱揖丽,李竞;二字词词义组合推理方法的研究[J];中文信息学报;2001年06期
19 邹怀军,刘羽时;基于实例映射的商业信函计算机生成与翻译[J];小型微型计算机系统;1998年05期
20 黄萱菁,吴立德,叶丹瑾;基于超文本的概念词典管理系统[J];计算机应用与软件;1998年04期
中国重要会议论文全文数据库 前10条
1 贾玉祥;俞士汶;;基于词典的名词性隐喻识别[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 李月雷;师瑞峰;林丽冰;周一民;;汉语语句语义相似度的计算方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
3 吕静;昝红英;;基于语义统计的中文自动文摘研究[A];第三届学生计算语言学研讨会论文集[C];2006年
4 李丽;孙甲申;王小捷;李江;宋占江;;基于属性信息的中文人名消歧[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 洪宇;张剑峰;杨跃辉;姚建民;朱巧明;;基于文法特征的无监督能愿词挖掘方法研究[A];第六届全国信息检索学术会议论文集[C];2010年
6 李正华;车万翔;刘挺;;基于XML的语言技术平台[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 宋晓雷;王素格;李红霞;;基于概率潜在语义分析的词汇情感倾向判别[A];第五届全国青年计算语言学研讨会论文集[C];2010年
8 车万翔;刘挺;秦兵;李生;;面向双语句对检索的汉语句子相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 何梅;刘亚军;陈耿;;词性划分和差额法在主观题阅卷中的应用[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
10 严灿勋;刘慧敏;;从语义关系的复杂性看语义词典建设[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国博士学位论文全文数据库 前4条
1 熊回香;面向Web3.0的大众分类研究[D];华中师范大学;2011年
2 张旭洁;事件本体构建中几个关键问题的研究[D];上海大学;2013年
3 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
4 车超;知识自动获取的词义消歧方法[D];大连理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 耿端;基于同义词词林的评分在中医案例自测系统中的应用[D];西北大学;2013年
2 祁磊;话题检测与跟踪及趋势预测研究[D];杭州电子科技大学;2014年
3 赵静;大规模汉语语义词典构建[D];哈尔滨工业大学;2011年
4 杨乐;基于同义词词林的自动文摘系统的研究[D];天津大学;2007年
5 杨旭;主谓关系识别与主题相关性计算技术研究[D];东北大学;2009年
6 张翠萍;基于模糊理论的在线智能阅卷系统的研究与应用[D];石家庄铁道大学;2013年
7 胡新主;分布式搜索引擎结果聚类方法的设计与实现[D];华南理工大学;2012年
8 孙振龙;面向舆情监控的热点人物及事件分析技术[D];哈尔滨工业大学;2012年
9 毛鑫;基于本体的语义信息集成与知识发现研究[D];华北电力大学(北京);2010年
10 黄硕;中文情感知识库构建与应用[D];北京邮电大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978