收藏本站
《哈尔滨工程大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于潜在语义分析的智能搜索技术研究

王洋  
【摘要】: 近年来互联网飞速发展,已经发展成为包含多种信息资源、站点遍布全球的巨大动态信息服务网络,为用户提供了一个极具价值的信息源。搜索引擎为用户提供了友好的检索接口,能帮助人们从浩瀚的数据中抽取出对用户有用的信息,能极大地节省用户的查询时间。 互联网上绝大多数的信息是以文本的形式保存的,互联网上文本信息的指数级增长给搜索引擎技术带来了巨大的挑战,人们越来越难以快速准确地从网上搜索到相关信息。由于自然语言中多词同义、一词多义等不确定性因素存在,相同概念可以有多种不同的表述方式。传统的基于关键词字符匹配的搜索引擎中,参与匹配的只有外在的表现形式,而非它们所表达的全部概念,用户很难简单地用关键词或关键词串来真实地表达真正需要查询的内容。把搜索引擎技术从关键词匹配的层面提高到语义的层面,从语义意义上智能地认知和处理用户的查询请求成为当前搜索引擎技术的研究热点。 本文从智能搜索建模的角度出发结合潜在语义分析技术,研究了搜索引擎中文档处理、查询处理以及最后的信息匹配处理。在此基础上,对潜在语义空间中权值从概率角度进行了分析与改进,使其更能体现出文档间、文档与词汇间的语义关系;对用户查询进行语义扩展,补充了用户输入信息不足或与索引词汇不匹配的问题;对用户搜索结果不理想进行调整,提出二次搜索的策略改善搜索结果使其更贴近用户要求。最后文本设计并实现了基于潜在语义分析的智能搜索系统验证了算法可以在一定程度上搜索引擎对语义的理解,并获得较高的准确率与查准率。
【学位授予单位】:哈尔滨工程大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.3

【参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 王修力;马利平;;文本信息检索的代数模型综述[J];吉林大学学报(信息科学版);2007年05期
3 程莉,卢正鼎,文坤梅,李娟;基于语义的模糊匹配探索与应用[J];华中科技大学学报(自然科学版);2003年02期
4 林鸿飞;基于示例的文本标题分类机制[J];计算机研究与发展;2001年09期
5 盖杰,王怡,武港山;基于潜在语义分析的信息检索[J];计算机工程;2004年02期
6 王怡,盖杰,武港山,王继成;基于潜在语义分析的中文文本层次分类技术[J];计算机应用研究;2004年08期
7 吴颜;沈洁;顾天竺;陈晓红;李慧;张舒;;协同过滤推荐系统中数据稀疏问题的解决[J];计算机应用研究;2007年06期
8 林鸿飞,姚天顺;基于潜在语义索引的文本浏览机制[J];中文信息学报;2000年05期
9 刘云峰,齐欢,Xiang’en Hu,Zhiqiang Cai;潜在语义分析权重计算的改进[J];中文信息学报;2005年06期
10 黄曾阳;HNC理论概要[J];中文信息学报;1997年04期
中国博士学位论文全文数据库 前3条
1 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
2 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
3 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
中国硕士学位论文全文数据库 前1条
1 翟琳琳;基于潜在语义分析的智能检索系统[D];上海师范大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 薛宏伟;芜湖电厂给水控制和主汽温控制改造[J];安徽电气工程职业技术学院学报;2005年03期
2 梁峰;金莹;;基于Agent技术的语义网服务模型[J];安徽广播电视大学学报;2008年01期
3 陶皖,李平,廖述梅;当前基于本体的语义标注工具的分析[J];安徽工程科技学院学报(自然科学版);2005年02期
4 张润梅,龚剑,章曙光;机器人足球队的结构设计研究[J];安徽建筑工业学院学报(自然科学版);2003年01期
5 龚剑;关于高校开展机器人足球比赛的思考[J];安徽建筑工业学院学报(自然科学版);2005年04期
6 高朋;黄世祥;;地区现代化水平BP人工神经网络评价方法初探[J];安徽农业大学学报(社会科学版);2006年03期
7 赵秀芳;;基于本体的农业信息检索[J];安徽农业科学;2006年10期
8 蔡曈;徐惠;吴群;;土壤质量聚类分析——以封丘县为例[J];安徽农业科学;2008年25期
9 陈红琳;;基于MAS的农产品供应链可追溯系统研究[J];安徽农业科学;2011年35期
10 薛荟;谭三清;;林业应用系统本体知识模型的构建方法研究[J];现代农业科技;2011年07期
中国重要会议论文全文数据库 前10条
1 李贵;张兆鑫;李征宇;韩子洋;;WEB环境下基于领域本体的语义匹配技术研究[A];科学发展与社会责任(A卷)——第五届沈阳科学学术年会文集[C];2008年
2 李伟刚;张克亮;王慧兰;;基于航空领域本体知识库的语义检索研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 沈霖;吴蕙;张帆;张芸;;提高有限元网格自动剖分成功率的研究[A];首届中国CAE工程分析技术年会暨2005全国计算机辅助工程(CAE)技术与应用高级研讨会论文集[C];2005年
4 徐丽芳;;数字出版:概念与形态[A];中国编辑研究(2006)[C];2007年
5 王建州;李廉;汪映海;;面向Ontology的电力信息系统的研究[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
6 郭燕慧;王枞;钟义信;;语言认知与主题内容识别[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
7 初敏;;人机对话系统工程[A];信息科学与微电子技术:中国科协第三届青年学术年会论文集[C];1998年
8 郑笈;李思昆;陆筱霞;;大规模场景绘制的存储数据调度组织研究[A];节能环保 和谐发展——2007中国科协年会论文集(一)[C];2007年
9 鲍林江;贾世发;;电网经济运行实时分析监测系统的研究[A];2003中国电机工程学会电力系统自动化专委会供用电管理自动化分专业委员会成立暨第一届学术交流会议论文集[C];2003年
10 杨昆;王军;彭双云;;基于Ontology的空间信息互操作初步研究[A];中国地理信息系统协会第八届年会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 卜志国;海洋生态环境监测系统数据集成与应用研究[D];中国海洋大学;2010年
2 熊晶;海洋生态本体的建模方法研究及应用[D];中国海洋大学;2010年
3 陈韶斌;基于知识推理和视觉机理的遥感图像目标识别方法研究[D];华中科技大学;2010年
4 张俐;面向概念设计方案选择的协同决策方法研究[D];华中科技大学;2010年
5 韩赟;高技术虚拟企业(HTVE)知识管理模式研究[D];哈尔滨理工大学;2009年
6 王亚萍;需求驱动的个性化产品配置设计方法研究[D];哈尔滨理工大学;2010年
7 游颖;客车信息集成控制系统配置设计中的分解技术研究[D];武汉理工大学;2010年
8 吴修国;面向目标的迁移工作流建模方法研究[D];山东大学;2010年
9 连莉;本体中非分类关系的理论体系研究[D];山东大学;2010年
10 魏巍;定制产品智能重组设计关键技术与方法研究及其应用[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 厉颖;基于本体的服装领域知识表示的建模研究[D];山东科技大学;2010年
2 吕媛媛;基于本体的物流信息集成系统的研究[D];山东科技大学;2010年
3 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
4 蔡宏果;基于基因表达式编程的Web个性化推荐技术研究[D];广西师范学院;2010年
5 蔡浩;基于Web使用挖掘的协同过滤推荐算法研究[D];浙江理工大学;2010年
6 许坤;基于本体的应急信息管理系统的研究与设计[D];郑州大学;2010年
7 林华云;蒸汽发生器检修机械臂的视觉测量研究[D];哈尔滨工程大学;2010年
8 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年
9 王东阳;多智能体调度优化算法研究[D];哈尔滨工程大学;2010年
10 刘海娇;基于魔力平台的需求分析系统的研究与实现[D];哈尔滨工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 李源,何清,史忠植;基于概念语义空间的联想检索[J];北京科技大学学报;2001年06期
3 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
4 郭庆琳,樊孝忠,柳长安;基于文本聚类和NLU的自动文摘研究[J];北京理工大学学报;2005年08期
5 林鸿飞,战学刚,姚天顺;中文文本挖掘的特征导航机制[J];东北大学学报;2000年03期
6 詹卫东;80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J];当代语言学;2000年02期
7 董振东,董强;知网和汉语研究[J];当代语言学;2001年01期
8 秦志光;罗琴;张凤荔;;一种混合的垃圾邮件过滤算法研究[J];电子科技大学学报;2007年03期
9 林鸿飞,高仁璟;基于潜在语义索引的文本摘要方法[J];大连理工大学学报;2001年06期
10 林鸿飞,马雅彬;基于聚类的文本过滤模型[J];大连理工大学学报;2002年02期
中国博士学位论文全文数据库 前10条
1 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
2 张俊林;基于语言模型的信息检索系统研究[D];中国科学院研究生院(软件研究所);2004年
3 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
4 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
5 代六玲;互联网内容监管系统关键技术的研究[D];南京理工大学;2005年
6 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
7 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
8 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
9 杨小兵;聚类分析中若干关键技术的研究[D];浙江大学;2005年
10 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年
中国硕士学位论文全文数据库 前5条
1 张兰轩;基于潜在语义分析的大学概况中文问答系统[D];大连理工大学;2004年
2 陈鑫;中文智能搜索引擎[D];四川大学;2004年
3 左家莉;基于Markov网络的信息检索模型[D];江西师范大学;2005年
4 全德;基于潜在语义索引的文本分类技术的研究[D];东北大学;2005年
5 陈治纲;基于向量空间模型的文本分类系统研究与实现[D];天津大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 邱均平;余以胜;;基于知识库系统的智能搜索引擎研究[J];情报科学;2006年03期
2 李莉;原福永;付韬;李红岩;鲍伟;;智能搜索引擎的分析与研究[J];微处理机;2006年04期
3 张敏;;智能搜索引擎的分析与研究[J];运城学院学报;2007年02期
4 王宏亮;;第二代搜索软肋凸现 第三代搜索渐露端倪[J];中国传媒科技;2006年11期
5 白璐;;浅谈搜索引擎在电子商务中的应用[J];中小企业管理与科技(下旬刊);2010年04期
6 龚宪;赵霞;林麟;;李开复:搜索未来[J];世界电信;2008年01期
7 赵辉;来美英;杜小巍;;面向电子商务的智能搜索引擎技术的研究[J];商场现代化;2008年06期
8 余腊生;汤旭蓉;;基于多Agent的搜索引擎设计与实现[J];电脑知识与技术;2010年05期
9 谢建国;;智能代理在电子商务中的应用[J];闽西职业技术学院学报;2010年01期
10 窦天芳;李健;张成昱;;基于P2P技术的搜索引擎[J];情报科学;2006年03期
中国重要会议论文全文数据库 前10条
1 宋晓雷;王素格;李红霞;;基于概率潜在语义分析的词汇情感倾向判别[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 刘昌钰;郭颖;唐常杰;翟静;李海宏;;基于潜在语义分析与Bayes分类的BBS文档鉴别[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
3 陈杰;;应用智能搜索 实现数据挖掘[A];中国新闻技术工作者联合会五届一次理事会暨学术年会论文集(上篇)[C];2009年
4 龙长江;万鹏;;近红外检测技术在中药研究中的应用[A];中国农业工程学会2011年学术年会论文集[C];2011年
5 黄明初;陆旭安;潘雄伟;钟威;;中文分词技术在档案智能搜索中的应用[A];广西计算机学会2010年学术年会论文集[C];2010年
6 任纪生;王作英;赵敏;;基于潜在语义信息的汉语语音识别方法[A];中文信息处理技术研讨会论文集[C];2004年
7 耿焕同;吴祥;毕硕本;;基于潜在语义分析的BBS主题发现算法研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
8 丁晓安;徐伯夏;;基于智能搜索功能的Android平台手机拼车系统设计[A];全国第五届信号和智能信息处理与应用学术会议专刊(第一册)[C];2011年
9 李晓婷;张磊;沈建京;;面向服务的主动式统计预测报表技术[A];2007年中国智能自动化会议论文集[C];2007年
10 何盈捷;冯月利;王珊;;Peer-to-Peer环境下基于内容的智能搜索[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国重要报纸全文数据库 前10条
1 本报记者 刘霞;请光临个性化智能搜索[N];科技日报;2009年
2 本报记者  时间;智能搜索盯上手机[N];21世纪经济报道;2006年
3 嘉嘉;雅虎力推Imatch智能搜索[N];民营经济报;2006年
4 记者 莫小松 常鑫 通讯员 郝晋薇;广西交通网设交管问答智能搜索[N];法制日报;2010年
5 ;谷歌创新搜索的跬步与千里[N];中国电脑教育报;2010年
6 常燕杰;中搜:空为他人做嫁衣?[N];中国经济时报;2006年
7 邓健;智能搜索为信息共享提速[N];计算机世界;2006年
8 徐晓巍;搜索将向“以人为先”方向发展[N];中国证券报;2007年
9 常燕杰;中搜:切莫空为他人做嫁衣[N];中国高新技术产业导报;2006年
10 本报记者 赵齐;搜索营销开辟第二战场[N];国际商报;2007年
中国博士学位论文全文数据库 前10条
1 宣云干;基于潜在语义分析的社会化标注系统标签语义检索研究[D];南京大学;2011年
2 夏天;研究性学习支持系统[D];华东师范大学;2007年
3 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
4 万源;基于语义统计分析的网络舆情挖掘技术研究[D];武汉理工大学;2012年
5 周晖;高分辨率遥感图像的层次化分析方法[D];国防科学技术大学;2010年
6 刘东飞;智能双语搜索方法及搜索引擎的研究[D];武汉理工大学;2009年
7 张军;基于视频的运动人体异常行为分析识别研究[D];西安电子科技大学;2009年
8 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
9 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
10 姚红玉;基于教师专业化发展的虚拟导师系统设计[D];华东师范大学;2006年
中国硕士学位论文全文数据库 前10条
1 王洋;基于潜在语义分析的智能搜索技术研究[D];哈尔滨工程大学;2010年
2 张剑豪;基于潜在语义分析的军事情报检索系统的研究与实现[D];东北大学;2009年
3 刘森;概率潜在语义分析及其应用[D];浙江大学;2011年
4 郑翠翠;面向领域文本的潜在语义分析研究[D];南京理工大学;2010年
5 蔡云雷;基于潜在语义分析的专利文本分类技术研究[D];沈阳航空航天大学;2011年
6 张洪;结合概率潜在语义分析的文本谱聚类研究[D];重庆大学;2012年
7 吴秀梅;基于潜在语义分析和最大熵的中文情感分析研究[D];北京交通大学;2011年
8 鲍光余;基于潜在语义分析的农户个性化推荐系统[D];海南大学;2011年
9 刘霞;基于潜在语义分析的单文本自动摘要方法研究[D];南京邮电大学;2011年
10 宋晓雷;基于Web的汽车产品评论观点挖掘方法研究[D];山西大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026