收藏本站
《中国科学技术大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

农业垂直搜索引擎语义化若干问题的研究与实现

胡宜敏  
【摘要】:大量的农业技术、供求信息、市场信息、政策法规和农业新闻等信息资源分布在互联网上农业网站中。然而由于互联网信息资源具有信息异质、异构、分散、重复现象严重的特点,缺少统一的形式化表达,形成各种各样的“信息孤岛”,很难对农业信息资源进行整合和利用。针对这个问题,在国家自然基金(“农业复杂自适应搜索模型研究”)的支持下,面向农业的搜索模型—搜农应运而生。然而该模型还是基于文本关键字匹配的数据处理方式,不能充分理解信息包含的语义信息,在准确率和召回率这两大信息检索系统性能指标上还有很大提升空间。 针对这个问题,本文根据网络农业资源的特点,在农业领域本体构建的基础上,将本体作为领域知识库应用于垂直搜索引擎的数据预处理、数据索引和用户检索三个环节,将本体的语义添加到搜索引擎的数据处理过程中。 相对于原有模型,数据预处理环节的语义改进主要包括:信息的空间属性的抽取、信息地理名称的实体解析和价格动态变化的关系抽取;索引环节的语义改进主要包括:文档的语义标注和语义扩展;用户检索环节的改进包括:在语义标注环境下普通用户的检索策略和基于用户模型的语义扩展方法。 论文的主要研究内容总结如下: 1.针对网络上农业资源空间属性表达的多样性、显性表达的缺失等问题,本文提出一种借助领域本体和WEB搜索引擎构建知识库抽取并判别信息的空间属性的方法,将语义添加到信息的空间属性抽取过程中。 2.针对农业地理名称实体解析的问题,本文提出一种将空间属性抽取算法和Markov逻辑网络进行结合进行地理名称实体解析的方法,将空间属性抽取中的语义信息带入到地理名称的实体解析过程中。 3.针对从大量非结构化的文本中抽取价格变化关系的问题,本文设计了一种基于条件随机场进行关系抽取,并用领域本体对抽取的结果进行语义上的统计合并的农产品价格变化关系抽取方法。 4.针对农业领域资源的特点,本文提出一种结合领域本体和句法分析相结合的核心词汇抽取方法,并依据本体对文档主题进行推断,与本体中的概念进行语义关联;另一方面对文档中抽取的核心词汇基于领域本体进行语义扩张。 5.在用户检索环节,针对索引中文档和本体概念的语义关联状况,设计了普通用户双索引检索的机制;对注册用户基于本体构建用户模型,并基于用户模型对查询进行语义扩展。 6.最后,本文给出了面向农业的垂直搜索引擎的整体的语义化设计。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:TP391.3

【参考文献】
中国期刊全文数据库 前10条
1 高红;黄德根;杨元生;;汉语自动分词中中文地名识别[J];大连理工大学学报;2006年04期
2 于鹏;刘大有;欧阳丹彤;;基于遗传与粒子群算法的Markov逻辑网学习研究[J];电子学报;2006年S1期
3 张玉芳;黄涛;艾东梅;熊忠阳;唐蓉君;;Markov逻辑网在重复数据删除中的应用[J];重庆大学学报;2010年08期
4 尹奇韡;李善平;;语义Web语言DAML+OIL及其应用初探[J];计算机科学;2003年01期
5 李文;陈叶旺;彭鑫;赵文耘;;一种有效的基于本体的词语-概念映射方法[J];计算机科学;2010年10期
6 刘娇蛟,龚丽,李建华;基于本体实现对网页文本的自动主题分类[J];计算机工程;2003年11期
7 胡鹤,刘大有,王生生;Web本体语言OWL[J];计算机工程;2004年12期
8 黄德根;孙迎红;;中文地名的自动识别[J];计算机工程;2006年03期
9 杜小勇,李曼,王大治;语义Web与本体研究综述[J];计算机应用;2004年10期
10 张颖;王文杰;史忠植;;基于本体的文本分类方法[J];计算机仿真;2009年05期
中国博士学位论文全文数据库 前3条
1 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
2 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
3 黄河;农业复杂自适应搜索模型研究及实现[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前3条
1 陈鹏飞;基于个性化本体的语义搜索引擎技术的研究与设计[D];河北工业大学;2011年
2 王雨果;基于本体的个性化信息检索系统研究[D];电子科技大学;2008年
3 沙丽华;面向领域文档的语义标注方法研究[D];吉林大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 王东雷;;基于单纯形算法的优化设计与实现[J];安徽农业科学;2007年36期
2 王煜;毛雪岷;;基于网络本体语言OWL数字化自然灾害应急救助预案要素的实现[J];安徽农业科学;2010年26期
3 ;A Preliminary Application of the Differential Evolution Algorithm to Calculate the CNOP[J];Atmospheric and Oceanic Science Letters;2009年06期
4 赵巾帼;徐德智;;语义Web的技术基础分析[J];鞍山师范学院学报;2007年04期
5 谭娟;李伯虎;;面向语义的C4ISR/Sim集成系统设计[J];北京航空航天大学学报;2006年10期
6 张德政;阿孜古丽;刘洁卉;;基于图分析的领域知识获取技术[J];北京科技大学学报;2007年S2期
7 唐培丽,王树明,胡明;基于语义的汉语文献主题词提取算法研究[J];吉林大学学报(信息科学版);2005年05期
8 唐培丽;解飞;陈志雨;;基于概念检索的中文搜索引擎研究[J];长春大学学报;2006年04期
9 张泽清;;基于领域本体的语义检索技术研究[J];赤峰学院学报(自然科学版);2011年06期
10 张泽清;;基于Ontology的人力资源语义检索技术研究[J];长春理工大学学报(自然科学版);2011年02期
中国重要会议论文全文数据库 前10条
1 马骥;朱慕华;肖桐;朱靖波;;面向移进-归约句法分析器的单模型系统融合算法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 李伟刚;张克亮;王慧兰;;基于航空领域本体知识库的语义检索研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 穆穆;王家城;;非线性全局及局部最优扰动和第一类可预报性[A];自然、工业与流动——第六届全国流体力学学术会议论文集[C];2001年
4 毕鲁雁;焦宗夏;范圣韬;赵四军;;基于本体的机载机电系统故障诊断研究[A];第五届全国流体传动与控制学术会议暨2008年中国航空学会液压与气动学术会议论文集[C];2008年
5 张德政;刘洁卉;;基于图分析的领域知识获取技术[A];着力提高高等教育质量,努力增强高校创新与服务能力——北京市高等教育学会2007年学术年会论文集(上册)[C];2008年
6 ;Chapter 9 Full Space and Subspace Methods for Large Scale Image Restoration[A];中国科学院地质与地球物理研究所第十届(2010年度)学术年会论文集(中)[C];2011年
7 王宏生;赵文;张路;;基于DOM解析的OWL本体关系数据库存储模式设计[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
8 王周宏;;符号几何规划的全局解方法[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
9 杨月婷;纪颖;王大力;;改进的有限内存BFGS算法的二次终止性质[A];中国运筹学会第七届学术交流会论文集(下卷)[C];2004年
10 刘洪伟;;基于一种新的共轭下降法的函数最小化(英文)[A];中国运筹学会第九届学术交流会论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 胡沙;面向服务的模具企业信息系统集成平台关键技术研究[D];华中科技大学;2010年
2 常旭;低维碳纳米材料和冰纳米管的结构与物性的数值模拟研究[D];南京大学;2010年
3 陈一稀;基于关系数据库的遗留系统向语义Web移植的研究[D];浙江大学;2010年
4 聂雪军;内容感知存储系统中信息信息生命周期管理关键技术研究[D];华中科技大学;2011年
5 王军;数字几何处理若干关键技术研究[D];中国科学技术大学;2011年
6 张珊;REST式GIS服务聚合研究及软件开发[D];华东师范大学;2011年
7 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
8 熊回香;面向Web3.0的大众分类研究[D];华中师范大学;2011年
9 罗永红;无缝运输信息网格的若干关键技术研究[D];中南大学;2011年
10 曾帅;普适计算环境下的信任管理研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 吕晨;搜索竞价广告关键词优化问题研究[D];山东科技大学;2010年
2 罗义兵;领域文本相似度计算方法研究[D];山东科技大学;2010年
3 赵永华;多学科本体构建与集成技术研究[D];山东科技大学;2010年
4 杨立志;基于语义网的图像检索算法的研究[D];广西师范学院;2010年
5 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年
6 王东亮;基于条件随机场模型的中文人名识别的研究[D];大连理工大学;2010年
7 廖文平;基于CRF的中文地名识别研究[D];大连理工大学;2010年
8 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
9 朱利君;基于茶学领域本体的智能检索研究[D];安徽农业大学;2010年
10 肖好冰;本体构建与网络交流平台的设计与实现[D];中国海洋大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 杨新武,刘椿年;遗传归纳逻辑程序设计中规则的位串表示法[J];北京工业大学学报;2001年03期
3 黄德根,朱和合,王昆仑,杨元生,钟万勰;基于最长次长匹配的汉语自动分词[J];大连理工大学学报;1999年06期
4 高红;黄德根;杨元生;;汉语自动分词中中文地名识别[J];大连理工大学学报;2006年04期
5 曾文;鄢军霞;;城市GIS地名定位工具的设计及应用[J];地球科学;2006年05期
6 丁璇,侯汉清,章成志;中文网页标引源主题表达能力的调查统计[J];大学图书馆学报;2002年06期
7 韩立新,陈贵海,谢立;一个面向Internet的个性化信息检索系统模型[J];电子学报;2002年02期
8 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
9 于鹏;刘大有;欧阳丹彤;;基于遗传与粒子群算法的Markov逻辑网学习研究[J];电子学报;2006年S1期
10 蔡怡峰;彭鑫;钱乐秋;;面向语义构件检索的交互式查询方案生成[J];电子学报;2008年08期
中国博士学位论文全文数据库 前4条
1 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
2 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
3 车海燕;面向中文自然语言Web文档的自动知识抽取和知识融合[D];吉林大学;2008年
4 陈叶旺;国家农业本休协同建构与语义检索若干技术研究[D];复旦大学;2009年
中国硕士学位论文全文数据库 前10条
1 刘兴宇;基于倒排索引的全文检索技术研究[D];华中科技大学;2004年
2 荆涛;基于后缀数组的Web用户访问模式高效挖掘算法[D];吉林大学;2005年
3 黄永光;基于网页挖掘的搜索引擎若干技术的研究[D];哈尔滨工业大学;2006年
4 郑任儿;基于本体的语义检索技术研究[D];华东师范大学;2007年
5 毛平;基于领域本体的文本信息语义检索研究[D];南京理工大学;2007年
6 罗昊;一种基于RDF的本体转换技术的研究与实现[D];湖南大学;2007年
7 李新春;基于WordNet的概念格语义匹配算法及其在搜索引擎上的应用[D];西华大学;2008年
8 李丽;基于本体的网页文本分类的研究[D];北京交通大学;2008年
9 谭春亮;基于本体的Deep Web语义搜索引擎[D];广西师范大学;2008年
10 张建梁;基于云计算的语义搜索引擎研究[D];复旦大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 顾鹏尧;;让搜索引擎更好地服务于教育教学[J];科学24小时;2003年Z1期
2 陈新颜;垂直搜索引擎辨析[J];现代情报;2004年09期
3 胡文胜;;垂直搜索助号码百事通与商务领航[J];每周电脑报;2006年32期
4 胡洁;丁宁;关静;曹福年;张磊;;基于“PUBMED+PDF”的医学垂直搜索引擎的实践[J];信息系统工程;2009年05期
5 一林;;垂直搜索:前进路上的喜与忧[J];互联网天地;2010年02期
6 牟思;;基于垂直搜索引擎的学校网站的研究与建设[J];中国教育技术装备;2011年21期
7 田野;垂直搜索火热为哪般[J];中国计算机用户;2005年37期
8 胡文胜;;垂直搜索助号码百事通与商务领航[J];每周电脑报;2006年31期
9 边凯;;你会搜索吗?[J];中国计算机用户;2007年23期
10 宿建光;;指点通:移动垂直搜索的创新者[J];通信世界;2007年03期
中国重要会议论文全文数据库 前10条
1 王上;于海;王钲旋;;Deep Web垂直搜索引擎设计与实现[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
2 林欢欢;王文杰;史忠植;;移动环境下垂直搜索引擎[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 王旭;杜军平;;质检总局互联网舆情监控系统中聚焦爬虫的研究[A];中国电子学会第十七届信息论学术年会论文集[C];2010年
4 袁柳;李战怀;陈世亮;;OntoWord:一种新的Web页面语义标注方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
5 陈波;姬东鸿;孙程;吕晨;;基于特征结构的汉语主谓谓语句语义标注研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 宋雨;郑怿;吴燕;;RDFa语义标注技术综述[A];2009全国计算机网络与通信学术会议论文集[C];2009年
7 韩先培;齐振宇;田野;王渝丽;赵军;;基于领域语义信息的百科问答系统[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 曾诚;李兵;何克清;;KMP算法在Web服务语义标注中的应用[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
9 韩先培;赵军;;基于Wikipedia的语义元数据生成[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
10 孙晓玲;林鸿飞;;统一语义视图下的垂直领域跨语言检索模型[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国重要报纸全文数据库 前10条
1 电子工业出版社 董娅 工业和信息化部电子科学技术情报研究所 周峻松;用开源软件建垂直搜索引擎[N];计算机世界;2010年
2 王艳;垂直搜索引擎市场看好[N];中国旅游报;2000年
3 赛迪网 方刚;不只是网站才垂直[N];中国计算机报;2000年
4 王靖;赛迪网推出垂直搜索引擎[N];人民日报海外版;2000年
5 记者 王浒;“去哪儿”旅行网完成第三轮1500万美元融资[N];中国旅游报;2009年
6 本报记者 王宏;搜索引擎 收费能催化市场吗[N];中国计算机报;2001年
7 徐瑾 张玉;市场潜力巨大 价值亟待挖掘[N];人民邮电;2009年
8 本报记者 王晓雁;垂直搜索引擎著作权之争未破题[N];法制日报;2009年
9 记者 吴德群;热门关键词两天抢注一空[N];深圳特区报;2009年
10 本报记者 胡钰;“去哪儿”网撬动在线旅游市场格局[N];华夏时报;2009年
中国博士学位论文全文数据库 前10条
1 胡宜敏;农业垂直搜索引擎语义化若干问题的研究与实现[D];中国科学技术大学;2012年
2 王晔;垂直搜索引擎若干问题研究[D];复旦大学;2011年
3 吴羽;面向时间敏感对象的垂直搜索引擎关键技术研究[D];浙江大学;2011年
4 姚绍文;语义化Web的关键技术及其应用研究[D];电子科技大学;2002年
5 刘海学;基于语义标注的元数据自动构建及其相关技术研究[D];华东师范大学;2010年
6 金鑫;基于本体的领域信息交互语义化研究[D];东华大学;2005年
7 虎晓红;用于图像检索的语义标注技术的研究[D];中国矿业大学(北京);2010年
8 熊华;视频内容结构化技术的研究与实现[D];中国人民解放军国防科学技术大学;2001年
9 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
10 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
中国硕士学位论文全文数据库 前10条
1 李春燕;企业信息垂直搜索引擎的研究与实现[D];中国地质大学(北京);2010年
2 齐鹏;垂直搜索引擎分类索引系统的设计与实现[D];大连海事大学;2010年
3 张楠;面向汽车主题的垂直搜索引擎研究与实现[D];西南交通大学;2010年
4 陈向东;宠物用品垂直搜索引擎研究与设计[D];西北农林科技大学;2010年
5 周佳庆;实时垂直搜索引擎数据抓取调度研究[D];浙江大学;2010年
6 华大年;手机产品信息垂直搜索引擎系统设计与开发[D];武汉理工大学;2011年
7 薛萍;基于教育领域的垂直搜索引擎的研究与实现[D];天津师范大学;2011年
8 冯效栋;垂直搜索引擎技术在网络舆情巡控中的研究与应用[D];中国海洋大学;2010年
9 张赢;个性化多媒体资源垂直搜索引擎技术研究[D];华东交通大学;2009年
10 李海升;垂直搜索引擎的研究与实现[D];西安电子科技大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026