收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于林业科学数据的语义检索研究

张乃静  
【摘要】:随着技术的发展和观念的变更,Web已经成为人们获取信息的主要来源之一,承载的信息量以爆炸方式急剧增长,它在带给人们大量信息的同时,也使准确检索所需信息变得困难。给Web赋予语义信息,将Web作为基于知识的资源共享平台,让人们更加方便快捷地获取信息,是Web发展的必然趋势。 科学数据共享工程是国家科技创新体系建设的重要内容,也是我国科技发展基础条件大平台的重要组成部分。林业科学数据共享工程作为其中之一,门户网站林业科学数据中心在十多年的建设和运行服务中不断地深化和拓展,影响范围不断扩大,数据量也不断增加。面对如此大量的林业科学数据,如何让使用者更加快速、便捷地查找到所需内容是平台不断探索和追求的目标。针对传统信息检索中存在的问题,本文尝试从语义的角度挖掘隐藏在数据背后的信息和规律,以期为用户提供更高质量的数据服务。 语义信息检索是一种在传统信息检索方法的基础上与领域本体知识管理、数据挖掘和自然语言处理相结合的新技术。本文针对基于本体的语义信息检索进行了深入的研究,以林业科学数据本体为基础,提出了基于林业科学数据的语义信息检索模型,并从系统的角度对本体知识模型、文档的语义预处理、语义查询扩展以及语义检索等主要技术方法进行了分析和研究,主要内容和结论如下: (1)以本体的构建理论及技术为指导,构建了林业科学数据本体模型。详细阐述了本体模型中,概念集的选取、核心概念的主要关系和属性及属性之间的关系。为基于林业科学数据本体的语义信息检索提供了重要的基础。 (2)对语义Web框架进行研究,描述和分析了林业科学数据本体知识模型的维护、存储、推理及查询方法。经过比较研究发现:本体的TDB持久化存储方案比关系数据库更为高效,实验中,前者存储本体的效率最多优于后者60倍;同样,使用Jena和Pellet推理相结合的方法对林业科学数据本体进行陈述三元组推理比单独使用其中一种的推理方法的效率高10%以上。 (3)对文档进行语义预处理研究。经过对现有林业科学数据的分析,构建了领域词典,专业词汇达7万余条,提高了分词的精度;以向量空间表示词汇在文档中的特征权重,从林业科学数据本体中提取了特征概念集,并作为聚类中心,以余弦相似度作为距离函数,使用改进的k-均值模型对文档进行聚类,并对聚类文档的倒排索引方法进行分析。实验表明使用该聚类方法的聚类结果正确率为81.4%。 (4)提出了一种语义查询扩展方法。将用户的查询请求分为单关键词、多关键词和疑问句3种情况进行分析处理。单关键词使用改进的语义相似度进行查询扩展;多关键词使用语义推理和语义相似度相结合的查询扩展方法;对于疑问句探索性的提出了基于句法分析和语义推理相结合的查询扩展方法。这些语义查询扩展方法是实现语义信息检索的核心内容。 (5)在前文介绍的相关理论和研究的基础之上,利用语义Web框架设计开发了基于林业科学数据的语义信息检索系统,实现了信息的语义查询方式。并且通过实验分析,与传统基于关键词匹配的检索模型进行对比。结果表明,本文构建的语义检索方法无论在查全率还是在查准率上的表现都优于传统的检索方法。 语义信息检索的研究不仅具有重要的理论价值,而且还有实际的应用价值。本文围绕林业科学数据中心现有的八大类数据,对林业科学数据的语义检索进行了深入的研究和探索。通过本体理论方面的研究,构建了林业科学数据本体,为实现林业领域知识模型的共享和复用提供了条件。同时探讨了利用本体实现林业科学数据语义检索的一般方法,在上述研究的基础上,结合网络计算技术设计开发了林业科学数据语义检索系统并进行评价,为海量林业科学数据在语义层次上的共享提供了理论基础和技术支撑。同时,语义检索系统的实现为林业科学数据共享提供了一个全新的思路,对其它数据共享平台的相关研究具有借鉴意义。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘珊慧;万韵;杨乐;;基于本体的农业信息资源语义检索过程研究[J];安徽农业科学;2009年23期
2 刘珊慧;杨乐;万韵;;本体在农业信息检索中的应用[J];农机化研究;2009年10期
3 李广庆;何丰;;一种基于本体的农业气象系统的研究及设计[J];硅谷;2010年21期
4 张华;梁宇生;;基于实例图像自动语义标注方法的研究[J];山东农业大学学报(自然科学版);2011年02期
5 王芳;滕桂法;张玉新;任力生;马建斌;赵洋;;基于本体的农业问答语义管理系统设计与实现[J];河北农业大学学报;2008年05期
6 于昕梅,赵慧民;数据挖掘在图像语义检索中的应用[J];内蒙古农业大学学报(自然科学版);2005年01期
7 史婷婷;沈玉利;;以本体为核心的图像检索研究[J];仲恺农业工程学院学报;2010年03期
8 孙想;冯臣;吴华瑞;;基于语义Web的农业生产知识集成技术[J];农业工程学报;2008年S2期
9 周国民;樊景超;张静;丘耘;;“农搜”系统的研发与应用[J];农业网络信息;2009年08期
10 熊金辉;杨勇;罗海燕;王淑彦;刘怡良;;基于扩展SKOS模型的简单农业本体系统建设方法[J];沈阳农业大学学报;2010年04期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 丁政建;张路;;基于本体的语义检索研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
2 王洪俊 ;沈水荣 ;黄翬 ;;“人民金典”语义检索系统实现方法和技术[A];中国新闻技术工作者联合会2011年学术年会论文集(上篇)[C];2011年
3 张赪军;刘祥瑞;李军;黄红梅;;基于本体的语义检索技术研究[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
4 李伟刚;张克亮;王慧兰;;基于航空领域本体知识库的语义检索研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 刘广艳;孙莹;黄保海;林培光;;基于本体方法的改进VSM语义检索模型[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
6 周国民;丘耘;郑彦妍;曾枝连;樊景超;;基于SDD算法的特定网页采集技术[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
7 罗治平;;高校图书馆知识服务的个性化研究[A];全国高校社科信息资料研究会第12次理论研讨会论文集[C];2008年
8 房江太;黄映辉;李冠宇;;基于WSDL-S的Web服务语义标注方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
9 黄明初;钟威;何拥军;蒙斌;;基于查询扩展的数字档案检索策略[A];广西计算机学会2010年学术年会论文集[C];2010年
10 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
中国博士学位论文全文数据库 前10条
1 张乃静;基于林业科学数据的语义检索研究[D];中国林业科学研究院;2013年
2 王琦;古代壁画的语义检索技术及应用研究[D];浙江大学;2011年
3 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
4 宣云干;基于潜在语义分析的社会化标注系统标签语义检索研究[D];南京大学;2011年
5 姚原岗;异质工程文档语义检索的若干问题研究[D];浙江大学;2012年
6 杨月华;基于领域知识模型的突发事件智能信息检索系统研究[D];北京邮电大学;2013年
7 杜文华;本体的构建及其在数字图书馆中的应用研究[D];武汉大学;2005年
8 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
9 梅翔;语义检索中若干关键问题的研究[D];北京邮电大学;2007年
10 孙元;多媒体语义检索关键问题研究[D];吉林大学;2010年
中国硕士学位论文全文数据库 前10条
1 姜甲涛;模糊本体在关系数据库系统语义检索中的研究[D];大连海事大学;2010年
2 董文清;基于框架网络本体的语义检索模型[D];山西大学;2010年
3 苏山佳;基于大众标注的对等网语义检索系统模型研究[D];西安电子科技大学;2010年
4 韦超;语义检索在ERP系统检索引擎中的研究应用[D];华北电力大学(北京);2011年
5 曹立勇;基于本体的检索模型的研究[D];安徽大学;2010年
6 张智鹏;基于语义检索的结构化P2P网络模型研究[D];西华大学;2010年
7 王国琴;基于语义检索的概念空间研究[D];南京理工大学;2004年
8 张利利;基于模糊本体的关系数据库语义检索研究[D];大连海事大学;2011年
9 胡必云;基于语义Web的信息检索应用研究[D];安徽大学;2007年
10 张亮亮;基于领域本体的语义检索研究[D];吉林大学;2009年
中国重要报纸全文数据库 前7条
1 本报记者 易凌珊;酷讯旅游推特色搜索 搜索功能细分成趋势[N];通信信息报;2011年
2 ;多方协作发展内容管理[N];中国计算机报;2003年
3 韦升阳;ECM:在业务系统中提炼信息[N];中国计算机报;2003年
4 上海交通大学图书馆 杨宗英 郑巧英;数字图书馆的三种主流模式[N];中国电脑教育报;2004年
5 郭华强;靠合作发展内容管理[N];中国计算机报;2003年
6 艾文;郭华强 勇做IT冲浪人[N];中国计算机报;2004年
7 彭遂莅 李涛;成都公开保险营销员信用信息[N];中国保险报;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978