收藏本站
《中国科学技术大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

地理信息检索若干技术研究

黎志升  
【摘要】: 万维网(WWW)已经逐步成为一种人们获取信息的重要来源,信息检索则是帮助人们快速准确的获取所需信息的技术。信息检索相关技术的研究对于国民经济的发展有着非常重要的现实意义,无论学术界与工业界都投入了越来越多的力量与资金来促进信息检索的研究与应用。另一方面,近年来地理信息系统技术的飞速发展以及基于地理位置的移动信息服务的普及,使得人们对地理相关信息的关注逐渐升温。因此,对于地理位置的信息检索技术的研究有着迫切的需求和现实意义。地理信息检索(GIR)就是关注地理信息的一种检索技术。多数文档都含有某种地理信息,如何对这些地理信息进行检索是一个非常值得研究的问题。目前对地理信息检索的研究内容主要包括地理信息抽取,针对地理信息的排序模型与算法,结合地理信息的索引结构,地理信息可视化以及地理信息挖掘等等。长远来看,基于地理位置的信息检索以及相关的服务,有着广阔的科研和应用前景。 本研究分别在如下方面对地理信息检索的相关技术进行了研究: 1.一种基于LDA模型的地理信息检索模型。目前大部分的检索模型都是基于关键词匹配的算法,但是检索的发展趋势是语义检索。LDA(LatentDirichlet Allocation)是近年发展起来的有效的文本概率图模型,它可以自动发现文本的潜在主题。本研究拟提出把LDA概率图模型和传统的文档检索模型相结合,利用LDA发现词之间潜在相关性的能力,提高文本信息检索的准确度。而地理信息检索是该算法的应用对象,因为表示地理位置的词互相之间有着很强的相关性,很多相关的地理位置不便在查询词中描述,所以通过该方法,能帮助减少查询词和文档之间的语义鸿沟,并提高检索结果的准确率。 2.一种基于语言模型的地理信息检索模型。区别于传统的信息检索,地理信息检索通过一个查询范围词(query spatial scope)来限制用户的兴趣区域。目前的技术一般是把该查询范围词作为一个过滤器,将在该范围之外的文档排除在查询结果中。但是,词在地理空间的词频分布并不是均匀的,那么词在排序结果中的重要性也应该随着查询范围的变化而有所改变。因此,我们提出了一种新的基于语言模型(Language Model)的地理信息检索模型,把查询范围引入到传统的语言模型中。在该模型中,我们引入了一个本地语言模型(Local Model)来描述查询词的地理分布特性。实验结果表明新的检索模型优于TF-IDF与传统的语言模型。 3.基于隐含地名的地理信息索引结构。目前的地理信息索引结构都没有考虑隐含的地理信息,例如,对于查询“snowstorms in North America”,传统的方法就是简单地返回所有包含“North America”的网页。实际上,假如一个网页包含“Canada”,“United States of America”,或者“Mexico”,也是跟这个查询相关的。“North America”可以看作是“Canada”的隐含地名。在这个研究中,我们把在文档中显式提到的地名的祖先称之为隐含地名,并提出了一种基于隐含地名的地理信息索引结构,并把它和不同的索引结构相比较。实验结果表明我们的结果好于之前的方法。 4.IR-tree:一种高效的地理信息索引结构。目前的地理信息检索系统采取的索引结构都是简单的反向索引结构与空间索引结构相结合的方式,该方式是顺序执行查询,需要遍历所有的相关文档,导致查询效率低下。实际上,用户通常只会关心top-k的结果,所以没必要对所有相关文档处理。所以本人提出一种把反向索引结构和空间索引结构R-tree有机结合的高效索引结构IR-Tree,通过R-tree对文档相关联的地理位置进行索引,并在R-tree中的每个节点保存辅助统计信息。该统计信息包含对文档进行排序所必需的统计量。同时我们提出一种新的Rank-based文档查询算法。该算法利用优先队列来保存IR-tree的树节点,这些节点按照tf-idf的值进行排序,每次只有一个节点将会被处理,那么只有最可能包括top-k文档的节点需要被检索,每当处于队列首的元素是文档时就可以把它放到结果队列中。当结果队列的文档数达到用户需要的k时,算法将会停止。IR-tree结合Rank-Based查询算法,将有效的减少文档搜索空间,只需要对top-k文档进行检索,从而减少了I/O的消耗,提高了查询效率。 5.一种新的地理信息查询词分类框架与算法。黄页在线查询是口前地理信息检索的主要应用之一。如何针对用户的查询词来提供有效的广告内容是工业界非常关注的课题,而对查询词分类后就可以根据查询词类别来提供合适的在线广告。黄页查询词和传统的查询词有很大的区别,一方面黄页查询词有地理位置的限制,另一方面,黄页查询词的类别体系是层次化的并且类别数目很大,而黄页也有层次化体系结构划分。本研究提出一种基于类别结构匹配的黄页查询词分类技术,该技术利用相似性公式找到黄页分类体系和目标分类体系的匹配关系,然后利用搜索结果对应的目标分类综合情况来进行查询词分类。为了得当更高的分类准确率,本研究提出了多种结果过滤算法。初步结果表明该技术的分类效果比简单的关键词匹配法和传统的SVM分类效果更好,而且无需人工标注训练数据,鲁棒性强,可以适用于任意大规模的目标类别体系。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:TP391.3

手机知网App
【引证文献】
中国期刊全文数据库 前3条
1 王剑;王健;高秉博;;基于时空感知能力的农业信息搜索技术研究[J];南方农业学报;2013年01期
2 任克江;张绍武;林鸿飞;;地理信息检索中基于文档地名感知的排序方法[J];北京大学学报(自然科学版);2013年02期
3 杜萍;刘勇;;地理信息Web检索系统体系结构、原理及发展[J];热带地理;2010年04期
中国硕士学位论文全文数据库 前4条
1 钟云云;基于地理信息的内容定向广告投放算法及性能研究[D];浙江大学;2011年
2 张大鹏;地名本体的构建及其在地名检索服务中的应用[D];首都师范大学;2011年
3 洪志远;基于Service Portal的地理信息共享模式探索及实现[D];中国测绘科学研究院;2011年
4 齐鹏;垂直搜索引擎分类索引系统的设计与实现[D];大连海事大学;2010年
【共引文献】
中国期刊全文数据库 前10条
1 陈祥松,邓苏,黄宏斌;GLAV集成方法中的模式匹配研究[J];安徽工程科技学院学报(自然科学版);2004年04期
2 王宏鼎;谭少华;唐世渭;杨冬青;童云海;;基于模式元素语义关系的模式合并方法研究[J];北京大学学报(自然科学版)网络版(预印本);2006年04期
3 王宏鼎;谭少华;唐世渭;杨冬青;童云海;;基于模式元素语义关系的模式合并方法研究[J];北京大学学报(自然科学版);2007年03期
4 张维蔚;李超;曾骁;熊璋;;一种多策略GML应用模式匹配方法[J];北京航空航天大学学报;2008年05期
5 何杰;陈能成;王伟;翟亮;;基于动态模式匹配的多版本网络要素服务统一访问方法[J];测绘科学;2011年04期
6 王育红;陈军;;GIS客户数据库更新的基本问题[J];地理信息世界;2008年01期
7 丁国辉;王国仁;赵相国;;多数据源上Top-k中间模式的产生算法[J];东北大学学报(自然科学版);2011年12期
8 钱颖;刘国华;陈子阳;赵孟;;模式匹配技术[J];燕山大学学报;2006年04期
9 高畅;刘国华;;一种改进的数据库模式匹配算法[J];燕山大学学报;2007年02期
10 王育红;牛亚辉;林艳;;顾及语义差异的基础地理信息客户数据库更新实施模型[J];地理与地理信息科学;2011年01期
中国重要会议论文全文数据库 前10条
1 ;Discovering Complex Matches Between Database Schemas[A];第二十七届中国控制会议论文集[C];2008年
2 孙科武;许斌;罗森;;属性驱动的Web服务分类方法[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
3 王育红;陈军;;GIS客户数据库更新自动化实施算法研究[A];中国测绘学会第九次全国会员代表大会暨学会成立50周年纪念大会论文集[C];2009年
4 王育红;蒋捷;;基础地理信息的客户更新服务问题[A];中国地理信息系统协会第八届年会论文集[C];2004年
5 佟冰;张忠平;宋丽;;一种改进的多源模式匹配算法[A];2005年全国理论计算机科学学术年会论文集[C];2005年
6 刘通;刘国华;刘欣;王聪;;ISMD:一种基于副本的完整模式匹配算法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
7 钱颖;刘国华;张忠平;沈兵红;张凌宇;;基于聚类的模式匹配方法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
8 刘杰;李伟光;刘振广;;基于BP神经网络的数据库模式匹配方法研究[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
9 何召卫;陈俊亮;;本体相似研究综述[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
10 钱钢;董逸生;;建立可扩展的、无歧义的XML模式映射[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国博士学位论文全文数据库 前10条
1 孟宇龙;基于本体的多源异构安全数据聚合[D];哈尔滨工程大学;2010年
2 潘鹏;Deep Web查询中的不确定性问题研究[D];山东大学;2010年
3 宋雅娟;Web服务组合方法研究[D];吉林大学;2011年
4 陈珂锐;基于本体演化的Deep Web数据抽取与注释[D];吉林大学;2011年
5 李常宝;基于索引的web服务发现研究[D];北京邮电大学;2011年
6 沈国华;基于描述逻辑的语义Web服务建模及推理研究[D];南京航空航天大学;2009年
7 邵世维;基于几何特征的多尺度矢量面状实体匹配方法研究与应用[D];武汉大学;2011年
8 车颖;计算无关模型驱动的ERP系统重构关键技术研究[D];哈尔滨工业大学;2011年
9 王颖;本体匹配器的选择与组合方法研究[D];哈尔滨工程大学;2011年
10 吴春明;Deep Web数据集成关键技术及其在农业领域的应用[D];西南大学;2011年
中国硕士学位论文全文数据库 前10条
1 徐扬;异构数据资源汇聚的模式及优化问题研究[D];山东科技大学;2010年
2 曾祥莉;ETL在经济普查信息发布系统中的应用研究[D];哈尔滨工程大学;2010年
3 李伟光;基于BP神经网络的数据库模式匹配方法研究[D];哈尔滨工程大学;2010年
4 刘国峰;数据模板匹配研究及在社保审计中的应用[D];哈尔滨工程大学;2010年
5 刘洁;基于关联挖掘的深层网络接口模式匹配方法的研究[D];哈尔滨工程大学;2010年
6 刘富江;网络数据源模式识别方法及策略研究[D];哈尔滨工程大学;2010年
7 赵阳耀;基于本体的数据源映射方法与策略[D];哈尔滨工程大学;2010年
8 刘杰雄;基于本体的爆破行业信息搜索技术的研究[D];华南理工大学;2010年
9 白杰英;本体在医疗信息整合中的应用与研究[D];长春工业大学;2010年
10 田相坤;基于概念分层的本体匹配策略的研究与实现[D];华东理工大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 李宏伟;蔡畅;李勤超;;基于Jena和地理本体的空间查询与推理研究[J];测绘工程;2009年05期
2 赵姗;成毅;陈晓斌;王强;;几种地理空间信息服务发现机制的比较和探讨[J];地理信息世界;2008年03期
3 查祝华;周旭;刘若梅;贾云鹏;路平;;OGC CSW规范实现探讨[J];测绘通报;2009年07期
4 黄茂军,杜清运,吴运超,李凤丹;地理本体及其应用初探[J];地理与地理信息科学;2004年04期
5 刘瑜;龚咏喜;张晶;高勇;;地理空间中的空间关系表达和推理[J];地理与地理信息科学;2007年05期
6 刘瑜;张毅;田原;薛露露;;广义地名及其本体研究[J];地理与地理信息科学;2007年06期
7 申思;薛露露;刘瑜;;基于手绘草图的北京居民认知地图变形及因素分析[J];地理学报;2008年06期
8 谢金辉;赵征;;基于UDDI的语义Web服务门户的设计与实现[J];电脑知识与技术;2009年10期
9 倪欢;许卓明;;OWL本体查询技术研究[J];河海大学学报(自然科学版);2006年03期
10 李淑霞;高俊;;地名本体的概念框架与构成研究[J];测绘科学技术学报;2008年03期
中国博士学位论文全文数据库 前10条
1 王兴玲;基于XML的地理信息Web服务研究[D];中国科学院研究生院(遥感应用研究所);2002年
2 辜寄蓉;基于元数据的综合数据管理与信息共享[D];成都理工大学;2003年
3 崔巍;用本体实现地理信息系统语义集成和互操作[D];武汉大学;2004年
4 赵村民;WEBGIS的QoS问题及关键技术研究[D];中国地质大学(北京);2005年
5 王建涛;基于Web的地理信息服务的研究与实践[D];中国人民解放军信息工程大学;2005年
6 柴胜;空间资源中信息语义注册与检索相关技术研究[D];吉林大学;2008年
7 周新忠;面向水利地理空间元数据研制与应用的关键技术研究[D];武汉大学;2006年
8 吴建国;WEB SERVICES构架下的地质信息集成平台研究[D];中国矿业大学;2008年
9 李学东;基于WEB的地学数据集成与发布技术研究[D];中国地质大学(北京);2009年
10 胡茂胜;基于数据中心模式的分布式异构空间数据无缝集成技术研究[D];中国地质大学;2009年
中国硕士学位论文全文数据库 前10条
1 王军;网络环境下面向服务的地理信息共享技术研究[D];哈尔滨师范大学;2010年
2 张东;基于语义相似度的地理信息检索技术研究[D];山东农业大学;2011年
3 李爱霞;基于Web Service的空间信息服务的注册与查找[D];武汉大学;2005年
4 汤焱彬;面向服务的空间信息门户研究[D];武汉大学;2005年
5 任函;大规模中文网页的自动分类研究[D];华中师范大学;2006年
6 徐泽平;数据挖掘在Internet信息检索中的应用[D];中国科学院研究生院(计算技术研究所);2001年
7 周柏贾;GIS在空间信息门户中的研究与应用[D];中国地质大学(北京);2006年
8 陈小峰;专业搜索引擎的数据存储研究[D];南京师范大学;2007年
9 孟庆崧;基于Web Service的空间信息服务描述和发现机制研究[D];国防科学技术大学;2006年
10 蔡国民;基于XML的个性化信息检索系统研究[D];中南大学;2007年
【二级引证文献】
中国期刊全文数据库 前2条
1 王剑;王健;高秉博;;基于时空感知能力的农业信息搜索技术研究[J];南方农业学报;2013年01期
2 傅丽君;潘旭伟;李娜;;集成自动分类的垂直搜索引擎及其应用[J];情报杂志;2012年12期
中国博士学位论文全文数据库 前1条
1 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年
中国硕士学位论文全文数据库 前2条
1 李长春;基于数字无线技术的调度管理系统设计与实现[D];北京交通大学;2012年
2 张力淼;高校图书馆数字资源整合与实践[D];东北石油大学;2012年
【相似文献】
中国期刊全文数据库 前10条
1 吴启明;;基于全信息理论的农业信息检索系统[J];安徽农业科学;2010年05期
2 沐士光;;网络信息挖掘探讨[J];玉溪师范学院学报;2006年09期
3 孙镇;王惠临;;组织机构文本信息资源管理应用研究[J];情报理论与实践;2010年09期
4 张新光,王建华;数据仓库信息处理技术研究[J];齐齐哈尔大学学报;2000年03期
5 丁纪云,蔡春娥;利用构造数据集评定数据挖掘过程的方法[J];湖南广播电视大学学报;2001年02期
6 任承业,罗伟其;校园信息系统中CRM与数据挖掘的结合和应用[J];计算机工程与应用;2003年13期
7 王艳;数据挖掘在数字图书馆中的应用[J];情报科学;2003年02期
8 邵红全,赵茜;用SQL Server2000实现数据挖掘的技术与策略[J];电脑开发与应用;2003年04期
9 耿庆鹏,卢子芳;利用数据挖掘技术实现对电信行业用户欺诈行为的预测[J];电信快报;2003年10期
10 蒋良孝,蔡之华;基于数据仓库的数据挖掘研究[J];计算技术与自动化;2003年03期
中国重要会议论文全文数据库 前10条
1 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
2 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
3 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
4 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
5 朱扬勇;黄超;;基于多维模型的交互式数据挖掘框架[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
6 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
7 陈涛;胡学钢;陈秀美;;基于数据挖掘的教学质量评价体系分析[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
8 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
9 王星;谢邦昌;戴稳胜;;数据挖掘在保险业中的应用[A];北京市第十二次统计科学讨论会论文选编[C];2003年
10 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病阴阳类证辨证规范的数据挖掘研究[A];2010中国医师协会中西医结合医师大会摘要集[C];2010年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
中国博士学位论文全文数据库 前10条
1 黎志升;地理信息检索若干技术研究[D];中国科学技术大学;2009年
2 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
3 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
4 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
5 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
6 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
7 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
8 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
9 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
10 刘东升;面向连锁零售企业的客户关系管理模型(R-CRM)研究[D];浙江工商大学;2008年
中国硕士学位论文全文数据库 前10条
1 王斌;网络制造资源多层次智能检索模型的研究[D];贵州大学;2006年
2 廖赛恩;养生方数据挖掘分析系统的研制[D];湖南中医药大学;2010年
3 李坤然;数据挖掘在股市趋势预测的应用研究[D];中南林业科技大学;2008年
4 郑宏;数据挖掘可视化技术的研究与实现[D];西安电子科技大学;2010年
5 杜金刚;数据挖掘在电信客户关系管理及数据业务营销中的应用[D];北京邮电大学;2010年
6 徐路;基于决策树的数据挖掘算法的研究及其在实际中的应用[D];电子科技大学;2009年
7 梁小鸥;数据挖掘在高职教学管理中的应用[D];华南理工大学;2011年
8 王浩;数据挖掘在上海市职业能力考试院招录考试优化管理项目中的运用研究[D];华东理工大学;2012年
9 唐松;基于数据挖掘的高校评教系统设计与实现[D];电子科技大学;2010年
10 黎卫英;数据挖掘在中职幼教课程改革中的应用[D];福建师范大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026