收藏本站
《大连理工大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于XML的移动信息检索模型研究

王艳萍  
【摘要】:近年来,信息检索技术的出现,给人们获取信息带来了极大的方便,而XML在信息管理、电子商务、移动通信、网络教育、电子文档交换等诸多领域也有很广泛的应用。本文设计了一个基于XML的移动信息检索系统,主要包括索引库的建立、关键词加权、检索、相似度计算几个部分。 尽管目前基于XML的信息检索模型研究与应用已经取得了很大进展,但在检索方面仍然存在一些问题,如何能使权重更加反映用户的需求,如何能够使检索的查全率与查准率获得提高,如何能够使XML文档结构和内容信息得到充分的挖掘。 针对上述问题,本文根据实际需求,在深入研究分析XML与向量空间模型的基础上,建立了基于内容和结构的倒排索引库,并将各种加权方法应用到XML信息检索领域中,提出了领域词典加权、结构位置、节点距离加权共同作用进行加权的方法。文中详细描述了基于模型的原型系统的总体设计、实现和相关的算法。 本论文的主要工作如下: 1、提出了原型系统的框架设计,并且介绍了此原型系统的设计思路、技术路线以及各个主要的模块的功能。 2、给出了索引库的建立方法、关键词加权的三种不同方法的结合公式、查询与文档之间的相似度计算、检索以及移动设备接口实现的主要算法。 3、实现了一个基于XML的移动信息检索系统,利用Java平台实现,并应用Servlet和JDBC实现移动客户端数据的传输以及对数据库的访问。 4、通过对召回率—精确率曲线的数据进行分析,分析原型系统对于召回率和精确率的提高。 本研究工作的开展,主要是为了解决现实问题,满足当前应用需求,同时积累系统开发研制的经验。基于XML的移动信息检索模型的研究与开发具有一定的应用价值和学术价值。
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:G354

【引证文献】
中国期刊全文数据库 前1条
1 周翔;;XML技术在无线领域中的应用[J];信息技术;2010年01期
【参考文献】
中国期刊全文数据库 前10条
1 武旭,须德;基于向量空间模型的文本自动分类系统的研究与实现[J];北方交通大学学报;2003年02期
2 曹亮,王茜,卢菁;XML数据在关系数据库中存储和检索的研究和实现[J];东南大学学报(自然科学版);2002年01期
3 吴劲,陈泽琳;基于部分匹配的XML文本文档向量检索模型[J];电子学报;2002年S1期
4 周勇,韩洁,史忠植;XML数据库与关系数据库协作研究[J];计算机工程与应用;2002年13期
5 杨小平,丁浩,黄都培;基于向量空间模型的中文信息检索技术研究[J];计算机工程与应用;2003年15期
6 盖杰,王怡,武港山;基于潜在语义分析的信息检索[J];计算机工程;2004年02期
7 张荣进;知识库系统分析及用XML表示通用知识库[J];计算机工程与科学;2003年03期
8 李京,庄成三;用XML对数据库查询的方法[J];计算机应用;2000年10期
9 李观华,范辉;J2ME在移动通信程序中的应用[J];计算机应用;2003年03期
10 金燕,李建华,杨宇航;WWW上的全文信息检索技术[J];计算机应用研究;1999年01期
【共引文献】
中国期刊全文数据库 前10条
1 唐红梅,郑刚;基于XML数据库的存储及映射研究[J];安徽工程科技学院学报(自然科学版);2004年03期
2 黄孝;;XML文档与关系数据库的数据转换研究[J];安庆师范学院学报(自然科学版);2006年02期
3 宋昊苏;李宁;张伟;;VSM模型在文档结构识别中的应用[J];北京信息科技大学学报(自然科学版);2011年06期
4 吕燕;基于J2ME与WebService架构的无线Internet应用研究[J];北京工商大学学报(自然科学版);2004年06期
5 代丽;李晓燕;孙良;;XML与关系型数据库数据转换技术的研究[J];重庆科技学院学报(自然科学版);2010年06期
6 李军;;国内语义检索研究计量分析[J];当代图书馆;2011年04期
7 吴江宁;王晓欢;;面向呼叫中心的知识导航系统研究[J];大连理工大学学报;2009年06期
8 刘磊;;基于潜在语义分析的JAVA类库检索方法[J];电脑开发与应用;2006年03期
9 阎亚杰;;网页去重方法研究[J];电脑开发与应用;2008年08期
10 陈丽珍;卡米力·毛依丁;;基于WEB信息检索系统中维文处理方面的研究[J];电脑知识与技术;2005年36期
中国重要会议论文全文数据库 前9条
1 郭燕慧;王枞;钟义信;;语言认知与主题内容识别[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
2 原福永;杨治秋;王海霞;;一种基于向量空间模型的文档聚类算法研究[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
3 马春雷;;基于向量空间模型的中文文本检索研究[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年
4 胡金柱;陈俊平;卢丽君;赵东萌;张琮;王益维;;基于本体视图的特征项抽取方法研究[A];第二十二届中国(天津)'2008IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2008年
5 胡金柱;陈俊平;卢丽君;赵东萌;张琮;王益维;;基于本体视图的特征项抽取方法研究[A];第二十三届中国(天津)2009IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2009年
6 刘国刚;;人工智能客户服务体系的研究与实现[A];2008年中国通信学会无线及移动通信委员会学术年会论文集[C];2008年
7 曹玮祺;梁华瑞;朱雷;李涓子;王克宏;;基于半结构化信息模型的信息检索[A];第六届全国计算机应用联合学术会议论文集[C];2002年
8 彭渊;赵铁军;郑德权;于浩;;基于特征句抽取的网页去重研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 杨喜权;张一鸣;王大勇;;基于特征码的大规模XML文档去重算法研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
中国博士学位论文全文数据库 前10条
1 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年
2 蔡盈芳;基于本体的航空产品知识库构建研究[D];北京交通大学;2011年
3 杨瑞龙;基于短语特征的Web文档聚类方法研究[D];重庆大学;2010年
4 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
5 孙宏伟;XML与RDB的多层次双向数据集成技术研究[D];西北工业大学;2003年
6 左维;基于XML/Web Services的月球探测数据管理与集成技术研究[D];中国科学院研究生院(地球化学研究所);2004年
7 赵野军;橡胶挤出机智能CAD的技术和方法研究[D];北京化工大学;2005年
8 张磊;个性化信息分发及概念检索的研究[D];中国科学院研究生院(计算技术研究所);2002年
9 戴敏;多工序制造过程质量分析方法与信息集成技术研究[D];东南大学;2006年
10 郝占刚;基于遗传算法等技术的数据与文本聚分类研究[D];天津大学;2006年
中国硕士学位论文全文数据库 前10条
1 白林;基于路径表达式的XML索引查询技术[D];郑州大学;2010年
2 王洋;基于潜在语义分析的智能搜索技术研究[D];哈尔滨工程大学;2010年
3 蔡颂梅;语义增强的关系相似度度量算法研究[D];华东师范大学;2011年
4 于飞;基于搜索引擎的个性化推荐研究[D];哈尔滨理工大学;2010年
5 户文贵;基于J2ME的手机校友录系统的设计[D];南昌大学;2010年
6 张庐颖;基于粗糙集的K-means研究[D];北京交通大学;2011年
7 丁宝琼;网络文本信息采集分析关键技术研究与实现[D];解放军信息工程大学;2009年
8 吴高;基于数据挖掘的商品资讯投送平台研究与实现[D];电子科技大学;2011年
9 杨新庆;基于Android平台的无线旅游导航系统的设计与实现[D];吉林大学;2011年
10 赵旭;桥梁施工期安全监测与应急救援系统研究[D];武汉理工大学;2011年
【同被引文献】
中国期刊全文数据库 前2条
1 张沛;WAP使移动Internet成为现实[J];现代电信科技;2000年02期
2 曹鸣鹏,许林英,赵伟;基于WAP协议实现无线通信[J];移动通信;2001年04期
【二级参考文献】
中国期刊全文数据库 前7条
1 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
2 田萱;刘希玉;孟强;;基于BP神经网络的文档聚类研究[J];计算机科学;2002年08期
3 唐春生;金以慧;;基于聚类特性的大规模文本聚类算法研究[J];计算机科学;2002年09期
4 林鸿飞,姚天顺;基于潜在语义索引的文本浏览机制[J];中文信息学报;2000年05期
5 王娟琴;三种检索模型的比较分析研究——布尔、概率、向量空间模型[J];情报科学;1998年03期
6 曾民族;文本信息检索技术进展和性能评价框架[J];现代图书情报技术;1997年03期
7 曹鸣鹏,许林英,赵伟;基于WAP协议实现无线通信[J];移动通信;2001年04期
【相似文献】
中国期刊全文数据库 前10条
1 罗超;郭斌;龙侃;;基于Cross-Validation模型的可扩展标记语言文本分类算法对比研究[J];井冈山大学学报(自然科学版);2010年03期
2 吴於茜;在平面设计软件中实现SVG格式文档输出[J];计算机工程与应用;2001年09期
3 张伟都,周海东,钟共鸣,张素伟;面向XML的数据管理系统[J];计算机工程与应用;2001年20期
4 李天庆,张毅,张冰,胡东成;基于XML的体育数据规格化存储技术研究[J];计算机工程与应用;2001年22期
5 张晓林;基于XML的信息组织与处理:1.XML技术体系[J];情报科学;2001年08期
6 李慧,何绍华;XML在图书馆系统中的实现技术[J];现代图书情报技术;2001年04期
7 谈春梅,段卫华,田质斌;标准文献数据库系统的设计与实现[J];现代图书情报技术;2001年06期
8 李景春,武港山,张福炎;基于转换的光盘文档库数据生成和浏览[J];小型微型计算机系统;2001年04期
9 周建洪,吴以群,庞引明,楼荣生;XML文件系统的设计[J];计算机工程与科学;2001年02期
10 袁琳,李秉严;SGML、HTML、XML的比较[J];四川图书馆学报;2001年03期
中国重要会议论文全文数据库 前10条
1 王桐;刘大昕;田迪;孙伟;张万松;;一种改进的XML向量空间模型及其近似匹配算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
2 于士涛;袁晓洁;师建兴;杨娜;;一种Web问答系统中基于XML片段的语义项模型[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
3 杨建武;陈晓鸥;;XML文档集的聚类研究[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
4 江腾蛟;万常选;;基于答案结点的XML文档模糊检索排序模型[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
5 郑仕辉;何奇;张龙;梁宇奇;周傲英;;XML文档的相似测度研究[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 郭志懋;周傲英;;XML数据的在线过滤[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
7 何震瀛;李建中;王宏志;;XML数据的关系存储[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
8 丁峰;王煜;姚延涛;沈钧毅;;从XML模式到数据库模式[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
9 谈子敬;施伯乐;;XML导出数据库表的实现与应用[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
10 罗道峰;孟小峰;;一种面向XML文档的基于角色的扩展访问控制方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
中国重要报纸全文数据库 前10条
1 秦林;《XML完全探索》[N];中华读书报;2001年
2 本报记者 李瀛寰;XML推了网络一把[N];中国计算机报;2000年
3 ;分化并不能阻止XML发展[N];中国计算机报;2000年
4 ;为XML标准定标准[N];中国计算机报;2001年
5 IDG电讯;Microsoft、IBM共同制定XML标准[N];计算机世界;2000年
6 北京邮电大学 张剑;XML与HTML的结合(上)[N];计算机世界;2001年
7 本报记者 陆 杰;XML丛林的新秀[N];中华读书报;2002年
8 北京邮电大学 张剑;XML技术预览[N];计算机世界;2001年
9 北京邮电大学 张剑;XML与HTML的结合(下)[N];计算机世界;2001年
10 侯青;国际电子商务XML/EDI特点及现状[N];国际商报;2001年
中国博士学位论文全文数据库 前10条
1 梁作鹏;面向Web的XML检索关键技术研究[D];东南大学;2005年
2 郭永明;XML文档交互式信息检索技术研究[D];东华大学;2010年
3 沈洁;基于自动机的XML数据过滤研究[D];哈尔滨工程大学;2010年
4 叶晓峰;基于XML的冲压模具设计知识重用技术研究[D];华中科技大学;2010年
5 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年
6 张晨静;XML关键字过滤技术[D];复旦大学;2011年
7 宁博;XML查询模式匹配及文档过滤技术研究[D];东北大学;2009年
8 汪源;XML事务模型及并发控制研究[D];浙江大学;2006年
9 许建军;对结构化和半结构化数据的关键字搜索研究[D];复旦大学;2007年
10 刘喜平;XML文档搜索中的查询处理技术研究[D];江西财经大学;2010年
中国硕士学位论文全文数据库 前10条
1 王艳萍;基于XML的移动信息检索模型研究[D];大连理工大学;2006年
2 姚继伟;基于XML的Web文本挖掘的研究[D];吉林大学;2010年
3 李丽娟;XML文档结构相似度研究及在文档聚类中应用[D];山东大学;2007年
4 潘奇;基于语言模型的XML信息检索的研究与实现[D];内蒙古大学;2010年
5 朱杰;基于主题和结构的XML网页的数据抽取[D];华侨大学;2005年
6 刘靖超;面向数据采集的信息集成系统设计与实现[D];河北工业大学;2005年
7 王旭磊;基于CBR的电子商务网站智能设计系统的研究[D];青岛大学;2005年
8 李志明;基于Web服务的在线考试系统应用研究与实现[D];广东工业大学;2005年
9 江静;基于XML的公文管理系统设计与应用研究[D];南京理工大学;2005年
10 陈美云;基于XML的柔性信息集成技术研究[D];山东科技大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026