收藏本站
《中南大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于本体的Web信息采集研究

王庆涛  
【摘要】: 目前Web上的信息是面向用户的,计算机无法理解,因此传统信息检索方式下,检索到的数据往往仅仅反映内容的一个侧面。在用户的需求信息和Web上的数据计算机无法准确的理解的情况下,在表示信息的Web和使用信息的用户之间产生了一道语义屏障。语义Web作为目前Web的一个延伸,目标是使Web上的数据具有机器可识别的语义,便于人机之间的交互与合作。本文的工作主要围绕一下几个方面展开。 首先,介绍了Tim Berners-Lee提出的语义Web和基于主题的信息检索。在分析目前语义Web和基于主题信息检索研究现状的基础上,提出了本文的研究方向。在实验室研究项目——基于本体的XML数据集成和查询研究系统框架下展开研究。 其次,阐述了论文涉及到的本体构建、Web信息采集、页面内容分析和主题相关度计算等关键技术以及面临的难点。并且针对每一个问题,提出了相应的可行的解决方案。为下面基于本体的Web信息采集系统的设计实现提供了理论和实践基础。 再次,设计了一个基于本体的Web信息采集系统——Ontowing。详细介绍了系统的框架结构及工作流程、主要组成及各个部分的功能。作为SNAX系统的子系统,通过将语义网技术同信息检索技术的结合实现了系统用户相关信息资源的采集。 最后,进行了系统实现,并通过实验验证了理论的有效性。对所做工作进行了总结和展望。
【学位授予单位】:中南大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP393.09

【参考文献】
中国期刊全文数据库 前5条
1 宋峻峰,张维明,肖卫东,唐九阳;基于本体的信息检索模型研究[J];南京大学学报(自然科学版);2005年02期
2 蒋凯;武港山;;基于Web的信息检索技术综述[J];计算机工程;2005年24期
3 金芝;基于本体的需求自动获取[J];计算机学报;2000年05期
4 陈康,武港山;基于Ontology的信息检索技术研究[J];中文信息学报;2005年02期
5 张英朝;张浩;张维明;肖卫东;黄金才;;基于本体的虚拟组织信息集成视图映射关系构建方法研究[J];小型微型计算机系统;2006年03期
中国博士学位论文全文数据库 前1条
1 李景;本体理论及在农业文献检索系统中的应用研究——以花卉学本体建模为例[D];中国科学院研究生院(文献情报中心);2004年
【共引文献】
中国期刊全文数据库 前10条
1 王二平;Web站点结构及网页特征信息的抽取[J];吕梁高等专科学校学报;2004年02期
2 杨宝森;来玲;;面向学科的网络信息挖掘系统研究[J];情报理论与实践;2006年02期
3 朱华;浅谈网络信息资源采集技术[J];国家图书馆学刊;2004年02期
4 景东升,吴斐;基于本体和Agent的地理空间信息语义共享[J];地理信息世界;2005年04期
5 陈刚;基于本体论的远程教学系统领域知识建模[J];中国远程教育;2004年23期
6 王晓东,高宏卿,张际平;基于Ontology疑难问题答疑系统的设计与实现[J];电化教育研究;2004年09期
7 杜英国;周少云;孙艳琼;;基于本体的领域分析[J];电脑知识与技术;2006年17期
8 唐世伟,李子芳,许少华;基于模糊超球神经网络的沉积微相识别[J];大庆石油学院学报;2002年02期
9 明仲,蔡树彬,李师贤,徐晶;本体的继承及一致性分析[J];电子学报;2005年04期
10 戴晓军,刘常昱,韩旭,李德毅;数据场在信息表征中的应用[J];复旦学报(自然科学版);2004年05期
中国重要会议论文全文数据库 前10条
1 景东升;;基于本体和agent的地理空间信息语义共享初探[A];中国地理信息系统协会第八届年会论文集[C];2004年
2 翟伟斌;许榕生;;基于Internet的CIS研究[A];第十三届全国核电子学与核探测技术学术年会论文集(下册)[C];2006年
3 伍春香;陈世鸿;;基于本体的教育资源检索机制研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
4 李立国;李庆忠;;电子政务中基于本体的语义信息查询系统的研究与实现[A];2005年全国理论计算机科学学术年会论文集[C];2005年
5 迟嘉昱;孙翎;;决策支持系统研究新进展[A];信息经济与国民经济增长方式的转变——中国信息经济学会2006年学术年会论文集[C];2006年
6 王栋;陈勇;徐建良;;基于预测的BitTorrent种子评估方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
7 刘剑;王智学;;基于本体模型的需求分析[A];2007系统仿真技术及其应用学术会议论文集[C];2007年
8 马玉莲;王宇冬;王鑫;;基于解释的分类算法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
9 张孝飞;代六玲;黄河燕;陈肇雄;;跨语言信息检索中查询关键词翻译转换算法[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
10 许强;吴国凤;;基于语义Web技术的电子政务信息模型研究[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 严亚兰;基于语义Web的知识处理研究[D];武汉大学;2005年
2 曲久龙;科技计划项目评估理论与方法研究[D];吉林大学;2006年
3 许跃敏;基于主题和主体框架的工程应用软件开发技术研究[D];浙江大学;2002年
4 姚绍文;语义化Web的关键技术及其应用研究[D];电子科技大学;2002年
5 刘洪刚;液体火箭发动机智能故障诊断理论与策略研究[D];国防科学技术大学;2002年
6 赵光峰;格蕴涵代数与图的升分解问题的研究[D];西南交通大学;2002年
7 汤永川;关于不确定性推理理论与知识发现的研究[D];西南交通大学;2002年
8 郑淑丽;Web信息集成系统及查询优化方法研究[D];合肥工业大学;2003年
9 徐振宁;基于本体的Web数据语义信息的表示与处理方法研究[D];中国人民解放军国防科学技术大学;2002年
10 应晓敏;面向Internet个性化服务的用户建模技术研究[D];中国人民解放军国防科学技术大学;2003年
中国硕士学位论文全文数据库 前10条
1 罗旋;基于复句领域本体的语义标注方法研究[D];华中师范大学;2006年
2 张玲;智能信息采集搜索策略研究[D];湖南大学;2004年
3 卢睿;基于XML的Web信息抽取研究[D];大连海事大学;2005年
4 陈晋进;基于本体论的个性化信息服务的研究[D];湘潭大学;2005年
5 刘艳青;基于Web的个性化信息检索研究[D];山东大学;2005年
6 王乐;基于本体的服装企业信息交互的研究[D];东华大学;2005年
7 张江涛;面向科学试验的工程数据仓库系统互操作框架研究[D];南京航空航天大学;2005年
8 张申恒;基于本体的企业文本检索模型研究[D];合肥工业大学;2005年
9 陈文武;GIS & RS一体化数据结构及索引机制研究[D];河海大学;2002年
10 汤大权;战场信息空间中信息共享技术研究[D];国防科学技术大学;2002年
【同被引文献】
中国期刊全文数据库 前7条
1 李振星,陆大珏,任继成,唐卫清,唐荣锡;基于潜在语义索引的Web信息预测采集过滤方法[J];计算机辅助设计与图形学学报;2004年01期
2 马亮,陈群秀,王俊,徐国伟;智能Web中文主题信息收集系统IRobot的设计[J];中文信息学报;2002年05期
3 储节旺;;国内外知识管理研究领域、主要成就及未来趋势[J];情报资料工作;2006年05期
4 聂哲;基于WEB的面向主题搜索引擎的设计与实现[J];计算机工程与设计;2003年02期
5 山岚,徐耀;基于Agent的智能化专业信息采集系统[J];计算机工程与设计;2005年11期
6 宗校军;沈轶;廖晓昕;;基于Web元数据的定题信息采集[J];系统工程与电子技术;2007年02期
7 张普;信息处理用语言知识动态更新的总体思考[J];语言文字应用;2000年02期
中国博士学位论文全文数据库 前2条
1 叶飞跃;关联规则及其元规则挖掘技术研究[D];南京航空航天大学;2006年
2 吴丽辉;个性化的Web信息采集技术研究[D];中国科学院研究生院(计算技术研究所);2005年
中国硕士学位论文全文数据库 前5条
1 李魁;大规模Web论坛采集技术研究[D];中国科学院研究生院(计算技术研究所);2006年
2 刘亮;网络信息资源保存问题研究[D];北京邮电大学;2006年
3 周文彬;一个Web本体的采集系统[D];东南大学;2006年
4 张晖;基于移动Agent信息采集系统与安全性研究[D];南京理工大学;2007年
5 赵佳鹤;基于语义分析的网络信息采集算法研究与应用[D];大连理工大学;2006年
【二级参考文献】
中国期刊全文数据库 前10条
1 方卫国,周泓;组织决策的信息共享机制探讨[J];北京航空航天大学学报;1998年06期
2 严开涛;虚拟企业及虚拟企业中的信息共享管理[J];北京航空航天大学学报;1998年06期
3 张英朝,张维明,肖卫东,黄金才;信息网格中基于本体的信息共享全局视图构建方法研究[J];计算机研究与发展;2004年10期
4 高济;问题求解建模──开发对问题求解任务的深入理解[J];计算机研究与发展;1994年07期
5 高济;基于表示本体论的智能系统开发[J];计算机研究与发展;1996年11期
6 王念滨,徐晓飞,邓胜春,王刚;EOMKIS:支持企业知识系统集成的企业本体论建立系统[J];计算机工程;1999年12期
7 钟凌燕,高济;一种基于UML的本体论建模方法[J];计算机工程;2003年02期
8 张艳,史美林;描述虚拟企业协作关系动态演变的模型[J];计算机集成制造系统-CIMS;2003年11期
9 陆汝钤,金芝,刘璘,蒋爱军,赖辉旻;客户/服务器风格的体系结构描述语言NEWCOM[J];计算机学报;1998年12期
10 吴文渊,曾振柄,符红光;基于Ontology的平面几何知识库设计[J];计算机应用;2002年03期
中国博士学位论文全文数据库 前1条
1 徐振宁;基于本体的Web数据语义信息的表示与处理方法研究[D];中国人民解放军国防科学技术大学;2002年
【相似文献】
中国期刊全文数据库 前10条
1 钟珞;王辉;李锐弢;宋华珠;;基于语义Web的网络学习资源库本体实现[J];计算机工程;2007年08期
2 牟冬梅;毕强;;语义Web技术对知识组织理论和实践的影响研究[J];图书情报工作;2006年06期
3 欧峦;;基于语义Web的供应链系统的设计与实现[J];科学技术与工程;2008年13期
4 肖克曦;王济军;王维花;;基于语义Web的网络教学平台构建研究[J];电脑知识与技术;2010年19期
5 付燕宁;金龙飞;王开锋;刘磊;;基于本体的信息检索系统的设计与实现[J];计算机应用研究;2006年11期
6 黄显堂;;基于本体的语义Web文本分类探讨[J];图书馆;2009年03期
7 李勇;浅谈XML下的语义Web[J];皖西学院学报;2004年02期
8 李满玲;杨志茹;罗花芝;;基于语义Web的精品课程资源库本体的建立[J];计算机与现代化;2010年06期
9 宋华珠;钟珞;王辉;李锐弢;;基于语义web在线学习资源管理的本体和元数据(英文)[J];东南大学学报(英文版);2006年03期
10 崔新会;何志强;;浅析基于语义web的信息检索优化及实现[J];科技致富向导;2011年20期
中国重要会议论文全文数据库 前10条
1 康达周;徐宝文;陆建江;李言辉;;支持语义web模糊本体的描述逻辑(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
2 蔡畅;李宏伟;李勤超;;语义层次的知识推理研究[A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C];2007年
3 马可方;李陶深;;语义Web和UDDI集成的研究[A];广西计算机学会2006年年会论文集[C];2006年
4 宋华珠;钟珞;王辉;李锐弢;;基于语义web在线学习资源管理的本体和元数据(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
5 满君丰;阳爱民;李建设;孙星明;;面向智能空间的共享本体问题研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
6 沈国华;黄志球;朱小栋;仲晶;项高友;;一种基于描述逻辑的语义Web服务匹配方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
7 甘仞初;谢莹;曹炳文;;需求驱动的自适应体系结构的知识体系研究[A];第八届中国管理科学学术年会论文集[C];2006年
8 赵泽宗;;比喻推理建构[A];逻辑今探——中国逻辑学会第五次代表大会暨学术讨论会论文集[C];1996年
9 戴佐培;宋春林;李净;;基于本体的中医经络知识库的设计与开发[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
10 钟福金;穆斌;;语义Web挖掘研究[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
中国重要报纸全文数据库 前10条
1 黄家艳;川电三公司汽机工程处本体班获“全国质量信得过班组”[N];西南电力报;2002年
2 清华大学计算机系 徐剑军 张钋 李涓子 王克宏;智能化应用的基石[N];计算机世界;2004年
3 刘春田;“知识”的本体和现实形态[N];中国知识产权报;2004年
4 中国科学院计算技术研究所 黄瑞史忠植;加强知识的共享与重用[N];计算机世界;2007年
5 大江;锻造本体竞争力[N];中国改革报;2006年
6 深圳报业集团驻京记者 陆云红;改革开放之窗创新活力之都[N];深圳特区报;2006年
7 任玉岭;一本体现时代精神的哲学教材[N];光明日报;2003年
8 郑敏;也谈本体杂文[N];中国文化报;2003年
9 宏图三胞高级副总裁 花贵侃;企业需要一条灵活的“尾巴”[N];电脑商报;2007年
10 左孝 记者蒋寒;世界最大本体装置在天原建成[N];科技日报;2005年
中国博士学位论文全文数据库 前10条
1 严亚兰;基于语义Web的知识处理研究[D];武汉大学;2005年
2 杜文华;本体的构建及其在数字图书馆中的应用研究[D];武汉大学;2005年
3 胡鹤;本体方法及其时空推理应用研究[D];吉林大学;2004年
4 安杨;基于本体的网络地理服务中的关键问题研究[D];武汉大学;2005年
5 罗正鸿;D_4/APAEDMS本体开环共聚及其数学模拟[D];浙江大学;2003年
6 陈向东;网络环境下的跨学科知识共享[D];华东师范大学;2005年
7 卢刘明;基于语义的web服务发现与组合关键技术研究[D];东华大学;2006年
8 陈华钧;Web语义查询与推理研究[D];浙江大学;2004年
9 文坤梅;基于本体知识库推理的语义搜索研究[D];华中科技大学;2007年
10 刘晓强;E-Learning知识共享与适应性应用环境研究[D];东华大学;2003年
中国硕士学位论文全文数据库 前10条
1 姜久雷;Semantic Web Services实例研究[D];西北大学;2006年
2 杨学明;基于本体的数字校园系统语义化研究与设计[D];国防科学技术大学;2005年
3 沈洪良;面向网络资源自动发现的语义服务器研究[D];东华大学;2005年
4 栾秀梅;基于Web的服务发现机制研究[D];山东师范大学;2006年
5 王庆涛;基于本体的Web信息采集研究[D];中南大学;2007年
6 胡必云;基于语义Web的信息检索应用研究[D];安徽大学;2007年
7 张盈谦;本体知识库在软件测试脚本自动生成中的应用[D];大连理工大学;2006年
8 刘燕;语义web服务发布与发现的关键技术研究[D];湖南师范大学;2006年
9 蒋红;基于语义Web的网络化制造知识集成技术的研究[D];兰州理工大学;2007年
10 王西玲;基于本体的教育语义网站研究与设计[D];山东理工大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026