收藏本站
《北京邮电大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

语义信息自动生成研究

刘常  
【摘要】: 互联网的出现为人们获取信息提供了极大的便捷,但随着信息的海量增长,人们已经越来越难从网上找到自己想要的信息了,大量的有用信息淹没在了无用信息之中。为了使网络服务更加的个性化与智能化,万维网之父伯纳斯李(Tim Berners-Lee)提出了语义网的概念。语义网以本体的方式表示信息,使机器能够理解网上的信息,从而为实现更加智能化的信息服务提供了可能。 语义网的出现同时也提出了一道难题,那就是如何将互联网上现有的海量信息以规范化的形式来表示?如果纯粹靠人手工来完成的话,那将是一项艰巨的费时费力的任务。本论文结合现有的信息抽取技术和语义网技术,探索了一种将存在于网上的传统web信息自动地转化为语义信息,并以语义网要求的知识表示方法存储,以供语义网使用的技术,并在一个旅游信息服务系统(TBJ Traveling in Beijing)中使用。 本论文首先分析了当前万维网的不足以及语义网出现的原因,针对TBJ系统的特点和需求,提出了语义信息自动生成算法和系统的设计实现方案,并应用到TBJ系统的实现中。语义信息自动生成系统由网上信息获取、语义信息生成和语义信息表示三个主要模块组成。 在实现过程中采用了和网页结构相关的抽取以及和内容相关的抽取两个抽取步骤,这样可以较好的利用网页的半结构化特点,同时在和内容相关抽取中,提出了使用语义相似度量的方法。获得了较好的抽取精度。
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP391.1

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前1条
1 李家琪;一种基于信息分布的元搜索结果后处理方法研究[D];北京邮电大学;2008年
【参考文献】
中国期刊全文数据库 前7条
1 陈少飞,郝亚南,李天柱,徐林昊,杨文柱;Web信息抽取技术研究进展[J];河北大学学报(自然科学版);2003年01期
2 张晨彧,穆斌;在不同本体环境下的语义检索[J];合肥工业大学学报(自然科学版);2005年02期
3 胡东东,孟小峰;一种基于树结构的Web数据自动抽取方法[J];计算机研究与发展;2004年10期
4 刘挺,王开铸;基于篇章多级依存结构的自动文摘研究[J];计算机研究与发展;1999年04期
5 常育红,姜哲,朱小燕;基于标记树表示方法的页面结构分析[J];计算机工程与应用;2004年16期
6 许建潮,侯锟;Web信息的自主抽取方法[J];计算机工程与应用;2005年14期
7 吴伟,刘友华;基于DOM的Web信息自动抽取[J];现代图书情报技术;2004年02期
【共引文献】
中国期刊全文数据库 前10条
1 曹恒;张茜;;农作物信息垂直搜索引擎的研究[J];安徽农业科学;2012年19期
2 樊孝忠,柳林,任锋;汉字智能输入刍议[J];兵工自动化;1995年04期
3 李伟;黄颖;;基于HtmlParser的网页信息提取[J];兵工自动化;2007年07期
4 李国和,赵沁平;信息系统的一种分块特征选取方法[J];北京航空航天大学学报;2003年03期
5 李国和,赵沁平,王喜;一种频繁复合项目集的混合求解方法[J];北京航空航天大学学报;2004年08期
6 宁文如,申海军;飞行员导航专家系统[J];北京航空航天大学学报;1997年06期
7 胡思康;曹元大;;Web网页知识获取技术[J];北京理工大学学报;2006年12期
8 高鲁山;论计算机辅助编辑和编辑专家系统[J];编辑学报;1991年01期
9 王孟杰;;新一代互联网业务计费功能的研究与实现[J];北京邮电大学学报;2008年03期
10 王建民,吴文昱;一种新的自动布线算法及动态数据库的实现[J];北京邮电大学学报;1994年03期
中国重要会议论文全文数据库 前10条
1 胡飞;;一种Web页面的主题区域搜索方法[A];2008年计算机应用技术交流会论文集[C];2008年
2 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
3 张二梅;刘辰;杨正球;;基于HTMLParser自动生成测试用例的研究[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
4 孙兆豪;李昂;刘坤起;解建军;;论代数、逻辑和智能系统之间的对应关系[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
5 袁鸿雁;;Web表格信息抽取技术的研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
6 张晶;张云生;;基于XML的实时数据一致性查询机制[A];全国炼钢连铸过程自动化技术交流会论文集[C];2006年
7 宋宇辰;苑守成;杨进;;专家系统在西部地下水开发的应用研究[A];勘探地球物理2005学术交流会论文集[C];2005年
8 何险峰;张祥峰;郑丽娟;薛勤;蔡元刚;;气象灾害本体设计[A];第28届中国气象学会年会——S10公共气象服务政策体制机制和学科建设[C];2011年
9 郑天翔;谢亮;杨力华;;表格手写数字串的若干技术研究[A];第十三届全国图象图形学学术会议论文集[C];2006年
10 蒲宇达;关毅;王强;;基于数据挖掘思想的网页正文抽取方法的研究[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 蔺旭东;基于语义的XML查询及规范化研究[D];北京交通大学;2010年
2 冯肖维;基于多传感器信息融合的移动机器人位姿计算方法研究[D];上海大学;2011年
3 汤华茂;基于语义的产业链网络化协同设计模式及关键技术研究[D];重庆大学;2010年
4 陈劲光;基于云模型的中文面向查询多文档自动文摘研究[D];华中师范大学;2011年
5 宁博;XML查询模式匹配及文档过滤技术研究[D];东北大学;2009年
6 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
7 赵博;结构化集成调度系统理论及基于该理论的虚拟车间智能支撑平台的体系结构研究[D];大连理工大学;2000年
8 孙鑫;造纸过程的分层递阶智能控制系统[D];浙江大学;2001年
9 高飞;关联规则挖掘算法研究[D];西安电子科技大学;2001年
10 陆能枝;核应急决策支持系统的框架结构及模糊决策方法在评估子系统的应用[D];中国原子能科学研究院;2001年
中国硕士学位论文全文数据库 前10条
1 陈晓慧;空间信息服务管理平台的设计与实现[D];山东科技大学;2010年
2 孙岭;一种基于前缀表达式的Web信息抽取方法的关键问题的实现[D];山东科技大学;2010年
3 夏光磊;关于XML的关系数据库存储查询技术研究[D];山东科技大学;2010年
4 王乐超;Web环境下文献信息的提取与匹配研究[D];大连理工大学;2010年
5 柴红霞;移动机器人在SLAM中数据关联方法的研究[D];大连理工大学;2010年
6 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
7 吴世汉;面向查询的XML文本摘要技术[D];江西财经大学;2010年
8 范春晓;基于XML的Web信息抽取技术研究[D];沈阳理工大学;2010年
9 付涛;藏文网页除噪技术研究[D];西北民族大学;2010年
10 张麟;XML数据查询优化技术的研究[D];哈尔滨理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 马献明,严小卫,陈宏朝;个性化网上信息代理技术的研究概述[J];广西师范大学学报(自然科学版);2000年03期
2 陈钧;;基于语义网技术构建专业领域信息资源研究[J];河北省科学院学报;2005年04期
3 李静梅,孙丽华,张巧荣,张春生;一种文本处理中的朴素贝叶斯分类器[J];哈尔滨工程大学学报;2003年01期
4 李凡,林爱武,陈国社;一种基于VSM文本分类系统的设计与实现[J];华中科技大学学报(自然科学版);2005年03期
5 宋玲;马军;连莉;张志军;;文档相似度综合计算研究[J];计算机工程与应用;2006年30期
6 邓宏涛;中文自动分词系统的设计模型[J];计算机与数字工程;2005年04期
7 邹海山,吴勇,吴月珠,陈阵;中文搜索引擎中的中文信息处理技术[J];计算机应用研究;2000年12期
8 周强,冯松岩;构建知网关系的网状表示[J];中文信息学报;2000年06期
9 刘挺,吴岩,王开铸;串频统计和词形匹配相结合的汉语自动分词系统[J];中文信息学报;1998年01期
10 龚蛟腾;网络信息检索技术现状、瓶颈及趋势分析[J];情报杂志;2004年05期
中国硕士学位论文全文数据库 前3条
1 潘红艳;个性化信息服务的研究与实现[D];大连理工大学;2005年
2 陈洁惠;搜索引擎排序算法的研究[D];河海大学;2007年
3 彭丽;元搜索引擎技术的研究与应用[D];西北工业大学;2007年
【二级参考文献】
中国期刊全文数据库 前8条
1 薛红,彭玉成;鞅在未定权益定价中的应用[J];工程数学学报;2000年03期
2 张绍华,徐林昊,杨文柱,薛文玲,李天柱;基于样本实例的Web信息抽取[J];河北大学学报(自然科学版);2001年04期
3 张义忠,赵明生,朱精南;基于内容的网页特征提取[J];计算机工程与应用;2001年10期
4 周源远,王继成,郑刚,张福炎;Web页面清洗技术的研究与实现[J];计算机工程;2002年09期
5 李效东,顾毓清;基于DOM的Web信息提取[J];计算机学报;2002年05期
6 黄豫清,戚广志,张福炎;从WEB文档中构造半结构化信息的抽取器[J];软件学报;2000年01期
7 朱明,黄云,蔡庆生;基于多知识的Web网页信息抽取方法[J];小型微型计算机系统;2001年09期
8 钱晓松;跳扩散模型中的测度变换与期权定价[J];应用概率统计;2004年01期
【相似文献】
中国期刊全文数据库 前10条
1 马涛;姜晓菊;庞丽丽;韩志强;;信息抽取技术与网络情报资源快速获取[J];情报学报;2006年S1期
2 龚立群;孙洁丽;;国外主要知识抽取项目介绍与评析[J];图书馆论坛;2007年04期
3 郭志鑫;;基于本体的文档引文元数据信息抽取[J];微计算机信息;2006年18期
4 侯锟;刘斌;;Web页面信息抽取技术的研究[J];荆楚理工学院学报;2009年11期
5 廖述梅;;基于本体的语义标注原型评述[J];计算机工程与科学;2006年09期
6 徐健;张智雄;吴振新;;实体关系抽取的技术方法综述[J];现代图书情报技术;2008年08期
7 郭亮;温有奎;;基于protégé的知识地图实现[J];情报杂志;2009年02期
8 贾焰;王志英;江卫国;;知识库系统技术研究[J];计算机工程与科学;1993年03期
9 周文;刘宗田;孔庆苹;;基于事件的知识处理研究综述[J];计算机科学;2008年02期
10 何召卫;陈俊亮;;受限本体相似[J];计算机学报;2006年06期
中国重要会议论文全文数据库 前10条
1 崔欣辰;曲宁;陈青华;;隐马尔可夫模型在Web信息抽取中的几点改进[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
2 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
3 任伟;孟祥旭;徐延宁;;基于语义网的产品配置设计研究[A];全国第13届计算机辅助设计与图形学(CAD/CG)学术会议论文集[C];2004年
4 李雪竹;周国祥;;基于本体的语义网技术在信息检索中的研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
5 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 贺瑞芳;钟绍春;程晓春;;教学资源的个性化搜索引擎研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 王宏生;周勇;张路;;基于神经网络的本体映射的研究[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(下册)[C];2008年
8 姜吉发;王树西;;一种自举的二元关系获取方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
9 徐林昊;杨文柱;陈少飞;郝亚南;李天柱;;基于XPath的Web信息抽取[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
10 虞为;曹加恒;陈俊鹏;;一种对语义网上本体查询和检索的新方法(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 北京 高守;互联网之父钟情语义网[N];电脑报;2002年
2 李牧编译;语义网:Web3.0为何盖不过Web 2.0的风头[N];中国计算机报;2007年
3 王翔;大规模业务语义发掘为时尚早[N];网络世界;2008年
4 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
5 李玥伟;拥抱Web 3.0[N];中国计算机报;2008年
6 小林子;语义网:让网络学会思考[N];电脑报;2004年
7 陈颖健;语义网:能理解人类语言的智能网络[N];学习时报;2004年
8 ;语音上网技术日臻完善[N];人民邮电;2004年
9 记者 赵长春;未来网络会“绞尽脑汁”帮人搞发明[N];新华每日电讯;2004年
10 郭韦钰 丁连红;语义Web和语义网格[N];中国计算机报;2004年
中国博士学位论文全文数据库 前10条
1 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
2 董宝力;Web制造资源的语义发现关键技术研究[D];浙江大学;2007年
3 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
4 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
5 肖怀志;基于本体的历史年代知识元应用研究[D];武汉大学;2005年
6 王征;车辆路径问题的知识表示及智能建模方法研究[D];大连理工大学;2007年
7 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
8 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
9 姜赢;维度本体及其应用[D];武汉大学;2009年
10 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
中国硕士学位论文全文数据库 前10条
1 白曦;基于信息抽取的知识生成系统[D];吉林大学;2008年
2 刘常;语义信息自动生成研究[D];北京邮电大学;2007年
3 林斐斐;基于语义网的信息分析平台[D];汕头大学;2008年
4 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
5 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年
6 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年
7 孔德冉;基于领域Ontology的Web信息抽取研究[D];东北师范大学;2009年
8 杨文柱;基于领域知识和信息抽取的个性化Web查询系统[D];河北大学;2002年
9 张志强;Web信息抽取技术研究与基于Web service的实现[D];河北大学;2004年
10 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026