收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

中文语义万维网本体匹配

徐凯丰  
【摘要】:语义万维网(Semantic Web)概念最早由万维网之父蒂姆·伯纳斯-李(TimBerners-Lee)先生于1998年提出。近年来,随着互联网的大热,语义万维网得到了迅猛的发展:其链接开放数据(Linking Open Data)不但从2007年的500万条,猛增500倍,至2010年的250亿条,而且语义万维网方面的技术也被广泛地应用于政府、军事、医疗、搜索等诸多领域。正当语义万维网在全球范围内如火如荼地发展着,中国的语义万维网事业却停滞不前。笔者认为其中有三点原因:第一,缺少中文链接开放数据,即缺少中文本体,以及它们之间的匹配关系。第二,中英有别,传统的基于英文本体相似度计算的匹配算法无法适用于中文本体匹配。第三,无法对匹配结果进行大规模评测。 为了解决以上难题,笔者在本文中提出了一套专门用于中文本体匹配的匹配框架。框架中,笔者精心设计了匹配发现方案,匹配推理方案和匹配过滤方案,分别用于寻找中文本体间的种子匹配,以及对种子匹配进行推理扩大和错误过滤。通过将过滤得到的阳性和阴性匹配结果重新反馈到种子匹配,该框架可以对种子匹配进行反复地更新、推理和过滤操作,以最大限度地找到中文本体间的高质量匹配。此外,笔者还设计了一个在线匹配评测系统,用于对框架生成的匹配结果进行大规模人工评测。实验中,笔者从全球最大的三个中文百科网站中提炼出了本体数据,它们随后在匹配框架中进行两两匹配,匹配结果最终由志愿者们进行评测。结果显示:笔者的这套匹配框架在这三个中文本体之间一共发现了135万余条匹配,其中99%的匹配的正确率达到了80%以上。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王亚宏;;消逝电波的背后——从BBC中文广播停播说起[J];中国记者;2011年08期
2 长江边上;;中文简历快速转英文[J];电脑迷;2011年12期
3 雅丽;;网文创作新高峰两岸线上大PK[J];出版参考;2011年21期
4 ;后记[J];制度经济学研究;2011年02期
5 刘晓雪;;中央电视台中文国际频道百集高清巨制《边疆行》播出[J];当代电视;2011年08期
6 ;蓝光新视界[J];家庭影院技术;2011年07期
7 ;林夕全新力作《毫无代价唱最幸福的歌》出版[J];出版参考;2011年19期
8 ;接力社出版《“暮光之城”官方指南》中文简体字版[J];出版参考;2011年21期
9 刘英;;中文姓氏笔划排队 资源管理器搞定[J];电脑爱好者;2011年06期
10 无可尚人;;不必激活窗口 鼠标指哪滚哪[J];电脑爱好者;2011年07期
11 ;办公快操作[J];电脑迷;2011年11期
12 张艳;;关于高校开设中文速录专业的可行性分析[J];太原师范学院学报(社会科学版);2011年03期
13 高艳;;中文Windows Vista关机术语刍议[J];中国科技术语;2011年04期
14 唐宝民;;成功,不需要太多的条件[J];创新科技;2011年06期
15 唐爱慧;;万里边疆万里路,一程山水一程歌——中央电视台中文国际频道推出百集高清巨制《边疆行》[J];中国广告;2011年08期
16 ;听了就会让你喜欢它的Naim Uniti[J];实用影音技术;2011年08期
17 刘晓娟;;基于Lucene的中文兴趣点名称的切分与匹配研究[J];电脑知识与技术;2011年21期
18 ;MSN中文网推出旅游频道 打造个性化旅游[J];计算机与网络;2010年01期
19 李杨;;时代的“杂音”[J];看历史;2011年08期
20 张欣;;“印税”、“印紙税”与“版税”、“印花税”[J];科技与出版;2011年09期
中国重要会议论文全文数据库 前10条
1 王中卿;李寿山;朱巧明;李培峰;周国栋;;基于不平衡数据的中文情感分类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 张伟男;张宇;刘挺;;基于中心理论的中文对话省略恢复研究[A];第六届全国信息检索学术会议论文集[C];2010年
3 王佳;;对中文屋思想实验四个主要版本的考察[A];第三届全国科技哲学暨交叉学科研究生论坛文集[C];2010年
4 金朝;蒋宗礼;;中文机构名的识别讨论[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年
5 吴法洲;苏昊;周明;李春平;;利用英文搜索日志建立中文新词同义词词表[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
6 计峰;邱锡鹏;黄萱菁;;中文不确定性句子的识别研究[A];第六届全国信息检索学术会议论文集[C];2010年
7 周小甲;李昊旻;吕旭东;段会龙;;中文病历文本中的时间表达分类与识别[A];中国生物医学工程学会成立30周年纪念大会暨2010中国生物医学工程学会学术大会青年优秀论文[C];2010年
8 张小衡;;一个支持人工校对的中文简繁体转换工具[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 崔磊;王穗苹;;副中央凹-中央凹效应的中文眼动研究[A];第十一届全国心理学学术会议论文摘要集[C];2007年
10 朱祖德;王穗苹;陈烜之;张学新;肖壮伟;;语义整合的大脑表征[A];第十一届全国心理学学术会议论文摘要集[C];2007年
中国博士学位论文全文数据库 前10条
1 郑骁庆;语义万维网的不确定知识表示与信任计算[D];浙江大学;2007年
2 朱麟;中国人说英语的节奏模式及在教学中的运用[D];中央民族大学;2007年
3 包胜华;基于Web的实体信息搜索与挖掘研究[D];上海交通大学;2008年
4 李世奇;面向文景转换的中文浅层语义分析方法研究[D];哈尔滨工业大学;2011年
5 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
6 李旭;基于指纹和语义知识表示的中文文档复制检测方法[D];燕山大学;2010年
7 于娟;基于文本的领域本体学习方法及其应用研究[D];大连理工大学;2010年
8 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
9 文娟;统计语言模型的研究与应用[D];北京邮电大学;2010年
10 王会珍;文本内容分类和主题追踪关键技术研究[D];东北大学;2008年
中国硕士学位论文全文数据库 前10条
1 徐凯丰;中文语义万维网本体匹配[D];上海交通大学;2011年
2 陈成海;评塞尔的中文屋论证[D];浙江大学;2010年
3 刘冬平;面向中文歌词的音乐情感分类研究[D];广东工业大学;2011年
4 徐德玉;中文文档内容相似度检测方法研究[D];长春工业大学;2010年
5 张山山;中文XML压缩技术研究[D];华中科技大学;2011年
6 汤明达;基于近邻传播算法的中文文本聚类的研究[D];广西师范大学;2012年
7 秦路芳;基于中文互联网环境的IP净荷压缩的研究和实现[D];电子科技大学;2012年
8 黄默丽;NLP技术在中文全文信息处理中的应用研究[D];郑州大学;2010年
9 叶得学;基于语音界面的中文问答系统设计与实现[D];兰州大学;2011年
10 孙宏;中文地名的自动识别和标准化[D];天津大学;2010年
中国重要报纸全文数据库 前10条
1 记者 胡光耀;全美第二届中文大会开幕[N];人民日报海外版;2009年
2 泰国南美有限公司副总经理 陈美琪 整理 本报实习生 杨冰;泰国新一代学中文热潮到来[N];中国新闻出版报;2009年
3 记者 王建刚 吴志强;美国 中文电视举办20周年台庆[N];人民日报海外版;2010年
4 晓路;美国“中文热”遭遇教师荒[N];中国文化报;2011年
5 本报记者 韩言铭;中文在线 全媒体版权运营[N];中国经营报;2011年
6 本报驻外记者 吴乐珺 张旸 本报记者 韩硕 崔悦 姜波;商务中文考试酝酿改革[N];人民日报;2011年
7 记者 古隆媛;中文媒体共携手 发挥更大影响力[N];中国新闻出版报;2009年
8 记者 向杰;网络化中文办公平台获“核高基”立项[N];科技日报;2011年
9 本报记者 任涛;李裕里:中文给了我未来[N];人民日报海外版;2010年
10 汪融;美国人到底有多爱中文[N];中国文化报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978