收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

概念与属性约束知识抽取及其应用研究

魏晓亮  
【摘要】:信息抽取是指把文本里包含的无结构化或半结构化的信息抽取出来,进行结构化处理。现在信息增长迅猛,信息抽取可以帮助人们更快地找到自己需要的信息。属性抽取属于信息抽取的一种。属性抽取是指从多个信息源抽取同一事物的属性。大部分属性抽取方法仅仅是从万维网或语料库中抽取属性,没有很好地利用一些知识源。本文提出了一种新的属性抽取方法:先从《知网》中抽取属性,然后再从万维网中抽取属性。首先从《知网》(hownet)中获取概念属性库和属性-属性值库。然后利用万维网语料库对这两个库进行扩展,最终建立起概念属性知识库和属性-属性值知识库。 建立的属性知识库可以用于词义消歧。词义消歧是判断多义词在特定上下文语境中具体语义的技术,对自然语言处理领域的很多应用研究具有重大意义。跟以往的只用机器学习中的分类算法进行消歧不同,本文提出了一种新的词义消歧模型。其基本思路是将机器学习中的分类算法和属性知识结合起来消歧。具体做法为对待消歧的多义词建立一个属性知识库,因为不同词义的同名词具有不同的属性值,所以可将这些属性值作为该多义词的一个上下文特征,然后再利用朴素贝叶斯或最大熵模型来区别该多义词在特定上下文中使用的是哪种语义。 本文主要创新点如下: 1提出一种新的属性抽取方法,从《知网》中抽取属性知识,然后利用万维网对属性知识进行扩展。 2提出一种新的词义消歧方法,将属性知识用于词义消歧。 实验结果表明:使用本文提出的属性抽取方法建立的属性知识库准确率高、覆盖面全;将机器学习的分类模型和属性知识结合起来可以有效提高词义消歧的准确率。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 郭池 ,陈家骏 ,王启祥;一种基于语料库的词义消歧策略[J];计算机工程与应用;2003年35期
2 全昌勤,何婷婷,姬东鸿,刘辉;基于义类的无导词义消歧方法的研究[J];计算机应用研究;2005年04期
3 荀恩东,李生,赵铁军;基于汉语二元同现的统计词义消歧方法研究[J];高技术通讯;1998年10期
4 龚永恩;袁春风;武港山;;基于语义的词义消歧算法初探[J];计算机应用研究;2006年03期
5 李生;张晶;赵铁军;姚建民;;词义消歧研究的现状与发展方向[J];计算机科学;2001年09期
6 全昌勤,何婷婷,姬东鸿,刘辉;从搭配知识获取最优种子的词义消歧方法[J];中文信息学报;2005年01期
7 李纲;寇广增;;自举在词义消歧中的应用及其关键问题[J];情报学报;2010年01期
8 陈浩;何婷婷;姬东鸿;;基于MDL聚类的无导词义消歧[J];小型微型计算机系统;2005年10期
9 张明宝;马静;;一种基于知网的中文词义消歧算法[J];计算机技术与发展;2009年02期
10 陈笑蓉;秦进;;基于最大熵原理的汉语词义消歧[J];计算机科学;2005年05期
11 曲维光;陈小荷;董宇;穗志方;;基于语境计算模型的汉语词义消歧(英文)[J];广西师范大学学报(自然科学版);2006年04期
12 王瑞琴;孔繁胜;潘俊;;基于WordNet的无导词义消歧方法[J];浙江大学学报(工学版);2010年04期
13 金澎;;词义消歧和词义消歧评测简介[J];术语标准化与信息技术;2010年03期
14 张仰森;郭江;;四种统计词义消歧模型的分析与比较[J];北京信息科技大学学报(自然科学版);2011年02期
15 全昌勤,何婷婷,姬东鸿,刘辉;基于指示词的词义消歧方法[J];计算机工程;2005年16期
16 何婷婷;谢芳;;利用BP神经网络的中文词义消歧模型[J];华中师范大学学报(自然科学版);2005年04期
17 王博;杨沐昀;李生;赵铁军;;中文全词消歧在机器翻译系统中的性能评测[J];自动化学报;2008年05期
18 李辉;张琦;卢湖川;杨德礼;;基于知网的中文常问问答系统[J];计算机工程;2008年23期
19 刘商飞;张志祥;;基于改进的Bayes判别法的中文多义词消歧[J];计算机与数字工程;2009年10期
20 王达;张坤;;贝叶斯模型在词义消歧中的应用[J];计算机时代;2009年07期
中国重要会议论文全文数据库 前10条
1 张仰森;黄改娟;苏文杰;;基于隐最大熵原理的汉语词义消歧方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 吴崇斌;张全;;上下文边界可变的贝叶斯分类器词义消歧方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 余晓峰;刘鹏远;赵铁军;;一种基于《知网》的汉语词语词义消歧方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 张云涛;龚玲;王永成;;基于语料库的朴素贝叶斯方法的词义消歧[A];2005年中国智能自动化会议论文集[C];2005年
5 丁江伟;刘挺;卢志茂;李生;;隐马尔可夫模型和贝叶斯模型词义消歧对比研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 吴云芳;温珍珊;段慧明;俞士汶;;语料库粗粒度词义标注[A];第六届汉语词汇语义学研讨会论文集[C];2005年
7 何径舟;王厚峰;;基于特征自动选取的汉语词义消歧[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
8 秦颖;王小捷;;组合中文词义消歧[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 于丽丽;丁德鑫;曲维光;陈小荷;石民;;基于多分类器集成的古代汉语词义消歧[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 王菁华;刘建毅;王枞;;语义网络结构下的词义消歧[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 车超;知识自动获取的词义消歧方法[D];大连理工大学;2010年
2 王菁华;文本中知识的获取[D];北京邮电大学;2008年
3 涂锟;基于自然语言与记忆再重构的常识推理模型[D];华南理工大学;2010年
4 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
5 秦颖;汉语词和短语的歧义消解研究[D];北京邮电大学;2008年
6 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
7 王瑞琴;基于语义处理技术的信息检索模型研究[D];浙江大学;2009年
8 刘凯鹏;社会性标注关键技术及其在信息检索中的应用研究[D];哈尔滨工业大学;2010年
9 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
10 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
中国硕士学位论文全文数据库 前10条
1 魏晓亮;概念与属性约束知识抽取及其应用研究[D];北方工业大学;2013年
2 史俊冰;问答系统中词义消歧与关键词扩展研究[D];太原理工大学;2011年
3 詹靓雯;基于知网的中文词义消歧研究[D];中国计量学院;2012年
4 邓宾;中文词义消岐研究[D];昆明理工大学;2009年
5 杨选选;基于概念图和语义角色的多领域信息抽取系统研究[D];西北大学;2010年
6 陈浩;基于二阶上下文的无导词义消歧研究[D];华中师范大学;2005年
7 秦少康;英语词汇歧义及英汉机器翻译中词义消歧上下限研究[D];厦门大学;2006年
8 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
9 徐赟;基于知网和贝叶斯模型的词义消岐技术的研究[D];南京理工大学;2010年
10 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年
中国重要报纸全文数据库 前10条
1 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
2 彭芳;搜索也专业[N];中国计算机报;2004年
3 本报记者 王翌;8848:优化EC流程[N];计算机世界;2004年
4 司静辉;直击数字环境下情报技术发展动向[N];科技日报;2007年
5 上海交通大学APEX数据和知识管理实验室 王昊奋俞勇;语义Web推动下一代搜索[N];计算机世界;2007年
6 董振东;到用户中去[N];中国计算机报;2003年
7 任一鸣;垂直搜索:抓住细分需求[N];计算机世界;2007年
8 张友林 甘肃省武威市凉州区中医院;开发中医专用软件很有必要[N];中国中医药报;2009年
9 本报记者 余戈;电脑为什么能战胜人脑[N];北京科技报;2004年
10 希安;微软试水信息检索[N];经济日报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978