收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

槽填充中模式优化方法的研究

沈晓卫  
【摘要】:槽填充(Slot Filling)任务是TAC(Text Analysis Conference)会议于2009年提出的KBP(Knowledge Base Population)评测任务的主要组成部分。作为问答系统和信息抽取中关系抽取的延续和发展,槽填充任务的主要目的是探究从开放的数据源中抽取特定类型实体属性信息的方法。 在目前的槽填充任务中,基于依存路径的模式匹配方法被较多的系统所采用,而其中的依存路径主要以斯坦福大学定义的依存关系为基础构建。本文以基于依存路径的方法为基础,探讨了该类方法中存在的问题并提出了相应的解决方法。本文的主要工作包含以下几个方面: 首先,本文研究了针对槽填充任务的不同实现方法,并以KBP提供的评测资源为基础,以斯坦福的自然语言处理工具,WordNet语义词典等为辅助,实现了一个基于模式匹配方法的槽填充基准系统。 其次,由于斯坦福的依存关系在槽填充任务中构建依存路径时存在很多的问题,其中比较常见的有冗余程度较高,可靠性差,区分性低等。为解决这些问题,本文对斯坦福的依存关系进行了重定义,并对部分种类的关系进行了删减,细化和转换,最后将这些方法运用到基准系统中,优化系统的性能。 最后,针对基准系统中模式的正确率较低的问题,本文充分利用了槽填充任务的本质特点,提出了模式语义定义和基于所有格关系,主谓关系的模式筛选方法,进一步提高了系统的性能,使得系统最终的F1值为24.7%,相对于基准系统的14.4%,提高了10.3%。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 邓擘;樊孝忠;杨立公;;用语义模式提取实体关系的方法[J];计算机工程;2007年10期
2 梁娜;耿国华;周明全;;自然语言处理中的语义关系与句法模式互发现[J];计算机应用研究;2008年08期
3 马涛;姜晓菊;庞丽丽;韩志强;;信息抽取技术与网络情报资源快速获取[J];情报学报;2006年S1期
4 周俊生;戴新宇;尹存燕;陈家骏;;自然语言信息抽取中的机器学习方法研究[J];计算机科学;2005年03期
5 肖春;周建龙;;生物医学领域中的文本信息抽取技术与系统综述[J];计算机应用研究;2007年09期
6 帅训波;马书南;;基于决策树的现代汉语中任职关系抽取研究[J];昆明理工大学学报(理工版);2009年04期
7 伍守芹;李晓昀;;信息抽取技术研究与探讨[J];福建电脑;2010年04期
8 王利鑫;耿焕同;孙凯;张茜;;基于自然语言处理的文本泄密自动检测技术[J];计算机工程与设计;2011年08期
9 孔芳;周国栋;朱巧明;钱培德;;指代消解综述[J];计算机工程;2010年08期
10 吴芳;郑君;刘金亮;宗克玄;;基于GATE框架的中文信息抽取技术的研究[J];电脑知识与技术;2009年24期
11 李向阳;苗壮;肖江;;无结构文本信息抽取综述[J];军事通信技术;2004年02期
12 李昕;;信息抽取技术及其在数字图书馆中的应用前景[J];中国科技资源导刊;2008年02期
13 黄锋;吴华瑞;;一种自适应的Web信息抽取规则自动生成方法[J];广西师范大学学报(自然科学版);2010年01期
14 何召卫;陈俊亮;;基于本体关系匹配的信息抽取[J];计算机工程;2007年21期
15 韩普;姜杰;;HMM在自然语言处理领域中的应用研究[J];计算机技术与发展;2010年02期
16 余肖生;孙珊;;基于信息抽取的文本知识挖掘模型研究[J];情报科学;2010年05期
17 李中言,李普跃;信息抽取方法综述[J];廊坊师范学院学报;2005年03期
18 周晶;;基于条件随机域模型的中文实体关系抽取[J];计算机工程;2010年24期
19 史旗凯;郭菊娥;;管理事件信息抽取中的基本问题研究[J];情报杂志;2007年12期
20 李昕;王红梅;;信息抽取技术探析[J];通化师范学院学报;2008年04期
中国重要会议论文全文数据库 前10条
1 夏云庆;郝博一;徐睿峰;;意见目标网络与意见目标抽取研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
2 蒲宇达;关毅;王强;;基于数据挖掘思想的网页正文抽取方法的研究[A];第三届学生计算语言学研讨会论文集[C];2006年
3 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
5 崔欣辰;曲宁;陈青华;;隐马尔可夫模型在Web信息抽取中的几点改进[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
6 刘宝艳;林鸿飞;杨志豪;;基于改进编辑距离和依存结构的句子相似度计算[A];第三届学生计算语言学研讨会论文集[C];2006年
7 冯志伟;;自然语言处理中的理性主义和经验主义[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
8 张霄军;;Web汉英平行新闻语料获取的困难及对策[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
9 夏云庆;黄锦辉;;中文网络非正规语言处理的方法与实践[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 丁晟春;刘逶迤;熊霞;梅健;;基于领域本体和语块分析的信息抽取的研究与实现[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国博士学位论文全文数据库 前10条
1 钱龙华;命名实体间语义关系抽取研究[D];苏州大学;2009年
2 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
3 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
4 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
5 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
6 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
7 何召卫;受限本体相似[D];北京邮电大学;2008年
8 李晗静;基于自然语言处理的空间概念建模研究[D];哈尔滨工业大学;2007年
9 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
10 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
中国硕士学位论文全文数据库 前10条
1 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
2 沈晓卫;槽填充中模式优化方法的研究[D];苏州大学;2013年
3 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年
4 樊聪;利用web抽取双语翻译对的研究与实现[D];重庆大学;2007年
5 杨秀丽;基于网页内容分析的Web信息抽取技术及其应用[D];河北科技大学;2010年
6 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年
7 杨选选;基于概念图和语义角色的多领域信息抽取系统研究[D];西北大学;2010年
8 杨文柱;基于领域知识和信息抽取的个性化Web查询系统[D];河北大学;2002年
9 张志强;Web信息抽取技术研究与基于Web service的实现[D];河北大学;2004年
10 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
中国重要报纸全文数据库 前10条
1 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
2 彭芳;搜索也专业[N];中国计算机报;2004年
3 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年
4 本报记者 祝蕾 见习记者 许凯;李晓戈:努力缩小国内外数字“鸿沟”[N];济南日报;2010年
5 金利;东北大学自然语言处理实验室形成特色[N];科技日报;2007年
6 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年
7 本报记者 王翌;8848:优化EC流程[N];计算机世界;2004年
8 徐恒;云计算:变革产业模式优化创业环境[N];中国电子报;2011年
9 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
10 江瑞平;中日经济依存关系“易位”[N];人民日报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978