收藏本站
《华东师范大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

弱指导中文实体关系抽取方法研究

李庆玲  
【摘要】:随着计算机及网络技术的不断发展,各式各样的信息出现在人们面前。怎样从大量的信息中找到有用信息,逐渐成为人们关注的热点。信息抽取正是在该背景下产生,实体关系抽取是其中一个子任务。 对于实体关系抽取,目前主要有知识工程方法和自动训练方法。知识工程的方法达到的效果相对较好。但是它也有明显的不足:(1)开发昂贵;(2)适应性不强。因此人们逐渐开始致力于研究自动训练方法。自动训练方法按照人工干预的多少分为有指导的学习方法、弱指导的学习方法和无指导的学习方法。 针对弱指导方法的准确率与指导性方法相比存在较大差距这个问题,本文在目前中文实体关系抽取的研究现状下探索了一种基于自举的弱指导实体关系抽取方法,对基于自举的弱指导实体关系抽取的两个关键环节:关系描述模式的获取、关系元组的筛选进行了深入的研究,并对其中的主要算法进行了改进。改进主要包括以下两个方面: (1)提出了一种改进的关系描述模式抽取方法-基于最小覆盖的关系描述模式抽取方法,该方法获取的关系描述模式能更有效地表示并覆盖语料中的句子。 (2)提出了一种改进的关系元组筛选方法-基于互评估的关系元组筛选方法,该算法能有效的对关系元组进行筛选,提高弱指导实体关系抽取方法的准确率。 通过以上改进来改善弱指导实体关系抽取的性能。本文提出的方法在开放的web语料库中进行了测试,取得了65.6%的平均准确率,从而验证了方法的有效性。
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.1

【参考文献】
中国期刊全文数据库 前5条
1 李维刚;刘挺;李生;;基于网络挖掘的实体关系元组自动获取[J];电子学报;2007年11期
2 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
3 李妩可;郭赛球;尹艳;;命名实体关系抽取算法的改进[J];计算机工程;2010年24期
4 牟晋娟;包宏;;中文实体关系抽取研究[J];计算机工程与设计;2009年15期
5 黄鑫;朱巧明;钱龙华;刘梅梅;;基于特征组合的中文实体关系抽取[J];微电子学与计算机;2010年04期
中国博士学位论文全文数据库 前2条
1 谭红叶;中文事件抽取关键技术研究[D];哈尔滨工业大学;2008年
2 钱龙华;命名实体间语义关系抽取研究[D];苏州大学;2009年
中国硕士学位论文全文数据库 前4条
1 王莉峰;领域自适应的中文实体关系抽取研究[D];哈尔滨工业大学;2011年
2 徐超;基于种子自扩展的命名实体关系抽取方法的研究[D];华中师范大学;2006年
3 奚斌;基于弱指导学习的实体间语义关系抽取研究[D];苏州大学;2008年
4 虞欢欢;基于机器学习的蛋白质相互作用关系抽取的研究[D];苏州大学;2010年
【共引文献】
中国期刊全文数据库 前10条
1 刘高军;马砚忠;段建勇;;基于维基百科的中文命名实体关联度计算[J];北方工业大学学报;2012年01期
2 傅骞;温晓辉;;开放式Web信息抽取系统研究与实现[J];北京师范大学学报(自然科学版);2005年06期
3 赵江江;秦兵;;基于BootStrapping的中文事件元素抽取系统设计与实现[J];智能计算机与应用;2012年01期
4 霍娜;吕国英;;基于规则匹配的灾难性追踪事件信息抽取的研究[J];电脑开发与应用;2012年06期
5 方莹,葛寒松;基于聚类的分级信息抽取方法初探[J];电脑知识与技术;2005年30期
6 赵文;唐建雄;高庆锋;;基于统计的中文网页正文抽取的研究[J];电脑知识与技术;2008年01期
7 余承健;;基于表格语义的Web信息抽取方法的研究[J];电脑知识与技术;2008年12期
8 胡静芳;沈亚斌;;基于Web的新闻采集系统[J];电脑知识与技术;2009年19期
9 吴芳;郑君;刘金亮;宗克玄;;基于GATE框架的中文信息抽取技术的研究[J];电脑知识与技术;2009年24期
10 孙娜;;基于本体的文本分类研究综述[J];电脑知识与技术;2011年10期
中国重要会议论文全文数据库 前10条
1 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
2 赵敬华;高慧颖;魏军;;基于本体的商品信息查询系统与算法研究[A];中国企业运筹学[C];2009年
3 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
4 吴平博;陈群秀;马亮;;基于时空分析的线索性事件的抽取与集成系统研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 张桂平;蔡东风;徐立军;尹宝生;陈建军;;以互联网为知识源的基于语段分析的交互式机器翻译技术的研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 钟涛;陈群秀;;基于层式有限状态自动机的灾难事件抽取系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 庄成龙;钱龙华;周国栋;;基于树核函数的实体关系抽取方法研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
8 丁晟春;刘逶迤;熊霞;梅健;;基于领域本体和语块分析的信息抽取的研究与实现[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
9 程晓;郑德权;杨宇航;邵国军;;面向半结构化文本的领域本体关系抽取[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 付瑞吉;秦兵;刘挺;;面向音乐领域的文本检索与挖掘系统[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年
2 吴承荣;骨干通道上的网络论坛通信信息监测和分析的关键技术研究[D];复旦大学;2011年
3 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
4 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
5 朱倩;面向自由文本的细粒度关系抽取的关键技术研究[D];江苏大学;2011年
6 李勤超;基于本体的地理信息语义转换模型与方法研究[D];解放军信息工程大学;2011年
7 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
8 许建潮;Web挖掘中若干问题的研究[D];吉林大学;2005年
9 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
10 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
中国硕士学位论文全文数据库 前10条
1 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
2 李小红;基于自举的弱指导中文语义关系抽取研究[D];苏州大学;2010年
3 季元叶;语言学特征在中文命名实体间语义关系抽取中的应用研究[D];苏州大学;2010年
4 潘正高;基于内容的Web新闻文本自动分类问题研究[D];合肥工业大学;2010年
5 钟鸿鹏;基于时态信息的网页排序系统的研究与实现[D];华南理工大学;2010年
6 谷文;基于概念树的Web信息抽取技术研究[D];长春工业大学;2010年
7 蒋子鹏;基于人机交互的英文动词聚类的研究[D];北京交通大学;2011年
8 张宜浩;基于最大熵模型的中文实体关系自动抽取研究[D];昆明理工大学;2010年
9 孟祥燕;问答对自动获取的研究[D];昆明理工大学;2008年
10 邱艳霞;领域术语自动抽取及关系分类研究[D];昆明理工大学;2009年
【二级参考文献】
中国期刊全文数据库 前10条
1 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报;1998年01期
2 李维刚;刘挺;李生;;基于网络挖掘的实体关系元组自动获取[J];电子学报;2007年11期
3 刘克彬;李芳;刘磊;韩颖;;基于核函数中文关系自动抽取系统的实现[J];计算机研究与发展;2007年08期
4 吴芬芬;刘磊;肖宪;;一种启发式的信息抽取算法[J];吉林大学学报(理学版);2007年01期
5 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
6 贺智平;徐学洲;李爱玲;;一种基于信息熵的Web页面主题信息抽取方法[J];计算机工程与应用;2007年04期
7 胡睿,张冬茉,杜蓬;基于结点语义关系的信息抽取技术[J];计算机工程;2001年04期
8 孔祥勇,张冬茉;一种信息抽取系统中汉语同指消解算法[J];计算机工程;2003年16期
9 姜吉发;一种跨语句汉语事件信息抽取方法[J];计算机工程;2005年02期
10 陈莲娜;姚伏天;;用于文本分类的多核SVM算法研究[J];计算机工程;2007年09期
中国重要会议论文全文数据库 前1条
1 赵妍妍;王啸吟;秦兵;车万翔;刘挺;;中文事件抽取中事件类别的自动识别[A];第三届学生计算语言学研讨会论文集[C];2006年
中国硕士学位论文全文数据库 前2条
1 徐超;基于种子自扩展的命名实体关系抽取方法的研究[D];华中师范大学;2006年
2 陈静;基于本体的信息抽取研究[D];苏州大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 蔡徽;MIS系统实体关系建模与实现[J];广东电力;1996年03期
2 刘文远;徐丽娜;王宝文;陈国鹰;;IRP中基于广义聚合度的主题数据库划分技术[J];情报杂志;2007年10期
3 李小红;钱龙华;;基于自举的弱指导中文实体关系抽取研究[J];高科技与产业化;2010年09期
4 邓擘;樊孝忠;杨立公;;用语义模式提取实体关系的方法[J];计算机工程;2007年10期
5 刘建舟;邵雄凯;;基于语义核的中文实体关系抽取[J];信息系统工程;2011年03期
6 席峰;;基于命名实体及关系的网页文本关联分析方法[J];微电子学与计算机;2011年08期
7 石志强,李涛,孙延涛;基于以太网的宽带社区网络管理系统[J];北京邮电大学学报;2003年S2期
8 邓擘;郑彦宁;;使用种子抽取实体关系模式[J];计算机与数字工程;2009年09期
9 邓擘;郑彦宁;傅继彬;;汉语实体关系模式的自动获取研究[J];计算机科学;2010年02期
10 刘建舟;邵雄凯;;一种改进的中文实体关系抽取方法[J];软件导刊;2011年04期
中国重要会议论文全文数据库 前10条
1 张苇如;孙乐;韩先培;;基于维基百科和模式聚类的实体关系抽取方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 石志强;李涛;孙延涛;;基于以太网的宽带社区网络管理系统[A];2003年通信软件技术学术年会论文集[C];2003年
3 姚天昉;;一种用于汉语信息抽取的词汇本体[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 甘甜;莫倩;张华平;;基于搜索引擎的人物社会关系抽取研究[A];第五届全国信息检索学术会议论文集[C];2009年
5 虞欢欢;陈九昌;钱龙华;周国栋;;基于树核函数的中文语义关系抽取[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 林明智;余鹤书;;海洋气象导航数据库及其应用[A];中国航海学会海洋船舶驾驶专业委员会天气与航海安全论文集[C];1997年
7 李丹;罗智勇;;基于序列模式挖掘的人物关系识别[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 艾廷华;;一种基于Delaunay三角网的空间场表达的形式化数据模型[A];中国测绘学会第八次全国会员代表大会暨2005年综合性学术年会论文集[C];2005年
9 杨凤娇;;新闻传播系统的经济研究:系统经济学观点[A];中国传媒经济(第一辑)[C];2004年
10 刘克彬;李芳;刘磊;韩颖;;基于特征选择和语义扩展的词序列核函数研究[A];第三届学生计算语言学研讨会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 ;TCC统揽开发生命周期[N];中国计算机报;2001年
2 佚名;零时差管理五法则[N];经理日报;2008年
3 刘君;托县农村经济合作组织是啥样?[N];内蒙古日报(汉);2006年
4 苗得雨;语义搜索PK关键词搜索[N];电脑报;2008年
5 云迪;投递组改“公司”应慎行[N];人民邮电;2000年
6 杜梅;企业零时差管理五法则[N];中国电力报;2005年
7 姜革文;四大营销模式优劣对看[N];中国新闻出版报;2003年
8 范艾;关于“沉默”的历史学[N];中华读书报;2004年
9 新华;金融危机下的中国酒店业[N];华东旅游报;2008年
10 冠 烈;亮外之亮[N];计算机世界;2002年
中国博士学位论文全文数据库 前6条
1 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
2 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年
3 朱倩;面向自由文本的细粒度关系抽取的关键技术研究[D];江苏大学;2011年
4 朱铁军;刑民实体关系论[D];华东政法大学;2009年
5 吴捷;面向RFID应用的情境感知计算关键技术研究[D];上海交通大学;2010年
6 隋毅;多子网复合复杂网络模型及其相关性质的研究[D];青岛大学;2012年
中国硕士学位论文全文数据库 前10条
1 李庆玲;弱指导中文实体关系抽取方法研究[D];华东师范大学;2012年
2 王莉峰;领域自适应的中文实体关系抽取研究[D];哈尔滨工业大学;2011年
3 宁海燕;实体关系自动抽取技术的比较研究[D];哈尔滨工业大学;2010年
4 刘龙;音乐领域全局实体关系抽取研究[D];哈尔滨工业大学;2010年
5 雷春雅;领域实体关系自动抽取研究[D];昆明理工大学;2011年
6 毕海滨;基于海量文本数据的实体关系抽取及挖掘[D];山东大学;2012年
7 王敏;基于多代理策略的中文实体关系抽取[D];大连理工大学;2011年
8 张宜浩;基于最大熵模型的中文实体关系自动抽取研究[D];昆明理工大学;2010年
9 毛小丽;基于特征向量的实体间语义关系抽取研究[D];重庆大学;2011年
10 朱姗;基于本体的电子产品实体关系抽取研究[D];西安电子科技大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026