收藏本站
《哈尔滨工业大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

音乐领域全局实体关系抽取研究

刘龙  
【摘要】: 随着互联网上信息的快速增长,信息抽取技术越来越被关注,而实体关系的抽取又是这些任务中非常重要的一个子任务。经研究发现由于传统的实体关系抽取技术面向句子级,只在一个句子中进行抽取,从而丢失了大量的关系。因此本文提出全局实体关系抽取,对篇章中的任意两个实体进行关系抽取和分类。 本文从音乐领域入手,通过详细的统计和分析,发现实体关系抽取会受到实体之间其它关系的影响,比如实体间的等价关系和并列关系。通过实体之间等价关系和非等价关系的融合和简单推理可以实现全局实体关系抽取。本文首先采用基于规则和利用依存句法以及二者结合的多种方法对音乐领域实体的所有表述进行识别;然后在此基础上分别采用基于规则,基于二元分类以及二者结合的多种方法对音乐领域的共指消解进行研究;其次研究了卷积树树核和混合核等在音乐领域实体关系抽取中的应用;最后通过关系间的有效融合和简单推理,实现全局实体关系抽取。评测结果显示,我们的全局实体关系抽取比传统实体关系抽取的F值提高了13.8%,而且我们的技术可以适用于任何领域。 最后本文还设计并实现了共指消解实验与应用平台和文本挖掘技术集成平台,为自然语言处理领域研究和应用提供更好的服务。
【关键词】:信息抽取 关系抽取 共指消解 全局实体关系 实体表述识别
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.1
【目录】:
  • 摘要4-5
  • Abstract5-8
  • 第1章 绪论8-19
  • 1.1 课题背景8
  • 1.2 课题的研究目的和意义8-9
  • 1.3 研究现状及分析9-17
  • 1.3.1 共指消解研究现状9-12
  • 1.3.2 关系抽取研究现状12-17
  • 1.4 本文的主要研究内容17-19
  • 第2章 Mention识别19-29
  • 2.1 基于规则的Mention识别20-21
  • 2.2 基于依存句法的Mention识别21-24
  • 2.3 规则和依存句法结合的Mention识别24-25
  • 2.4 实验设计及结果分析25-28
  • 2.4.1 实验设计25-26
  • 2.4.2 实验结果及分析26-28
  • 2.5 本章小结28-29
  • 第3章 共指消解29-40
  • 3.1 基于规则的共指消解29-32
  • 3.2 基于分类的共指消解32-36
  • 3.3 分类与规则结合的共指消解36-38
  • 3.4 对比实验及分析38-39
  • 3.4.1 实验设计38
  • 3.4.2 实验结果及分析38-39
  • 3.5 本章小结39-40
  • 第4章 非等价实体关系抽取40-51
  • 4.1 音乐实体关系类型概述40-41
  • 4.2 关系抽取41-45
  • 4.2.1 关系实例表示方法41-43
  • 4.2.2 多项式核43-44
  • 4.2.3 卷积树核44-45
  • 4.2.4 混合核45
  • 4.3 实验设计及结果分析45-50
  • 4.3.1 实验设计45-47
  • 4.3.2 实验结果及分析47-50
  • 4.4 本章小结50-51
  • 第5章 全局实体关系抽取51-60
  • 5.1 等价关系与非等价关系的融合51-53
  • 5.2 实验结果及分析53-55
  • 5.2.1 实验设计53-54
  • 5.2.2 实验结果及分析54-55
  • 5.3 平台的设计与实现55-60
  • 5.3.1 共指消解实验与应用平台55-56
  • 5.3.2 文本挖掘技术集成平台56-57
  • 5.3.3 全局实体关系抽取演示系统57-59
  • 5.3.4 本章小结59-60
  • 结论60-61
  • 参考文献61-66
  • 致谢66

【引证文献】
中国硕士学位论文全文数据库 前1条
1 刘恒威;基于概念图的动画剧本生成的研究[D];西北大学;2013年
【参考文献】
中国期刊全文数据库 前7条
1 王智强;李蕾;王枞;;基于决策树的汉语代词共指消解[J];北京邮电大学学报;2006年04期
2 李维刚;刘挺;李生;;基于网络挖掘的实体关系元组自动获取[J];电子学报;2007年11期
3 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
4 王厚峰;指代消解的基本方法和实现技术[J];中文信息学报;2002年06期
5 车万翔,刘挺,李生;实体关系自动抽取[J];中文信息学报;2005年02期
6 王厚峰,梅铮;鲁棒性的汉语人称代词消解[J];软件学报;2005年05期
7 王厚峰;汉语篇章的指代消解浅论[J];语言文字应用;2004年04期
【共引文献】
中国期刊全文数据库 前10条
1 何甫权;;英语指代与翻译[J];安徽文学(下半月);2008年08期
2 王智强;李蕾;王枞;;基于决策树的汉语代词共指消解[J];北京邮电大学学报;2006年04期
3 吴敏;;指代消解在普通语言学理论与课程实践上的应用研究[J];大家;2010年11期
4 苏林忠;;两种学习算法在算术关系抽取中的应用比较[J];电脑知识与技术;2010年19期
5 於俊;周维;;一种基于壳向量的SVM快速增量学习算法[J];电子测量与仪器学报;2006年06期
6 杨建明;;关系抽取方法研究[J];电子技术;2009年04期
7 李维刚;刘挺;李生;;基于网络挖掘的实体关系元组自动获取[J];电子学报;2007年11期
8 黄晨;;语义关系抽取发展现状及抽取方法的研究[J];福建电脑;2009年06期
9 季元叶;;语言学特征在中文实体间语义关系抽取中的应用[J];福建电脑;2010年06期
10 杨凯;;浅谈指代消解[J];硅谷;2008年24期
中国重要会议论文全文数据库 前10条
1 王治敏;俞士汶;;人称代词和名词的歧义消解研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 谭斌;;指代消解的原理和实现方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
3 俞士汶;;计算语言学的应用研究与基础研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
4 杨佳;;基于语料分析的“这/那+NP”的指代消解算法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 郎君;刘挺;秦兵;;基于决策树的中文名词短语指代消解[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 梅铮;王厚峰;;汉语人称代词消解的前端处理[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 郎君;秦兵;刘挺;李生;;中国人名性别自动识别[A];第三届学生计算语言学研讨会论文集[C];2006年
8 史晓东;陈毅东;;基于语篇的机器翻译前瞻[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
9 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 徐芬;王挺;陈火旺;;基于SVM方法的中文实体关系抽取[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 邱明波;动词的指向对汉语第三人称代词和反身代词的句内回指的制约[D];复旦大学;2011年
2 吴承荣;骨干通道上的网络论坛通信信息监测和分析的关键技术研究[D];复旦大学;2011年
3 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
4 李世奇;面向文景转换的中文浅层语义分析方法研究[D];哈尔滨工业大学;2011年
5 严志永;在划分数据空间的视角下基于决策边界的分类器研究[D];浙江大学;2011年
6 马红妹;汉英机器翻译中汉语上下文语境的表示与应用研究[D];中国人民解放军国防科学技术大学;2002年
7 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
8 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
9 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
10 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
中国硕士学位论文全文数据库 前10条
1 高利坤;感知器算法和BP算法的性能对比分析[D];大连理工大学;2010年
2 李小红;基于自举的弱指导中文语义关系抽取研究[D];苏州大学;2010年
3 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
4 季元叶;语言学特征在中文命名实体间语义关系抽取中的应用研究[D];苏州大学;2010年
5 陈原;名词性短语间语义关系的自动分类[D];华东师范大学;2011年
6 蔡颂梅;语义增强的关系相似度度量算法研究[D];华东师范大学;2011年
7 钟鸿鹏;基于时态信息的网页排序系统的研究与实现[D];华南理工大学;2010年
8 孙萍;面向事件的多文档自动文摘研究[D];江苏大学;2010年
9 张宜浩;基于最大熵模型的中文实体关系自动抽取研究[D];昆明理工大学;2010年
10 邱艳霞;领域术语自动抽取及关系分类研究[D];昆明理工大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 蔡勇智;;未登录词识别算法的改进[J];福建电脑;2006年03期
2 陈红琳;;自然语言的形式化[J];阜阳师范学院学报(社会科学版);2009年02期
3 尹兰;王家玮;;自然语言语义形式化二维视角[J];福建电脑;2012年05期
4 刘晓霞;新的知识表示方法-概念图[J];航空计算技术;1997年04期
5 陈耀东;王挺;陈火旺;;浅层语义分析研究[J];计算机研究与发展;2008年S1期
6 刘岩;张蕾;;基于概念图的中文信息自动转化技术研究[J];计算机工程与应用;2008年15期
7 白振兴;;一种新的知识表达方法:概念结构[J];计算机科学;1992年06期
8 江澜;岳小莉;冯柏岚;李良军;曹存根;;基于实例和约束的三维场景概念设计和系统实现[J];计算机科学;2008年01期
9 周蕾;朱巧明;;基于统计和规则的未登录词识别方法研究[J];计算机工程;2007年08期
10 劳志强,潘云鹤;基于影像动画设计的知识表达模型[J];计算机辅助设计与图形学学报;1998年04期
中国博士学位论文全文数据库 前1条
1 张蕾;概念结构及其应用[D];西北工业大学;2001年
中国硕士学位论文全文数据库 前3条
1 冯礼;基于事件框架的突发事件信息抽取[D];上海交通大学;2008年
2 李红良;火箭发射环境信息的推理技术应用研究[D];重庆大学;2009年
3 周文;基于XML的动画剧本描述及其应用研究[D];国防科学技术大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 李蕾,孙春葵,杨晓兰,钟义信;一种特定领域中文自动摘要系统[J];北京邮电大学学报;2000年01期
2 钟义信;自然语言理解的全信息方法论[J];北京邮电大学学报;2004年04期
3 秦洪武;第三人称代词在深层回指中的应用分析[J];当代语言学;2001年01期
4 王厚峰;;句类中E块的作用及其判定策略[J];计算机科学;2000年05期
5 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
6 王厚峰;指代消解的基本方法和实现技术[J];中文信息学报;2002年06期
7 车万翔,刘挺,李生;实体关系自动抽取[J];中文信息学报;2005年02期
8 王厚峰;汉语篇章的指代消解浅论[J];语言文字应用;2004年04期
9 刘志文,郝惠宁,肖友芙,黄曾阳;自然语言语句的HNC表示[J];语言文字应用;1998年02期
10 黄曾阳;HNC理论与自然语言语句的理解[J];中国基础科学;1999年Z1期
【相似文献】
中国期刊全文数据库 前10条
1 蔡徽;MIS系统实体关系建模与实现[J];广东电力;1996年03期
2 刘文远;徐丽娜;王宝文;陈国鹰;;IRP中基于广义聚合度的主题数据库划分技术[J];情报杂志;2007年10期
3 李小红;钱龙华;;基于自举的弱指导中文实体关系抽取研究[J];高科技与产业化;2010年09期
4 邓擘;樊孝忠;杨立公;;用语义模式提取实体关系的方法[J];计算机工程;2007年10期
5 刘建舟;邵雄凯;;基于语义核的中文实体关系抽取[J];信息系统工程;2011年03期
6 席峰;;基于命名实体及关系的网页文本关联分析方法[J];微电子学与计算机;2011年08期
7 石志强,李涛,孙延涛;基于以太网的宽带社区网络管理系统[J];北京邮电大学学报;2003年S2期
8 邓擘;郑彦宁;;使用种子抽取实体关系模式[J];计算机与数字工程;2009年09期
9 邓擘;郑彦宁;傅继彬;;汉语实体关系模式的自动获取研究[J];计算机科学;2010年02期
10 刘建舟;邵雄凯;;一种改进的中文实体关系抽取方法[J];软件导刊;2011年04期
中国重要会议论文全文数据库 前10条
1 张苇如;孙乐;韩先培;;基于维基百科和模式聚类的实体关系抽取方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 石志强;李涛;孙延涛;;基于以太网的宽带社区网络管理系统[A];2003年通信软件技术学术年会论文集[C];2003年
3 姚天昉;;一种用于汉语信息抽取的词汇本体[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 甘甜;莫倩;张华平;;基于搜索引擎的人物社会关系抽取研究[A];第五届全国信息检索学术会议论文集[C];2009年
5 虞欢欢;陈九昌;钱龙华;周国栋;;基于树核函数的中文语义关系抽取[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 林明智;余鹤书;;海洋气象导航数据库及其应用[A];中国航海学会海洋船舶驾驶专业委员会天气与航海安全论文集[C];1997年
7 李丹;罗智勇;;基于序列模式挖掘的人物关系识别[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 艾廷华;;一种基于Delaunay三角网的空间场表达的形式化数据模型[A];中国测绘学会第八次全国会员代表大会暨2005年综合性学术年会论文集[C];2005年
9 刘克彬;李芳;刘磊;韩颖;;基于特征选择和语义扩展的词序列核函数研究[A];第三届学生计算语言学研讨会论文集[C];2006年
10 杨凤娇;;新闻传播系统的经济研究:系统经济学观点[A];中国传媒经济(第一辑)[C];2004年
中国重要报纸全文数据库 前10条
1 ;TCC统揽开发生命周期[N];中国计算机报;2001年
2 佚名;零时差管理五法则[N];经理日报;2008年
3 刘君;托县农村经济合作组织是啥样?[N];内蒙古日报(汉);2006年
4 苗得雨;语义搜索PK关键词搜索[N];电脑报;2008年
5 云迪;投递组改“公司”应慎行[N];人民邮电;2000年
6 杜梅;企业零时差管理五法则[N];中国电力报;2005年
7 王细赞;转业干部的贴心人[N];中国人事报;2001年
8 记者 卢怀谦;全国保监局多半实现非现场监管[N];中国证券报;2004年
9 本报记者 何国庆 实习生 黄略;16才俊候选今年特聘教授[N];湖南日报;2003年
10 大山;河北沙河铁矿特大矿难灾难的背后是可怕[N];中华合作时报;2004年
中国博士学位论文全文数据库 前10条
1 张宏涛;面向生物文本的实体关系自动抽取问题研究[D];清华大学;2012年
2 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
3 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年
4 朱倩;面向自由文本的细粒度关系抽取的关键技术研究[D];江苏大学;2011年
5 穆一夫;基于认知的非结构化信息抽取关键技术与算法研究[D];中国矿业大学(北京);2013年
6 李丽双;领域本体学习中术语及关系抽取方法的研究[D];大连理工大学;2013年
7 朱铁军;刑民实体关系论[D];华东政法大学;2009年
8 张海军;基于大规模语料的中文新词识别技术研究[D];中国科学技术大学;2011年
9 黄东晶;俄汉代词指示语对比研究[D];黑龙江大学;2001年
10 文娟;统计语言模型的研究与应用[D];北京邮电大学;2010年
中国硕士学位论文全文数据库 前10条
1 刘龙;音乐领域全局实体关系抽取研究[D];哈尔滨工业大学;2010年
2 张宜浩;基于最大熵模型的中文实体关系自动抽取研究[D];昆明理工大学;2010年
3 宁海燕;实体关系自动抽取技术的比较研究[D];哈尔滨工业大学;2010年
4 雷春雅;领域实体关系自动抽取研究[D];昆明理工大学;2011年
5 毕海滨;基于海量文本数据的实体关系抽取及挖掘[D];山东大学;2012年
6 陈超;基于互联网的二元实体关系抽取研究[D];华东师范大学;2013年
7 赵君;领域实体关系及语义标签抽取研究[D];昆明理工大学;2013年
8 刘安安;开放式中文实体关系抽取研究[D];哈尔滨工业大学;2013年
9 王敏;基于多代理策略的中文实体关系抽取[D];大连理工大学;2011年
10 李庆玲;弱指导中文实体关系抽取方法研究[D];华东师范大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026