收藏本站
《哈尔滨工业大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于实例动态泛化的共指消解及应用

张牧宇  
【摘要】:共指消解是自然语言处理中的核心任务,它对于信息抽取、信息检索、篇章分析、自动文摘、信息过滤和机器翻译等都具有重要的意义。本文对基于实例动态泛化的共指消解方法中存在的若干问题进行了改进;开发了多种共指链生成方案用于合并二元分类结果,从而提升共指消解的性能指标;我们将基于实例动态泛化的共指消解方法应用在自然语言处理的其他任务上,帮助提升这些问题的处理效果。 本文重点研究了三部分内容:基于实例动态泛化的共指消解方法中的相关问题;二元分类结果合并也即共指链生成方案的研究;以及基于实例动态泛化方法在自然语言处理其他任务中的应用。 基于实例动态泛化的共指消解方法的相关工作主要集中在Mention识别和精确泛化点的构建两部分。我们开发了基于分类方法和基于序列标注方法两类Mention识别算法,改善识别效果解决层级错误传递问题。此外,为了解决泛化点的质量问题,我们引入了精确泛化点概念,通过抽取更为准确的特征改进消解算法,在多种语料上的实验证明了我们工作的有效性。 在二元分类模块之后,下一步需要解决共指链生成方案。本文讨论了三种二元分类合并算法:基于词汇信息的方法;基于分类置信度的方法;基于Ranking的方法。这三种方案原理不同,适用场合不同,取得的效果也有所差别。我们对这三种方案进行了详细的分析比较,证明了我们工作的有效性,但这种合并始终受限于二元分类过程的处理精度,很难取得根本性的突破。 在二元分类算法和共指链生成方法的基础上,我们把基于实例动态泛化的共指消解方法应用在了全局实体关系抽取任务上。这项任务不同于传统的句子级关系抽取,而是针对篇章中的所有实体进行关系抽取,不限于同一句子中。这项任务需要引入篇章级别的信息,包括共指以及并列等。通过音乐领域的实验证明,利用共指消解方法引入篇章信息之后,可以大幅度提高全局实体关系抽取效果。
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP391.1

【参考文献】
中国期刊全文数据库 前4条
1 王厚峰;指代消解的基本方法和实现技术[J];中文信息学报;2002年06期
2 郎君;忻舟;秦兵;刘挺;李生;;集成多种背景语义知识的共指消解[J];中文信息学报;2009年03期
3 王海东;胡乃全;孔芳;周国栋;;基于树核函数的英文代词消解研究[J];中文信息学报;2009年05期
4 王厚峰,梅铮;鲁棒性的汉语人称代词消解[J];软件学报;2005年05期
【共引文献】
中国期刊全文数据库 前10条
1 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
2 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
3 贾泽露;;基于GIS与SDM集成的农用地定级专家系统[J];安徽农业科学;2008年14期
4 蔡丽艳;冯宪彬;丁蕊;;基于决策树的农户小额贷款信用评估模型研究[J];安徽农业科学;2011年02期
5 赵静娴;;基于决策树的食品安全评估研究[J];安徽农业科学;2011年32期
6 王斌;;基于聚类的决策树在玉米种质筛选中的应用[J];安徽农业科学;2011年33期
7 何甫权;;英语指代与翻译[J];安徽文学(下半月);2008年08期
8 陈文;基于决策树的入侵检测的实现[J];安徽技术师范学院学报;2005年05期
9 覃爱明,胡昌振,谭惠民;网络攻击检测中的机器学习方法综述[J];安全与环境学报;2001年01期
10 左吉峰;乔均俭;;ID3算法的合理性证明及实验分析[J];保定学院学报;2008年04期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
3 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
4 鲁松;;英文介词短语归并歧义的RMBL分类器消解[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
5 刘海霞;钟晓妮;周燕荣;田考聪;;决策树在居民就诊卫生服务利用影响因素研究中的应用[A];重庆市预防医学会2010年论文集[C];2011年
6 汪云亮;吕久明;刘孝刚;;基于信息熵的辐射源属性分类方法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
7 叶中行;陆青;余敏杰;;计算智能在银行信贷信用分类中的应用[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(下册)[C];2008年
8 徐怡;余斌;李龙澍;;粗糙集在决策树生成中的应用[A];2005中国控制与决策学术年会论文集(下)[C];2005年
9 ;Rough Set Based Autolanding Control[A];第二十三届中国控制会议论文集(下册)[C];2004年
10 刘东升;;基于Mobile Agent的分布式ID3挖掘模型[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
2 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
3 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
4 朱佳俊;不确定可拓群决策优化方法及应用[D];东华大学;2010年
5 陈进;高光谱图像分类方法研究[D];国防科学技术大学;2010年
6 管红波;食品连锁经营中的有效客户反应研究[D];东华大学;2010年
7 李军;不平衡数据学习的研究[D];吉林大学;2011年
8 魏小涛;在线自适应网络异常检测系统模型与相关算法研究[D];北京交通大学;2009年
9 王中锋;树型贝叶斯网络分类器鉴别式训练研究[D];北京交通大学;2011年
10 杨明;分布式环境下的安全策略关键技术研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
2 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
3 曹振兴;适应概念漂移的数据流分类算法研究[D];哈尔滨工程大学;2010年
4 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
5 秦园;基于SPOT5的土地信息提取技术研究[D];大连理工大学;2010年
6 李仁良;决策树算法在临床诊断中的应用研究[D];辽宁工程技术大学;2009年
7 郑陶;基于平面向量的决策树算法在高考志愿选择系统中的应用[D];辽宁工程技术大学;2010年
8 孙怡哲;一种改进的决策树算法研究与应用[D];辽宁工程技术大学;2010年
9 黄辉;基于LSI和SVC的网页文本分类算法研究[D];长沙理工大学;2010年
10 周翔;决策支持技术在企业销售系统中的应用研究[D];中国海洋大学;2010年
【二级参考文献】
中国期刊全文数据库 前4条
1 秦洪武;第三人称代词在深层回指中的应用分析[J];当代语言学;2001年01期
2 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
3 王厚峰;指代消解的基本方法和实现技术[J];中文信息学报;2002年06期
4 张钹;;自然语言处理的计算模型[J];中文信息学报;2007年03期
【相似文献】
中国期刊全文数据库 前10条
1 邢建国,谭建荣;实例检索策略及其在减速器零件CAPP中的应用[J];中国机械工程;2000年09期
2 邹慧君,王石刚,蔡逆水,亢金月;基于多层推理机制的机械产品概念设计[J];计算机辅助设计与图形学学报;1997年06期
3 侯宏旭;刘群;那顺乌日图;;基于实例的汉蒙机器翻译[J];中文信息学报;2007年04期
4 贾玉祥;俞士汶;;基于实例的隐喻理解与生成[J];计算机科学;2009年03期
5 胡国全,陈家骏,戴新宇,尹存燕;一种基于实例的汉英机器翻译策略[J];计算机工程与设计;2005年04期
6 马卫东,蔡力钢,李培根;基于实例与知识的智能CAPP策略[J];华中理工大学学报;1995年02期
7 琚(王凡) ,张晔;基于实例的智能机械设计技术及其实施建议[J];安徽科技;1998年11期
8 王高峰,钟诗胜,肖人彬,周济;知识库集成维护方法研究[J];计算机与现代化;1995年02期
9 贾莉;;微软淡入零售渠道[J];每周电脑报;1997年09期
10 许亚梅;张立臣;;基于实例的机器翻译方法及其优化策略探讨[J];福建电脑;2006年05期
中国重要会议论文全文数据库 前10条
1 黎耀炳;张牧宇;秦兵;刘挺;;基于中心语匹配的共指消解[A];第六届全国信息检索学术会议论文集[C];2010年
2 贾修一;张亚兵;陈家骏;商琳;;基于粗糙集方法的共指消解[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 张苇如;孙乐;韩先培;;基于维基百科和模式聚类的实体关系抽取方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 何朝明;唐定勇;胡斌;唐倩;;基于实例的变型设计系统[A];中国工程物理研究院科技年报(2001)[C];2001年
5 王菁华;刘建毅;王枞;;语义网络结构下的词义消歧[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
6 龙丽霞;李蕾;钟义信;;一种基于实例语境的汉语语音识别后文本检错纠错方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 熊文新;;提升自然语言向中间语言转换准确性的增强处理[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 谭斌;;指代消解的原理和实现方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
9 赵勇;徐诚;;基于实例装配方案的枪械设计可装配性决策[A];1998中国控制与决策学术年会论文集[C];1998年
10 石志强;李涛;孙延涛;;基于以太网的宽带社区网络管理系统[A];2003年通信软件技术学术年会论文集[C];2003年
中国重要报纸全文数据库 前10条
1 甄颖;132种商品首批强制认证[N];中国乡镇企业报;2003年
2 本报记者 刘盈蓉 通讯员 胡罡;法律援助成为弱势群体保护神[N];湘潭日报;2008年
3 记者 林世钰;西部巡讲要长期坚持下去[N];检察日报;2001年
4 王 萍 乔 真;架连心桥 解千千结[N];人民法院报;2004年
5 潘双清;2万吨柴油可保“三夏”无忧[N];石家庄日报;2008年
6 新华社记者 熊艳 丛峰;成都市:实事办到心坎上群众打分当裁判[N];新华每日电讯;2004年
7 记者 卢怀谦;全国保监局多半实现非现场监管[N];中国证券报;2004年
8 齐文潮 黄桃源;一手抓服务 一手抓监管[N];金融时报;2004年
9 楚良;湖北三措并举稳定市场供应[N];粮油市场报;2008年
10 徐伟;旅客在台停留时间不超过10天[N];法制日报;2008年
中国博士学位论文全文数据库 前10条
1 黄东晶;俄汉代词指示语对比研究[D];黑龙江大学;2001年
2 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
3 陈满意;基于实例的机械产品快速集成设计系统研究与实践[D];武汉理工大学;2003年
4 库祥臣;异形弹簧数字化制造关键技术研究[D];西北工业大学;2007年
5 肖学中;基于实例的颜色处理新技术研究[D];上海交通大学;2009年
6 高常青;机械产品快速创新设计及其关键技术的研究[D];山东大学;2006年
7 谭武征;基于知识的概念创新设计系统关键技术的研究[D];上海交通大学;2008年
8 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年
9 朱倩;面向自由文本的细粒度关系抽取的关键技术研究[D];江苏大学;2011年
10 王道英;“这”、“那”的指示研究[D];上海师范大学;2003年
中国硕士学位论文全文数据库 前10条
1 张牧宇;基于实例动态泛化的共指消解及应用[D];哈尔滨工业大学;2011年
2 黎耀炳;面向共指消解的动态泛化机制研究[D];哈尔滨工业大学;2010年
3 漆舒汉;基于待消解项识别的全局优化共指消解方法研究[D];哈尔滨工业大学;2011年
4 赵凤娟;中国二语学习者英语口头叙述中重复的使用特征研究[D];扬州大学;2006年
5 刘龙;音乐领域全局实体关系抽取研究[D];哈尔滨工业大学;2010年
6 张宜浩;基于最大熵模型的中文实体关系自动抽取研究[D];昆明理工大学;2010年
7 蒋武;基于实例的汽车覆盖件模具设计系统[D];华中科技大学;2004年
8 狄梅;间接回指:其认知阐释及对体裁的影响[D];苏州大学;2004年
9 李曙光;基于实例的机械传动产品设计与实现[D];西安电子科技大学;2005年
10 张西龙;基于实例的英汉专利自动翻译技术的研究[D];沈阳航空航天大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026