收藏本站
《苏州大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

面向话题的事件信息融合研究与实现

许荣华  
【摘要】: 事件信息抽取(Events Information Extraction: Events IE)目前是信息抽取(Information Extraction: IE)中的一个重要领域。本文提出了一种跨文本事件信息融合方法,该方法在事件IE的基础上引入了多源信息融合理论,并结合命名实体识别、指代消解等其它信息抽取技术,对多源、多文本同话题事件进行信息融合。本文的主要内容包括元事件融合和话题事件融合两部分,具体内容如下: 1.在元事件融合中,考虑到自然语言表述的多样性,对事件描述中的事件元素进行规格化处理,并针对事件元素中的时间信息、命名实体和数字信息的不同表述特点,采用不同的规格化方法; 2.在共指元事件聚类过程中,由于事件描述中常出现事件元素的缺失,为了提高共指元事件聚类的召回率,提出了关键元素集合的概念。并针对事件信息的特点,利用事件中的语义和语用信息提出一种适用于事件信息的相似度算法; 3.在事件元素融合时,在元素的基本可信度上,针对各类事件元素的不同表述特点,根据元素的精度和准度不同调整元素的可信度,提高精度高的元素值被选中的概率。在元素选择时,在可信度计算的基础上,采用了投票策略,增加了最后结果的可信度; 4.在话题事件融合中,为了能更好地表示话题型事件,本文定义了一种基于元事件的话题事件表示模型(Event-based Topic Description Model: ETDM)。该模型可有效地将话题事件进行结构化和层次化表示,接近人类的认知模式,同时可根据不同需要进行信息定制。最后给出了话题事件的融合方法。 实验表明,本文元事件融合可以有效合并事件信息,大大降低了信息系统的冗余度,完善了单个事件信息,通过对多源信息的冗余性和互补性进行融合,达到增加目标特征矢量的维数,降低信息的不确定性,改善信息的置信度等目的。对话题事件的融合不仅能有效地将相关事件联系起来,并能将整个话题以层次化、结构的形式表示。
【关键词】:事件信息抽取 事件融合 事件表示模型 指代消解
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP202
【目录】:
  • 中文摘要3-4
  • Abstract4-8
  • 第一章 绪论8-14
  • 1.1 课题提出9-10
  • 1.2 一些基本术语10-11
  • 1.3 本文研究目标11-12
  • 1.4 本文主要研究内容12-13
  • 1.5 本文组织结构13-14
  • 第二章 事件信息融合的相关研究14-27
  • 2.1 信息抽取概述14-20
  • 2.1.1 命名实体识别15-16
  • 2.1.2 实体关系抽取16-17
  • 2.1.3 指代消解17-18
  • 2.1.4 事件信息抽取18-20
  • 2.2 信息融合概述20-24
  • 2.2.1 信息融合的概念及定义20
  • 2.2.2 信息融合的基本步骤20-21
  • 2.2.3 信息融合常用算法21-23
  • 2.2.4 信息融合的研究现状23-24
  • 2.3 其它相关研究24-26
  • 2.3.1 话题探测与跟踪24-25
  • 2.3.2 多文档自动文摘25-26
  • 2.3.3 自动问答26
  • 2.4 本章小结26-27
  • 第三章 事件融合系统整体设计27-32
  • 3.1 系统整体结构27-28
  • 3.2 语料准备28-29
  • 3.3 评价指标29-30
  • 3.4 本章小结30-32
  • 第四章 基于指代消解的元事件融合32-57
  • 4.1 引言32
  • 4.2 元事件融合基本框架32-33
  • 4.3 事件元素规格化33-41
  • 4.3.1 时间信息规格化34-37
  • 4.3.2 命名实体指代消解37-39
  • 4.3.3 数字规格化39-40
  • 4.3.4 空间信息规格化40-41
  • 4.3.5 其它元素规格化41
  • 4.4 共指元事件的聚类41-49
  • 4.4.1 句子相似度计算42-44
  • 4.4.2 元事件相似度计算44-45
  • 4.4.3 聚类算法45
  • 4.4.4 共指元事件聚类的实验与分析45-49
  • 4.5 事件元素合并49-56
  • 4.5.1 事件元素可信度计算49-50
  • 4.5.2 元素值可信度调整50-52
  • 4.5.3 元素值的融合52
  • 4.5.4 事件元素融合的实验与分析52-56
  • 4.6 本章小结56-57
  • 第五章 话题型事件融合57-71
  • 5.1 引言57
  • 5.2 话题事件信息融合的基本框架57-58
  • 5.3 话题事件表示模型58-63
  • 5.3.1 事件的表示模型58-60
  • 5.3.2 基于元事件的话题事件表示模型的定义60-63
  • 5.4 侧面事件与话题事件的相关度计算63-66
  • 5.4.1 特征提取63-65
  • 5.4.2 相关度计算65-66
  • 5.5 话题融合的实验与分析66-70
  • 5.5.1 实验基础66-67
  • 5.5.2 评价指标的定义67
  • 5.5.3 实验与结果分析67-70
  • 5.6 本章小结70-71
  • 第六章 总结与展望71-74
  • 6.1 本文总结71-72
  • 6.2 未来工作72-74
  • 参考文献74-80
  • 攻读学位期间公开发表的论文80-81
  • 致谢81

【参考文献】
中国期刊全文数据库 前10条
1 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
2 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
3 徐永东;徐志明;王晓龙;;基于信息融合的多文档自动文摘技术[J];计算机学报;2007年11期
4 李彬,刘挺,秦兵,李生;基于语义依存的汉语句子相似度计算[J];计算机应用研究;2003年12期
5 李国臣,罗云飞;采用优先选择策略的中文人称代词的指代消解[J];中文信息学报;2005年04期
6 吴平博;陈群秀;马亮;;基于时空分析的线索性事件的抽取与集成系统研究[J];中文信息学报;2006年01期
7 梁晗;陈群秀;吴平博;;基于事件框架的信息抽取系统[J];中文信息学报;2006年02期
8 赵妍妍;秦兵;车万翔;刘挺;;中文事件抽取技术研究[J];中文信息学报;2008年01期
9 潘泉,于昕,程咏梅,张洪才;信息融合理论的基本方法与进展[J];自动化学报;2003年04期
10 王厚峰,梅铮;鲁棒性的汉语人称代词消解[J];软件学报;2005年05期
中国博士学位论文全文数据库 前1条
1 姜吉发;自由文本的信息抽取模式获取的研究[D];中国科学院研究生院(计算技术研究所);2004年
中国硕士学位论文全文数据库 前1条
1 王昀;金融领域中汉语时间信息抽取的研究[D];清华大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 曹恒;张茜;;农作物信息垂直搜索引擎的研究[J];安徽农业科学;2012年19期
2 张晟;;英语一词多义现象内部语义结构的认知理据[J];保定师范专科学校学报;2006年04期
3 李畅;王永良;冯晓洁;聂峰;;作战文书关键信息抽取方法[J];兵工自动化;2011年05期
4 易波;文天柱;张原;;生理学信息在基因标签提取中的应用[J];兵工自动化;2011年07期
5 王伟;赵东岩;赵伟;;中文新闻关键事件的主题句识别[J];北京大学学报(自然科学版);2011年05期
6 傅骞;温晓辉;;开放式Web信息抽取系统研究与实现[J];北京师范大学学报(自然科学版);2005年06期
7 高鲁,宋辉,高岩,赵明;军用包装信息规范化管理研究[J];包装工程;2005年03期
8 杨松;楼新远;;基于向量空间模型附加词义特征的句子相似度研究[J];成都信息工程学院学报;2012年03期
9 赵娟;孙澎涛;吴粉侠;冯延琴;;基于像素级的图像融合[J];长春工程学院学报(自然科学版);2011年02期
10 王媛彬;;多传感器信息融合概述及其应用[J];传感器世界;2010年12期
中国重要会议论文全文数据库 前10条
1 曾青青;杨尔弘;;事件词驱动的文本事件信息结构初探[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 孟雷;丁效;秦兵;刘挺;;基于依存句法和短语结构句法结合的金融领域事件元素抽取[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 王红玲;黄超超;张明慧;周国栋;;面向冗余度控制的中文多文档自动文摘[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 韩军伟;陆俊;;信息融合的边缘保持图像滤波方法[A];图像图形技术研究与应用(2010)[C];2010年
5 王治敏;俞士汶;;人称代词和名词的歧义消解研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
6 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
7 赵敬华;高慧颖;魏军;;基于本体的商品信息查询系统与算法研究[A];中国企业运筹学[C];2009年
8 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
9 谭斌;;指代消解的原理和实现方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
10 韩盛;李书杰;陈宗海;;移动机器人导航的信息融合技术分析与展望[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 张涛;GPS/SINS超紧密组合导航系统的关键技术研究[D];哈尔滨工程大学;2010年
2 吕云飞;甚低频矢量水听器潜标探测系统关键技术研究[D];哈尔滨工程大学;2010年
3 何建民;面向网络社区聆听客户声音方法研究[D];合肥工业大学;2010年
4 蒋鼎国;无线传感器网络农业信息监控系统设计与数据融合研究[D];江南大学;2010年
5 王志颖;复杂装备智能机内测试技术研究[D];电子科技大学;2011年
6 杨先明;0-5岁汉语儿童语言发展的认知研究[D];武汉大学;2010年
7 韦福如;基于图模型多文档自动文摘研究[D];武汉大学;2009年
8 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年
9 李香玲;汉语兼语式的语义重合与话语功能的认知语法研究[D];河南大学;2011年
10 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
中国硕士学位论文全文数据库 前10条
1 焉杰;多传感器时滞系统信息融合及其仿真[D];山东科技大学;2010年
2 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
3 耿倩;基于文本相似度计算的文本聚类算法研究与实现[D];哈尔滨工程大学;2010年
4 孔胜;文本资源的知识抽取研究[D];大连理工大学;2010年
5 王玉波;基于基本概率赋值调整的数据融合方法及应用[D];大连理工大学;2010年
6 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
7 胡志敏;互联网文本自动文摘技术的研究[D];湘潭大学;2010年
8 付东飞;带乘性噪声广义系统多传感器信息融合状态估计算法研究[D];中国海洋大学;2010年
9 徐美霞;基于web技术的网上考试系统[D];中国海洋大学;2010年
10 李小红;基于自举的弱指导中文语义关系抽取研究[D];苏州大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报;1998年01期
2 麻志毅,林鸿飞,姚天顺,马佳琳;基于情境的文本中的时间信息分析[J];东北大学学报;1999年03期
3 郭艳华,周昌乐;一种汉语语句依存关系网协动生成方法研究[J];杭州电子工业学院学报;2000年04期
4 钱伟,郭以昆,周雅倩,吴立德;基于最大熵模型的英文名词短语指代消解[J];计算机研究与发展;2003年09期
5 刘挺,王开铸;基于篇章多级依存结构的自动文摘研究[J];计算机研究与发展;1999年04期
6 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
7 王厚峰;;句类中E块的作用及其判定策略[J];计算机科学;2000年05期
8 李国臣,段建勇;基于模糊集的名词细分类研究[J];计算机工程;2004年01期
9 姜吉发;一种跨语句汉语事件信息抽取方法[J];计算机工程;2005年02期
10 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
中国重要会议论文全文数据库 前1条
1 车万翔;刘挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前2条
1 陈清才;基于粗集的汉语建模及其应用研究[D];哈尔滨工业大学;2003年
2 姜吉发;自由文本的信息抽取模式获取的研究[D];中国科学院研究生院(计算技术研究所);2004年
【相似文献】
中国期刊全文数据库 前8条
1 侯立斌;李培峰;朱巧明;钱培德;;基于跨事件理论的缺失事件角色填充研究[J];计算机科学;2012年07期
2 钟正;杨慧;;基于关键事件的虚拟文化遗产展示[J];系统仿真学报;2011年11期
3 许金鹏;新一代IDS的标志——事件描述语言[J];信息网络安全;2002年03期
4 周子新;;Ponder策略语言基于事件描述的扩展[J];徐州工程学院学报;2006年09期
5 邓擘;郑彦宁;樊孝忠;;汉语信息抽取中事件的定位与分类[J];情报理论与实践;2009年10期
6 张树峰;邓胜春;徐晓飞;;面向RFID的复杂事件描述语言研究及应用[J];微计算机信息;2009年08期
7 郑明秀;付春常;杨明根;;复杂事件描述语言事件表达式的研究[J];计算机技术与发展;2012年07期
8 周强;李玉梅;;汉语块分析评测任务设计[J];中文信息学报;2010年01期
中国重要会议论文全文数据库 前2条
1 王威;王润生;;视频序列中事件描述的一种方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
2 周强;李玉梅;;汉语块分析评测任务设计[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国重要报纸全文数据库 前1条
1 贾晓敏(作者系北京育民小学教师);爱党爱国永恒的主题[N];中国新闻出版报;2002年
中国硕士学位论文全文数据库 前3条
1 邢欣;汉语事件描述单元的自动识别[D];山西大学;2011年
2 林侃;RFID复杂事件描述抽象与解析处理技术研究[D];华南理工大学;2010年
3 许荣华;面向话题的事件信息融合研究与实现[D];苏州大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026