收藏本站
《苏州大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于主题的事件融合技术的研究与实现

孙中友  
【摘要】: 随着互联网的快速发展,网络上关于某一主题的新闻报道呈爆炸式增长,大量的事件信息存在冗余、不完整、不一致、有歧义现象。如何能快速准确地获得某一主题详细而完整的信息是一个需要解决的问题。本文就主题事件的融合问题进行了研究。 本文提出了多源不完备元事件信息融合的方法,该方法针对事件信息存在不完整、歧义及重要信息丢失的现象,提出基于统计的元素补齐算法;通过对已有的事件相似度算法及聚类算法进行改进,提出了基于分组融合的同指元事件融合方法,该方法有效地解决了互斥信息、互补信息、冗余信息的融合问题。 本文提出了基于主题的事件融合处理方法,该方法通过基于互信息的事件聚类算法,有效得对基于主题的事件进行融合,同时提出基于事件的摘要生成方法和基于摘要的层次聚类算法,可以获得结构化,时序化的主题事件形式。 实验表明,本文不完备元事件信息融合方法可以有效合并事件信息,大大降低了信息系统的冗余度,有效完善了不完整事件信息,通过对多源信息的冗余性和互补性进行融合,达到增加目标特征矢量的维数、降低信息的不确定性及改善信息的置信度等目的。基于主题的事件融合不仅能有效地将相关事件联系起来,并能将整个主题以层次化、结构的形式表示。
【关键词】:事件信息抽取 事件融合 不完备信息处理 事件聚类
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP393.09
【目录】:
  • 中文摘要4-5
  • Abstract5-10
  • 第一章 绪论10-15
  • 1.1 研究背景及意义10-11
  • 1.2 研究现状11-12
  • 1.3 本文主要研究内容12-14
  • 1.4 本文组织结构14-15
  • 第二章 事件信息融合的相关研究15-27
  • 2.1 术语介绍15-16
  • 2.2 信息抽取概述16-21
  • 2.2.1 信息抽取的历史和现状16-18
  • 2.2.2 信息抽取中的关键技术18-19
  • 2.2.3 事件信息抽取19-21
  • 2.3 信息融合概述21-23
  • 2.3.1 信息融合的历史和现状21-22
  • 2.3.2 信息融合的常用算法22-23
  • 2.4 其它相关研究23-25
  • 2.4.1 话题探测与跟踪23-24
  • 2.4.2 多文档自动文摘24-25
  • 2.4.3 自动问答25
  • 2.5 实验语料与预处理平台介绍25-26
  • 2.6 本章小结26-27
  • 第三章 多源不完备元事件信息融合27-57
  • 3.1 引言27
  • 3.2 多源不完善元事件融合基本框架27-28
  • 3.3 不完备信息处理28-35
  • 3.3.1 不完备信息分析28-29
  • 3.3.2 不完备信息处理方法29-30
  • 3.3.3 本文处理方法30-34
  • 3.3.3.1 时间信息完备化30-32
  • 3.3.3.2 地点信息完备化32-33
  • 3.3.3.3 辨别事件真伪并进行修正处理33-34
  • 3.3.4 不完备信息处理实验及分析34-35
  • 3.4 事件元素规格化35-40
  • 3.4.1 时间信息规格化35-38
  • 3.4.1.1 时间表达分析36-37
  • 3.4.1.2 规格化处理37-38
  • 3.4.2 地点信息规格化38-39
  • 3.4.3 数字规格化39-40
  • 3.5 元事件的聚类40-49
  • 3.5.1 句子相似度计算40-42
  • 3.5.2 元事件聚类分析及实现42-46
  • 3.5.2.1 问题提出与分析42-44
  • 3.5.2.2 过滤同文档内的相同事件44
  • 3.5.2.3 聚类实现44-46
  • 3.5.3 共指元事件聚类的实验与分析46-49
  • 3.6 元事件融合49-55
  • 3.6.1 元素可信度计算50
  • 3.6.2 元素值可信度调整50-51
  • 3.6.3 冗余信息融合51-52
  • 3.6.4 互斥信息融合52
  • 3.6.5 互补信息融合52-53
  • 3.6.6 事件元素融合的实验与分析53-55
  • 3.7 按地点信息进行层次化显示55-56
  • 3.8 本章小结56-57
  • 第四章 基于主题的事件融合57-69
  • 4.1 引言57
  • 4.2 主题型事件信息融合的基本框架57-58
  • 4.3 与主题无关事件的去除58-59
  • 4.4 主题事件融合59-62
  • 4.4.1 问题提出及分析59
  • 4.4.2 基于互信息的事件聚类59-62
  • 4.4.2.1 互信息引入60-61
  • 4.4.2.2 事件类相关性61
  • 4.4.2.3 聚类算法61-62
  • 4.5 层次主题识别62-65
  • 4.5.1 基于事件的摘要生成方法62-64
  • 4.5.2 基于摘要的层次聚类算法64-65
  • 4.6 按地点信息进行层次化显示65
  • 4.7 主题融合的实验与分析65-68
  • 4.7.1 实验基础65-66
  • 4.7.2 评价指标的定义66
  • 4.7.3 实验与结果分析66-68
  • 4.8 本章小结68-69
  • 第五章 总结与展望69-72
  • 5.1 本文总结69-70
  • 5.2 未来工作70-72
  • 参考文献72-77
  • 攻读学位期间公开发表的论文77-78
  • 致谢78-79

【参考文献】
中国期刊全文数据库 前9条
1 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
2 徐永东;徐志明;王晓龙;;基于信息融合的多文档自动文摘技术[J];计算机学报;2007年11期
3 许荣华;吴刚;李培峰;朱巧明;;基于指代消解的中文事件融合方法[J];计算机应用;2009年08期
4 李彬,刘挺,秦兵,李生;基于语义依存的汉语句子相似度计算[J];计算机应用研究;2003年12期
5 李国臣,罗云飞;采用优先选择策略的中文人称代词的指代消解[J];中文信息学报;2005年04期
6 吴平博;陈群秀;马亮;;基于时空分析的线索性事件的抽取与集成系统研究[J];中文信息学报;2006年01期
7 赵妍妍;秦兵;车万翔;刘挺;;中文事件抽取技术研究[J];中文信息学报;2008年01期
8 潘泉,于昕,程咏梅,张洪才;信息融合理论的基本方法与进展[J];自动化学报;2003年04期
9 于江德;肖新峰;樊孝忠;;基于隐马尔可夫模型的中文文本事件信息抽取[J];微电子学与计算机;2007年10期
中国博士学位论文全文数据库 前2条
1 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
2 姜吉发;自由文本的信息抽取模式获取的研究[D];中国科学院研究生院(计算技术研究所);2004年
【共引文献】
中国期刊全文数据库 前10条
1 曹恒;张茜;;农作物信息垂直搜索引擎的研究[J];安徽农业科学;2012年19期
2 易波;文天柱;张原;;生理学信息在基因标签提取中的应用[J];兵工自动化;2011年07期
3 王伟;赵东岩;赵伟;;中文新闻关键事件的主题句识别[J];北京大学学报(自然科学版);2011年05期
4 傅骞;温晓辉;;开放式Web信息抽取系统研究与实现[J];北京师范大学学报(自然科学版);2005年06期
5 高鲁,宋辉,高岩,赵明;军用包装信息规范化管理研究[J];包装工程;2005年03期
6 杨松;楼新远;;基于向量空间模型附加词义特征的句子相似度研究[J];成都信息工程学院学报;2012年03期
7 赵娟;孙澎涛;吴粉侠;冯延琴;;基于像素级的图像融合[J];长春工程学院学报(自然科学版);2011年02期
8 王媛彬;;多传感器信息融合概述及其应用[J];传感器世界;2010年12期
9 刘晓东;朱翊;孙立坚;柳棽;;面向突发事件的地理信息服务研究[J];测绘科学;2010年06期
10 刘晓东;马强;邓忠军;朱翊;;突发事件的地理信息定位匹配方法研究[J];地理信息世界;2011年03期
中国重要会议论文全文数据库 前10条
1 曾青青;杨尔弘;;事件词驱动的文本事件信息结构初探[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 孟雷;丁效;秦兵;刘挺;;基于依存句法和短语结构句法结合的金融领域事件元素抽取[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 王红玲;黄超超;张明慧;周国栋;;面向冗余度控制的中文多文档自动文摘[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 韩军伟;陆俊;;信息融合的边缘保持图像滤波方法[A];图像图形技术研究与应用(2010)[C];2010年
5 刘晓东;朱翊;柳棽;;基于突发事件的空间信息定位匹配方法研究[A];中国测绘学会九届三次理事会暨2007年“信息化测绘论坛”学术年会论文集[C];2007年
6 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
7 赵敬华;高慧颖;魏军;;基于本体的商品信息查询系统与算法研究[A];中国企业运筹学[C];2009年
8 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
9 韩盛;李书杰;陈宗海;;移动机器人导航的信息融合技术分析与展望[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
10 司刚全;曹晖;张彦斌;贾立新;;基于信息融合技术的双层优化控制策略在火电厂制粉系统中的应用[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 张涛;GPS/SINS超紧密组合导航系统的关键技术研究[D];哈尔滨工程大学;2010年
2 吕云飞;甚低频矢量水听器潜标探测系统关键技术研究[D];哈尔滨工程大学;2010年
3 何建民;面向网络社区聆听客户声音方法研究[D];合肥工业大学;2010年
4 蒋鼎国;无线传感器网络农业信息监控系统设计与数据融合研究[D];江南大学;2010年
5 王志颖;复杂装备智能机内测试技术研究[D];电子科技大学;2011年
6 韦福如;基于图模型多文档自动文摘研究[D];武汉大学;2009年
7 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年
8 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
9 丁传炳;制导弹箭弹道测量及弹道重构技术研究[D];南京理工大学;2011年
10 王飞;入侵检测分类器设计及其融合技术研究[D];南京理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 焉杰;多传感器时滞系统信息融合及其仿真[D];山东科技大学;2010年
2 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
3 耿倩;基于文本相似度计算的文本聚类算法研究与实现[D];哈尔滨工程大学;2010年
4 孔胜;文本资源的知识抽取研究[D];大连理工大学;2010年
5 王玉波;基于基本概率赋值调整的数据融合方法及应用[D];大连理工大学;2010年
6 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
7 胡志敏;互联网文本自动文摘技术的研究[D];湘潭大学;2010年
8 付东飞;带乘性噪声广义系统多传感器信息融合状态估计算法研究[D];中国海洋大学;2010年
9 徐美霞;基于web技术的网上考试系统[D];中国海洋大学;2010年
10 李小红;基于自举的弱指导中文语义关系抽取研究[D];苏州大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报;1998年01期
2 秦洪武;第三人称代词在深层回指中的应用分析[J];当代语言学;2001年01期
3 郭艳华,周昌乐;一种汉语语句依存关系网协动生成方法研究[J];杭州电子工业学院学报;2000年04期
4 钱伟,郭以昆,周雅倩,吴立德;基于最大熵模型的英文名词短语指代消解[J];计算机研究与发展;2003年09期
5 刘挺,王开铸;基于篇章多级依存结构的自动文摘研究[J];计算机研究与发展;1999年04期
6 廖乐健,曹元大,李新颖;基于Ontology的信息抽取[J];计算机工程与应用;2002年23期
7 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
8 李国臣,段建勇;基于模糊集的名词细分类研究[J];计算机工程;2004年01期
9 姜吉发;一种跨语句汉语事件信息抽取方法[J];计算机工程;2005年02期
10 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
中国重要会议论文全文数据库 前2条
1 车万翔;刘挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 王洋;秦兵;郑实福;;句子相似度计算在FAQ中的应用[A];第一届学生计算语言学研讨会论文集[C];2002年
中国博士学位论文全文数据库 前3条
1 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
2 陈清才;基于粗集的汉语建模及其应用研究[D];哈尔滨工业大学;2003年
3 姜吉发;自由文本的信息抽取模式获取的研究[D];中国科学院研究生院(计算技术研究所);2004年
中国硕士学位论文全文数据库 前2条
1 吴平博;基于事件框架的主题相关文档智能检索的初步研究[D];清华大学;2004年
2 王昀;金融领域中汉语时间信息抽取的研究[D];清华大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 黎湘,庄钊文,郭桂蓉;模糊自组织神经网络及其在信息融合目标识别中的应用[J];国防科技大学学报;1997年03期
2 章新华,林良骥,王骥程;目标识别中信息融合的准则和方法[J];软件学报;1997年04期
3 袁南儿,杨东勇,林毅;多传感器信息融合及其在工业控制中的应用[J];浙江工业大学学报;1999年04期
4 何兵;基于分类及不确定墒的DS证据合成及判决方法[J];北京航空航天大学学报;2003年10期
5 陈俊风,景方,孙华;B样条模糊神经网络在信息融合中的应用[J];哈尔滨理工大学学报;2004年02期
6 张杰林,刘德长,曹代勇;基于信息融合的铀矿床遥感数据挖掘技术[J];世界核地质科学;2004年02期
7 梁志恒,杜庆东;应用多传感器融合技术的燃煤锅炉供热自动控制系统[J];工业锅炉;2004年06期
8 陈东,吴文华;模糊信息融合在电路故障诊断中的应用研究[J];工业仪表与自动化装置;2004年06期
9 许任洲,李训诰;基于距离的目标运动分析方法研究[J];仪器仪表用户;2005年01期
10 江红,张炎华,赵忠华;多传感器信息融合的时间不确定性[J];上海交通大学学报;2005年03期
中国重要会议论文全文数据库 前10条
1 胡良梅;高隽;;信息融合技术[A];全国第十四届计算机科学及其在仪器仪表中的应用学术交流会论文集[C];2001年
2 郭丽珍;李晓奇;;基于三种模糊积分的分类器方法及其改进[A];第四届中国智能计算大会论文集[C];2010年
3 钟京立;韩沂宁;;战术数据链信息融合模型研究[A];第十届中国科协年会信息化与社会发展学术讨论会分会场论文集[C];2008年
4 刘永安;程哲;徐保国;;信息融合的D-S证据理论综述[A];2007中国控制与决策学术年会论文集[C];2007年
5 杜奕;迟毅林;伍星;;信息融合在设备监测和故障诊断中的应用[A];第二十七届中国控制会议论文集[C];2008年
6 顾晓波;许建中;肖泽龙;;BP神经网络在红外毫米波信息融合中的应用[A];2005'全国微波毫米波会议论文集(第二册)[C];2006年
7 李录平;邹新元;晋风华;黄树红;卢绪祥;;基于信息融合的旋转机械振动状态评价方法研究[A];第八届全国振动理论及应用学术会议论文集摘要[C];2003年
8 罗贺;付超;季星;;基于DS证据理论的智能故障诊断方法[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
9 李维运;;多雷达目标信息融合的仿真研究[A];2008-2009年船舶通信导航论文集[C];2009年
10 许任洲;李训诰;赖忠干;;被动声纳噪声信息的融合方法[A];2004年全国水声学学术会议论文集[C];2004年
中国重要报纸全文数据库 前10条
1 周新红 田朝晖 段勇;信息融合:现代战争的重要支撑[N];解放军报;2005年
2 许同和 徐德池;C4系统简介[N];解放军报;2005年
3 张军;具有复杂系统特征的运动目标多模多尺度自适应估计与辨识 获2006年国家自然科学基金重点项目[N];科技日报;2007年
4 翁佳焰;手机电视标准即将落地加速信息融合进程[N];通信信息报;2007年
5 李宽宽 苏小和;陈国青看企业信息化[N];经理日报;2006年
6 段培超;管好系统的“线”[N];计算机世界;2006年
7 戈;通软联合GoCom5.0实现多通信方式协同[N];电脑商报;2007年
8 邹芳根、记者 赵波;实现资源共享 提高科研效能[N];解放军报;2004年
9 卓芝琴;免费杂志, 不仅是美丽[N];中华新闻报;2003年
10 中国科学院自动化研究所模式识别国家重点实验室 周密陶建华;与电脑面谈[N];计算机世界;2007年
中国博士学位论文全文数据库 前10条
1 吴振锋;基于磨粒分析和信息融合的发动机磨损故障诊断技术研究[D];南京航空航天大学;2002年
2 朱大奇;航空电子设备故障诊断技术研究[D];南京航空航天大学;2002年
3 吴世雄;逆向工程中多传感器集成的智能化测量研究[D];浙江大学;2005年
4 袁成清;磨损过程中的磨粒表面和磨损表面特征及其相互关系研究[D];武汉理工大学;2005年
5 王承;基于神经网络的模拟电路故障诊断方法研究[D];电子科技大学;2005年
6 李立京;电梯综合测试系统与故障诊断技术的研究[D];天津大学;2002年
7 张小俊;基于嗅觉信息的机器人味源定位策略及实验研究[D];河北工业大学;2009年
8 孔庆杰;信息融合理论及其在交通监控信息处理中的应用[D];上海交通大学;2010年
9 王志胜;信息融合估计理论及其在航天器控制中的应用研究[D];西北工业大学;2002年
10 李玉榕;信息融合与智能处理的研究[D];浙江大学;2001年
中国硕士学位论文全文数据库 前10条
1 张西雅;基于信息融合的汽车防追尾避撞目标识别研究[D];郑州大学;2010年
2 郝彦彬;基于agent的信息融合与信息过滤机制的研究与实现[D];西北工业大学;2003年
3 许丽佳;组合导航系统中的信息融合研究[D];北京工业大学;2004年
4 孔李军;基于信息融合的粮情测控系统智能决策技术应用研究[D];河南工业大学;2010年
5 夏向阳;电力变压器故障在线监测与诊断系统[D];中南大学;2004年
6 王华朋;基于目标状态估计的信息融合算法研究[D];西北工业大学;2006年
7 高亚格;多传感器信息融合中态势估计方法研究[D];兰州理工大学;2006年
8 张琳;机械故障诊断中神经网络与D-S推理的信息融合技术研究[D];燕山大学;2003年
9 吴太旗;组合导航多源信息融合方法研究及仿真[D];解放军信息工程大学;2004年
10 魏友华;信息融合在复杂油气储层物性参数研究中的应用[D];成都理工大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026