收藏本站
《苏州大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于主题的事件融合技术的研究与实现

孙中友  
【摘要】: 随着互联网的快速发展,网络上关于某一主题的新闻报道呈爆炸式增长,大量的事件信息存在冗余、不完整、不一致、有歧义现象。如何能快速准确地获得某一主题详细而完整的信息是一个需要解决的问题。本文就主题事件的融合问题进行了研究。 本文提出了多源不完备元事件信息融合的方法,该方法针对事件信息存在不完整、歧义及重要信息丢失的现象,提出基于统计的元素补齐算法;通过对已有的事件相似度算法及聚类算法进行改进,提出了基于分组融合的同指元事件融合方法,该方法有效地解决了互斥信息、互补信息、冗余信息的融合问题。 本文提出了基于主题的事件融合处理方法,该方法通过基于互信息的事件聚类算法,有效得对基于主题的事件进行融合,同时提出基于事件的摘要生成方法和基于摘要的层次聚类算法,可以获得结构化,时序化的主题事件形式。 实验表明,本文不完备元事件信息融合方法可以有效合并事件信息,大大降低了信息系统的冗余度,有效完善了不完整事件信息,通过对多源信息的冗余性和互补性进行融合,达到增加目标特征矢量的维数、降低信息的不确定性及改善信息的置信度等目的。基于主题的事件融合不仅能有效地将相关事件联系起来,并能将整个主题以层次化、结构的形式表示。
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP393.09

【参考文献】
中国期刊全文数据库 前9条
1 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
2 徐永东;徐志明;王晓龙;;基于信息融合的多文档自动文摘技术[J];计算机学报;2007年11期
3 许荣华;吴刚;李培峰;朱巧明;;基于指代消解的中文事件融合方法[J];计算机应用;2009年08期
4 李彬,刘挺,秦兵,李生;基于语义依存的汉语句子相似度计算[J];计算机应用研究;2003年12期
5 李国臣,罗云飞;采用优先选择策略的中文人称代词的指代消解[J];中文信息学报;2005年04期
6 吴平博;陈群秀;马亮;;基于时空分析的线索性事件的抽取与集成系统研究[J];中文信息学报;2006年01期
7 赵妍妍;秦兵;车万翔;刘挺;;中文事件抽取技术研究[J];中文信息学报;2008年01期
8 潘泉,于昕,程咏梅,张洪才;信息融合理论的基本方法与进展[J];自动化学报;2003年04期
9 于江德;肖新峰;樊孝忠;;基于隐马尔可夫模型的中文文本事件信息抽取[J];微电子学与计算机;2007年10期
中国博士学位论文全文数据库 前2条
1 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
2 姜吉发;自由文本的信息抽取模式获取的研究[D];中国科学院研究生院(计算技术研究所);2004年
【共引文献】
中国期刊全文数据库 前10条
1 曹恒;张茜;;农作物信息垂直搜索引擎的研究[J];安徽农业科学;2012年19期
2 易波;文天柱;张原;;生理学信息在基因标签提取中的应用[J];兵工自动化;2011年07期
3 王伟;赵东岩;赵伟;;中文新闻关键事件的主题句识别[J];北京大学学报(自然科学版);2011年05期
4 傅骞;温晓辉;;开放式Web信息抽取系统研究与实现[J];北京师范大学学报(自然科学版);2005年06期
5 高鲁,宋辉,高岩,赵明;军用包装信息规范化管理研究[J];包装工程;2005年03期
6 杨松;楼新远;;基于向量空间模型附加词义特征的句子相似度研究[J];成都信息工程学院学报;2012年03期
7 赵娟;孙澎涛;吴粉侠;冯延琴;;基于像素级的图像融合[J];长春工程学院学报(自然科学版);2011年02期
8 王媛彬;;多传感器信息融合概述及其应用[J];传感器世界;2010年12期
9 刘晓东;朱翊;孙立坚;柳棽;;面向突发事件的地理信息服务研究[J];测绘科学;2010年06期
10 刘晓东;马强;邓忠军;朱翊;;突发事件的地理信息定位匹配方法研究[J];地理信息世界;2011年03期
中国重要会议论文全文数据库 前10条
1 曾青青;杨尔弘;;事件词驱动的文本事件信息结构初探[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 孟雷;丁效;秦兵;刘挺;;基于依存句法和短语结构句法结合的金融领域事件元素抽取[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 王红玲;黄超超;张明慧;周国栋;;面向冗余度控制的中文多文档自动文摘[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 韩军伟;陆俊;;信息融合的边缘保持图像滤波方法[A];图像图形技术研究与应用(2010)[C];2010年
5 刘晓东;朱翊;柳棽;;基于突发事件的空间信息定位匹配方法研究[A];中国测绘学会九届三次理事会暨2007年“信息化测绘论坛”学术年会论文集[C];2007年
6 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
7 赵敬华;高慧颖;魏军;;基于本体的商品信息查询系统与算法研究[A];中国企业运筹学[C];2009年
8 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
9 韩盛;李书杰;陈宗海;;移动机器人导航的信息融合技术分析与展望[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
10 司刚全;曹晖;张彦斌;贾立新;;基于信息融合技术的双层优化控制策略在火电厂制粉系统中的应用[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 张涛;GPS/SINS超紧密组合导航系统的关键技术研究[D];哈尔滨工程大学;2010年
2 吕云飞;甚低频矢量水听器潜标探测系统关键技术研究[D];哈尔滨工程大学;2010年
3 何建民;面向网络社区聆听客户声音方法研究[D];合肥工业大学;2010年
4 蒋鼎国;无线传感器网络农业信息监控系统设计与数据融合研究[D];江南大学;2010年
5 王志颖;复杂装备智能机内测试技术研究[D];电子科技大学;2011年
6 韦福如;基于图模型多文档自动文摘研究[D];武汉大学;2009年
7 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年
8 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
9 丁传炳;制导弹箭弹道测量及弹道重构技术研究[D];南京理工大学;2011年
10 王飞;入侵检测分类器设计及其融合技术研究[D];南京理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 焉杰;多传感器时滞系统信息融合及其仿真[D];山东科技大学;2010年
2 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
3 耿倩;基于文本相似度计算的文本聚类算法研究与实现[D];哈尔滨工程大学;2010年
4 孔胜;文本资源的知识抽取研究[D];大连理工大学;2010年
5 王玉波;基于基本概率赋值调整的数据融合方法及应用[D];大连理工大学;2010年
6 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
7 胡志敏;互联网文本自动文摘技术的研究[D];湘潭大学;2010年
8 付东飞;带乘性噪声广义系统多传感器信息融合状态估计算法研究[D];中国海洋大学;2010年
9 徐美霞;基于web技术的网上考试系统[D];中国海洋大学;2010年
10 李小红;基于自举的弱指导中文语义关系抽取研究[D];苏州大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报;1998年01期
2 秦洪武;第三人称代词在深层回指中的应用分析[J];当代语言学;2001年01期
3 郭艳华,周昌乐;一种汉语语句依存关系网协动生成方法研究[J];杭州电子工业学院学报;2000年04期
4 钱伟,郭以昆,周雅倩,吴立德;基于最大熵模型的英文名词短语指代消解[J];计算机研究与发展;2003年09期
5 刘挺,王开铸;基于篇章多级依存结构的自动文摘研究[J];计算机研究与发展;1999年04期
6 廖乐健,曹元大,李新颖;基于Ontology的信息抽取[J];计算机工程与应用;2002年23期
7 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
8 李国臣,段建勇;基于模糊集的名词细分类研究[J];计算机工程;2004年01期
9 姜吉发;一种跨语句汉语事件信息抽取方法[J];计算机工程;2005年02期
10 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
中国重要会议论文全文数据库 前2条
1 车万翔;刘挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 王洋;秦兵;郑实福;;句子相似度计算在FAQ中的应用[A];第一届学生计算语言学研讨会论文集[C];2002年
中国博士学位论文全文数据库 前3条
1 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
2 陈清才;基于粗集的汉语建模及其应用研究[D];哈尔滨工业大学;2003年
3 姜吉发;自由文本的信息抽取模式获取的研究[D];中国科学院研究生院(计算技术研究所);2004年
中国硕士学位论文全文数据库 前2条
1 吴平博;基于事件框架的主题相关文档智能检索的初步研究[D];清华大学;2004年
2 王昀;金融领域中汉语时间信息抽取的研究[D];清华大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 姜震;黄霞;;实时数据仓库技术的研究[J];计算机系统应用;2007年07期
2 朱俊青;陈伟;;基于时间触发模式的合作式调度器的实现[J];福建电脑;2007年12期
3 魏诺;郭强;李春杰;刘瑞霞;孔祥龙;;基于频率校正的触发型传感器网络同步算法[J];计算机工程;2008年07期
4 李枫;刘志永;马丽;;网页防篡改技术研究及应用[J];电力信息化;2008年07期
5 龙夏;凌军;汤彪;方麟;;基于ISAPI过滤器的网页防篡改系统[J];合肥学院学报(自然科学版);2010年03期
6 王海涛;杜宏伟;;网站内容安全防护技术浅析[J];信息化研究;2010年12期
7 夏海;数字视频监控系统中预录像的实现[J];计算机与现代化;2004年12期
8 夏海;数字视频监控系统中预录像的实现[J];计算机工程与设计;2005年02期
9 刘鲁源;王晓欣;马津艳;;时间触发CAN总线系统的建模与性能分析[J];电子科技大学学报;2007年03期
10 高瑛;;CAN总线在ARM系统中的实现[J];锅炉制造;2007年03期
中国重要会议论文全文数据库 前10条
1 刘博研;史保平;;2008年汶川Ms 8.0地震子事件触发过程的讨论[A];中国地球物理学会第二十七届年会论文集[C];2011年
2 丁效;宋凡;秦兵;刘挺;;音乐领域典型事件抽取方法研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 王彦瑜;马晓莉;白晓薇;陈红燕;;智能型事件触发CAMAC组件的研制[A];第9届全国核电子学与核探测技术学术年会论文集[C];1998年
4 赵妍妍;秦兵;车万翔;刘挺;;中文事件抽取技术研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 武森;金海燕;高学东;;数据挖掘中CABOSFV聚类算法的实现与应用[A];全国第八届工业工程与企业信息化学术会议论文集[C];2004年
6 杜方键;杨宏晖;;K均值聚类优化集成学习[A];2011'中国西部声学学术交流会论文集[C];2011年
7 穆向禹;浦剑涛;张树武;徐波;;基于状态子空间聚类的多层MLLR自适应算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
8 王宁;苑春法;黄昌宁;;汉语名词和形容词的聚类算法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
9 饶鲜;李斌;杨绍全;;用核聚类法进行异常检测[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
10 杨广林;赵云峰;王书理;;Gabor滤波器及其在图像特征提取方面的优化算法[A];2005年中国智能自动化会议论文集[C];2005年
中国重要报纸全文数据库 前10条
1 重庆 朱宏志;用“事件触发器”管理网络[N];电脑报;2004年
2 毛晓刚;重视突发事件背后的“基层危机”[N];北京日报;2008年
3 李要深 杜毅(作者来自西南财经大学信托与理财研究所);银行将以设计创新体现竞争力[N];上海证券报;2007年
4 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
5 山东省菏泽市牡丹区信息中心 宋瑞凤;安全生产监督“下基层”[N];计算机世界;2010年
6 本报记者 申兴 孙健芳;唐建事件触发公募出走潮 监管层酝酿激励机制“松口”[N];经济观察报;2007年
7 王云鹤 熊立;武汉电信直销中心剑指聚类市场[N];人民邮电;2009年
8 记者 肖卓;聚类市场:想挖金矿不容易[N];人民邮电;2009年
9 张秋;突破聚类市场的信息化盲区[N];中国计算机报;2007年
10 袁达珍;金属期货牛市能否持续?[N];江苏经济报;2006年
中国博士学位论文全文数据库 前10条
1 王瑞荣;基于事件触发并发数据流模型的可视化编程语言研究[D];浙江大学;2003年
2 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
3 谭红叶;中文事件抽取关键技术研究[D];哈尔滨工业大学;2008年
4 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
5 郭瑛;基于事件触发的无线传感器网络关键技术研究[D];中国海洋大学;2010年
6 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
7 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
8 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
9 李婵娟;安全关键实时通信协议研究[D];兰州大学;2011年
10 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
中国硕士学位论文全文数据库 前10条
1 孙中友;基于主题的事件融合技术的研究与实现[D];苏州大学;2010年
2 丁效;句子级中文事件抽取关键技术研究[D];哈尔滨工业大学;2011年
3 侯立斌;中文事件抽取与缺失角色填充的研究[D];苏州大学;2012年
4 刘嵩;网络中文事件自动检测技术研究[D];解放军信息工程大学;2010年
5 菅小艳;基于HMM模型的农作物信息抽取方法研究[D];山西大学;2006年
6 廉成洋;基于树结构的Web信息抽取技术研究[D];南京航空航天大学;2010年
7 孙萍;面向事件的多文档自动文摘研究[D];江苏大学;2010年
8 李晶;基于网络抱团发现的命名实体关系抽取[D];华中师范大学;2006年
9 何正华;基于视觉特征的BBS用户发言信息抽取技术研究[D];华东师范大学;2009年
10 赵妍妍;中文事件抽取的相关技术研究[D];哈尔滨工业大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026