收藏本站
《上海交通大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于事件框架的突发事件信息抽取

冯礼  
【摘要】: 在目前信息爆炸的时代,基于事件框架的新闻信息抽取技术能够更好地满足人们获知网上有效信息的需要。通过对新闻语料的分析,可以预定义三类突发事件的框架结构,由此可对事件各侧面采取定制的处理。利用对新闻报道的词性标注、对地点数据库的查询以及基于语料研究的一些抽取规则的制订,能有效地抽取新闻事件的时间、地点、结果等各侧面信息。 由于新闻事件的复杂及动态发展的特点,基于事件框架信息抽取中存在一个问题:静态结构的框架限定了能抽取的侧面内容。为此,本文引入事件新侧面探测方法,采用自动探测方法寻找框架中未预定义的侧面。为充分利用句子中词性、语序及词之间的关系,本文使用词对特征模型进行特征提取,选择基于段落的LSA聚类算法来实现新侧面探测。 根据原型系统在突发事件语料库上的测试结果,本文提出的方法被证明是切实可行的,对于突发事件新闻要素的抽取达到了较高的正确率和召回率。事件新侧面探测的结果较好地表现了单个事件的特性和同类事件未包含在框架内的某些共性。实验结果证明了本研究的应用前景。
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP391.1;TP311.13

【引证文献】
中国期刊全文数据库 前6条
1 樊旭琴;张永奎;;基于词对向量空间模型的新事件检测方法[J];计算机工程与应用;2010年12期
2 许旭阳;李弼程;张先飞;韩永峰;;基于事件实例驱动的新闻文本事件抽取[J];计算机科学;2011年08期
3 韩永峰;许旭阳;李弼程;朱武斌;陈刚;;基于事件抽取的网络新闻多文档自动摘要[J];中文信息学报;2012年01期
4 杨尔弘;曾青青;李婷婷;;事件信息结构分析[J];中文信息学报;2012年03期
5 安海岗;;专题新闻文本集信息可视化理论模型及实证研究[J];情报杂志;2012年08期
6 许旭阳;韩永峰;宋文政;;事件抽取技术的回顾与展望[J];信息工程大学学报;2011年01期
中国博士学位论文全文数据库 前3条
1 高田;基于领域知识的旅游突发事件状态评估与演化研究[D];北京邮电大学;2011年
2 安海岗;专题新闻文本集信息可视化理论模型研究[D];中国地质大学(北京);2010年
3 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
中国硕士学位论文全文数据库 前10条
1 范春晓;基于XML的Web信息抽取技术研究[D];沈阳理工大学;2010年
2 孙萍;面向事件的多文档自动文摘研究[D];江苏大学;2010年
3 陈慧炜;刑事案件文本信息抽取研究[D];南京师范大学;2011年
4 王星;新闻网页抽取技术的研究与实现[D];河北工业大学;2011年
5 许旭阳;网络新闻多文档自动摘要技术研究[D];解放军信息工程大学;2011年
6 崔娜;面向用户需求的专题新闻文本集可视化模型研究[D];中国地质大学(北京);2009年
7 杨超;基于Agent的旅游突发事件信息集成系统研究[D];北京邮电大学;2009年
8 董萍;基于知网语义关系的中文事件信息抽取研究[D];西安电子科技大学;2010年
9 桂卓民;基于事件的多文档自动文摘系统的研究[D];华中师范大学;2010年
10 韩永峰;网络新闻突发事件信息抽取技术研究[D];解放军信息工程大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 李保利,俞士汶;话题识别与跟踪研究[J];计算机工程与应用;2003年17期
2 刘云峰,齐欢,代建民;潜在语义分析在中文信息处理中的应用[J];计算机工程与应用;2005年03期
3 谭红叶,郑家恒,刘开瑛;中国地名自动识别系统的设计与实现[J];计算机工程;2002年08期
4 刘迁;焦慧;贾惠波;;信息抽取技术的发展现状及构建方法的研究[J];计算机应用研究;2007年07期
5 黄德根,岳广玲,杨元生;基于统计的中文地名识别[J];中文信息学报;2003年02期
6 吴平博,陈群秀,马亮;基于事件框架的事件相关文档的智能检索研究[J];中文信息学报;2003年06期
7 吴平博;陈群秀;马亮;;基于时空分析的线索性事件的抽取与集成系统研究[J];中文信息学报;2006年01期
8 梁晗;陈群秀;吴平博;;基于事件框架的信息抽取系统[J];中文信息学报;2006年02期
9 李丽双;黄德根;陈春荣;杨元生;;SVM与规则相结合的中文地名自动识别[J];中文信息学报;2006年05期
10 李向阳,苗壮;自由文本信息抽取技术[J];情报科学;2004年07期
【共引文献】
中国期刊全文数据库 前10条
1 吴昊;耿焕同;吴祥;;一种基于聚类分析的BBS主题发现算法研究[J];安徽师范大学学报(自然科学版);2009年01期
2 税仪冬;瞿有利;黄厚宽;;周期分类和Single-Pass聚类相结合的话题识别与跟踪方法[J];北京交通大学学报;2009年05期
3 焦健;瞿有利;;知网的话题更新与跟踪算法研究[J];北京交通大学学报;2009年05期
4 樊孝忠,柳林,任锋;汉字智能输入刍议[J];兵工自动化;1995年04期
5 李畅;王永良;冯晓洁;聂峰;;作战文书关键信息抽取方法[J];兵工自动化;2011年05期
6 付艳;杨冬青;唐世渭;伍伟;王腾蛟;高军;;基于实体识别的在线主题检测方法[J];北京大学学报(自然科学版);2009年02期
7 王伟;赵东岩;赵伟;;中文新闻关键事件的主题句识别[J];北京大学学报(自然科学版);2011年05期
8 李国和,赵沁平;信息系统的一种分块特征选取方法[J];北京航空航天大学学报;2003年03期
9 李国和,赵沁平,王喜;一种频繁复合项目集的混合求解方法[J];北京航空航天大学学报;2004年08期
10 宁文如,申海军;飞行员导航专家系统[J];北京航空航天大学学报;1997年06期
中国重要会议论文全文数据库 前10条
1 彭楠赟;王厚峰;凌晨添;;基于层次聚类的网络新闻热点发现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 闭剑婷;邓琦;卢佳佳;曹波;;A Model of Bi-directional Translation based on Latent Semantic Analysis[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
3 孙兆豪;李昂;刘坤起;解建军;;论代数、逻辑和智能系统之间的对应关系[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
4 耿焕同;吴祥;毕硕本;;基于潜在语义分析的BBS主题发现算法研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
5 宋宇辰;苑守成;杨进;;专家系统在西部地下水开发的应用研究[A];勘探地球物理2005学术交流会论文集[C];2005年
6 何险峰;张祥峰;郑丽娟;薛勤;蔡元刚;;气象灾害本体设计[A];第28届中国气象学会年会——S10公共气象服务政策体制机制和学科建设[C];2011年
7 郑天翔;谢亮;杨力华;;表格手写数字串的若干技术研究[A];第十三届全国图象图形学学术会议论文集[C];2006年
8 吴平博;陈群秀;马亮;;基于时空分析的线索性事件的抽取与集成系统研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 胡吉祥;许洪波;刘悦;王斌;程学旗;;基于重复串的短文本聚类研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 邱立坤;程葳;龙志祎;孙娇华;;面向BBS的话题挖掘初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 张晓艳;新闻话题表示模型和关联追踪技术研究[D];国防科学技术大学;2010年
2 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年
3 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
4 冯肖维;基于多传感器信息融合的移动机器人位姿计算方法研究[D];上海大学;2011年
5 吴承荣;骨干通道上的网络论坛通信信息监测和分析的关键技术研究[D];复旦大学;2011年
6 高田;基于领域知识的旅游突发事件状态评估与演化研究[D];北京邮电大学;2011年
7 王肃;基于多Agent的突发事件信息智能监测系统研究[D];北京邮电大学;2011年
8 单建芳;面向事件的文本表示研究[D];上海大学;2012年
9 赵博;结构化集成调度系统理论及基于该理论的虚拟车间智能支撑平台的体系结构研究[D];大连理工大学;2000年
10 孙鑫;造纸过程的分层递阶智能控制系统[D];浙江大学;2001年
中国硕士学位论文全文数据库 前10条
1 白冰;基于数据处理中心的企业竞争情报系统研究[D];山东科技大学;2010年
2 秦宏宇;网络舆情热点发现相关技术研究[D];哈尔滨工程大学;2010年
3 柴红霞;移动机器人在SLAM中数据关联方法的研究[D];大连理工大学;2010年
4 廖文平;基于CRF的中文地名识别研究[D];大连理工大学;2010年
5 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
6 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
7 丛肖为;敏感信息监管系统的设计与实现[D];华东师范大学;2010年
8 范春晓;基于XML的Web信息抽取技术研究[D];沈阳理工大学;2010年
9 江涛;基于藏文web舆情分析的热点发现算法研究[D];西北民族大学;2010年
10 钟鸿鹏;基于时态信息的网页排序系统的研究与实现[D];华南理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
2 郭庆琳,樊孝忠,柳长安;基于文本聚类和NLU的自动文摘研究[J];北京理工大学学报;2005年08期
3 任智军;朱东华;谢菲;;科技文本的可视化分析研究[J];北京理工大学学报(社会科学版);2007年01期
4 傅骞;温晓辉;;开放式Web信息抽取系统研究与实现[J];北京师范大学学报(自然科学版);2005年06期
5 魏桂英,郑玄轩;层次聚类方法的CURE算法研究[J];科技和产业;2005年11期
6 刘春辉;金顺福;刘国华;李颖;;基于优化最大匹配与统计结合的汉语分词方法[J];燕山大学学报;2009年02期
7 辜寄蓉,范晓,彭东;九寨沟地质灾害预测的空间分析模型[J];中国地质;2002年01期
8 杨思春;;一种改进的句子相似度计算模型[J];电子科技大学学报;2006年06期
9 于江德;李学钰;樊孝忠;庞文博;;最大熵模型的事件分类[J];电子科技大学学报;2010年04期
10 王宁;韩胜菊;李怀明;王延章;;基于实体-关系-问题建模体系的信息资源整合建模研究[J];大连理工大学学报;2007年02期
中国重要会议论文全文数据库 前3条
1 王洋;秦兵;郑实福;;句子相似度计算在FAQ中的应用[A];第一届学生计算语言学研讨会论文集[C];2002年
2 赵妍妍;王啸吟;秦兵;车万翔;刘挺;;中文事件抽取中事件类别的自动识别[A];第三届学生计算语言学研讨会论文集[C];2006年
3 钟涛;陈群秀;;基于层式有限状态自动机的灾难事件抽取系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
2 干红华;基于事件的因果关系可计算化分析研究[D];浙江大学;2003年
3 张凯;基于本体的Web信息集成若干关键技术研究[D];复旦大学;2004年
4 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
5 姜吉发;自由文本的信息抽取模式获取的研究[D];中国科学院研究生院(计算技术研究所);2004年
6 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
7 刘德喜;基于基本要素的多文档自动文摘研究[D];武汉大学;2007年
8 胡燕;基于Web信息抽取的专业知识获取方法研究[D];武汉理工大学;2007年
9 谭红叶;中文事件抽取关键技术研究[D];哈尔滨工业大学;2008年
10 王凯;突发事件下决策者的框架效应研究[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
2 周杰;网络舆情话题情感倾向性分析技术研究[D];解放军信息工程大学;2010年
3 孟迎;基于统计的机器学习的中文命名实体识别[D];昆明理工大学;2004年
4 吴平博;基于事件框架的主题相关文档智能检索的初步研究[D];清华大学;2004年
5 胡珀;基于自适应聚类的中文自动文摘研究[D];华中师范大学;2005年
6 王萌;基于概念向量空间模型的中文自动文摘研究[D];华中师范大学;2005年
7 史军强;WEB信息集成技术研究[D];电子科技大学;2005年
8 叶娜;面向信息抽取的文本预处理和规则自动学习技术研究[D];东北大学;2005年
9 温锐;中文命名实体识别及其关系抽取研究[D];苏州大学;2005年
10 江导;基于WEB信息集成方法的研究及应用[D];暨南大学;2005年
【二级引证文献】
中国期刊全文数据库 前5条
1 马彬;洪宇;杨雪蓉;姚建民;朱巧明;;基于语义依存线索的事件关系识别方法研究[J];北京大学学报(自然科学版);2013年01期
2 汪材印;崔琳;李鸿;;基于链接预测思想的问句检索方法研究[J];计算机工程与应用;2012年10期
3 廖涛;刘宗田;王先传;;基于事件的多主题文本自动文摘方法[J];计算机工程;2013年03期
4 王政霄;黄征;;一种中文微博观点抽取技术[J];信息安全与通信保密;2013年01期
5 何琳;何娟;沈耕宇;杨波;黄水清;;一种通过文本挖掘发现实时定量聚合酶链式反应实验内参基因的方法研究[J];现代图书情报技术;2012年Z1期
中国博士学位论文全文数据库 前3条
1 王肃;基于多Agent的突发事件信息智能监测系统研究[D];北京邮电大学;2011年
2 单建芳;面向事件的文本表示研究[D];上海大学;2012年
3 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
中国硕士学位论文全文数据库 前6条
1 樊旭琴;形式概念分析在突发事件新闻文本聚类中的应用[D];山西大学;2010年
2 张阳;农业搜索可视化平台的研究[D];中国科学技术大学;2010年
3 董恩超;基于知识元的非常规突发事件演化模型研究[D];大连理工大学;2012年
4 霍娜;突发事件追踪报道信息抽取的研究[D];山西大学;2012年
5 闫世斗;云计算中认证与隐私保护技术的研究[D];西安电子科技大学;2012年
6 韩永峰;网络新闻突发事件信息抽取技术研究[D];解放军信息工程大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报;1998年01期
2 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
3 谭红叶,郑家恒,刘开瑛;中国地名自动识别系统的设计与实现[J];计算机工程;2002年08期
4 郑家恒,李鑫,谭红叶;基于语料库的中文姓名识别方法研究[J];中文信息学报;2000年01期
5 刘秉伟,黄萱菁,郭以昆,吴立德;基于统计方法的中文姓名识别[J];中文信息学报;2000年03期
6 吕雅娟,赵铁军,杨沐昀,于浩,李生;基于分解与动态规划策略的汉语未登录词识别[J];中文信息学报;2001年01期
7 黄德根,杨元生,王省,张艳丽,钟万勰;基于统计方法的中文姓名识别[J];中文信息学报;2001年02期
8 黄德根,岳广玲,杨元生;基于统计的中文地名识别[J];中文信息学报;2003年02期
9 吴平博,陈群秀,马亮;基于事件框架的事件相关文档的智能检索研究[J];中文信息学报;2003年06期
10 王振华,孔祥龙,陆汝占,刘绍明;结合决策树方法的中文姓名识别[J];中文信息学报;2004年06期
【相似文献】
中国期刊全文数据库 前10条
1 蔡华利;刘鲁;刘志明;杨跃翔;;突发事件Web新闻中时间信息分析及抽取[J];计算机工程与应用;2010年34期
2 杨勇涛;;文本自动摘要提取算法[J];成都大学学报(自然科学版);2009年02期
3 邓擘;郑彦宁;樊孝忠;;汉语信息抽取中事件的定位与分类[J];情报理论与实践;2009年10期
4 朱红灿;陈能华;周永红;;计算Web页面信息熵的方法[J];计算机工程与设计;2010年01期
5 陈志雄;朱向庆;;基于特征词统计的网页结构化信息抽取[J];嘉应学院学报;2011年02期
6 赵金仿;赵艳;缪建明;;网页信息抽取及其自动文本分类的实现[J];计算机技术与发展;2008年10期
7 程晨;;使用GATE进行中文命名实体识别的研究[J];福建电脑;2010年08期
8 李慧;张舒;顾天竺;陈晓红;吴颜;;一种新颖的CRE用户评论信息抽取技术[J];计算机应用;2006年10期
9 方莹,葛寒松;基于聚类的分级信息抽取方法初探[J];电脑知识与技术;2005年30期
10 朱红灿;龙朝阳;;基于熵的新闻网页抽取方法的研究[J];现代图书情报技术;2007年04期
中国重要会议论文全文数据库 前10条
1 钟涛;陈群秀;;基于层式有限状态自动机的灾难事件抽取系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 崔欣辰;曲宁;陈青华;;隐马尔可夫模型在Web信息抽取中的几点改进[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
3 叶娜;吴雪军;朱靖波;陈文亮;;基于相似计算的信息抽取模板自动获取方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 疏学明;郑魁;张辉;袁宏永;;突发事件中网络舆情信息管理方式探讨[A];中国突发事件防范与快速处置优秀成果选编[C];2009年
5 张玉波;;突发事件中的谣言应对——从杭州“5·7”交通肇事案谈起[A];公共管理与地方政府创新研讨会论文[C];2009年
6 殷雅平;;领导应急处置突发事件的对策研究[A];提高领导科学发展能力暨纪念新中国成立60周年理论研讨会论文集[C];2009年
7 张玉波;;突发事件中的谣言应对——从杭州“5·7”交通肇事案谈起[A];“中国特色社会主义行政管理体制”研讨会暨中国行政管理学会第20届年会论文集[C];2010年
8 吴会军;;论水污染突发事件应急机制[A];水污染防治立法和循环经济立法研究——2005年全国环境资源法学研讨会论文集(第一册)[C];2005年
9 伏军贤;李景梦;刘雅东;刘丹平;;综合医院应对危机和突发公共卫生事件的探讨[A];第四届全国灾害医学学术会议暨第二届“华森杯”灾害医学优秀学术论文评审会学术论文集[C];2007年
10 李铭禄;陈安;;“城市公众恐慌”的度量模型及其应用研究[A];第十一届全国心理学学术会议论文摘要集[C];2007年
中国重要报纸全文数据库 前10条
1 ;突发事件应对媒体不应“缺位”[N];第一财经日报;2006年
2 王凯山;国家和大众共同努力[N];中华合作时报;2007年
3 紫燕;我州金融部门设置“防火墙”[N];伊犁日报(汉);2007年
4 马志强;我市召开贯彻实施《突发事件应对法》电视电话会议[N];新乡日报;2007年
5 记者 潘晓华实习生 丁丹璐;提高防范意识 强化处置能力[N];绍兴日报;2008年
6 左 同;建立突发事件监测预警机制[N];证券日报;2004年
7 本报记者 唐冬梅;“内容管理”:突发事件应急处理的保障[N];中国改革报;2003年
8 ;突发公共卫生事件应急条例[N];健康报;2003年
9 孙国彬;未雨绸缪 防患未然[N];中国电力报;2006年
10 唐云峰 林明;传媒切莫“猎奇”[N];广安日报;2006年
中国博士学位论文全文数据库 前10条
1 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
2 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
3 胡燕;基于Web信息抽取的专业知识获取方法研究[D];武汉理工大学;2007年
4 马慧敏;基于免疫理论的非常规突发事件应急管理主动免疫系统研究[D];武汉理工大学;2010年
5 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
6 温昌衍;客家方言特征词研究[D];暨南大学;2001年
7 廖洁明;突发事件应急管理绩效评估研究[D];暨南大学;2009年
8 高杨;突发事件应急管理中的多核应急协同决策方法研究[D];天津大学;2012年
9 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
10 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
中国硕士学位论文全文数据库 前10条
1 冯礼;基于事件框架的突发事件信息抽取[D];上海交通大学;2008年
2 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
3 杨选选;基于概念图和语义角色的多领域信息抽取系统研究[D];西北大学;2010年
4 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年
5 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年
6 杨文柱;基于领域知识和信息抽取的个性化Web查询系统[D];河北大学;2002年
7 张志强;Web信息抽取技术研究与基于Web service的实现[D];河北大学;2004年
8 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
9 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
10 王花;Web信息抽取技术研究[D];西北农林科技大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026