收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于框架的事件抽取关键技术研究

金璐钰  
【摘要】: 随着计算机的普及与互联网的高速发展,越来越多的信息充斥在网络中,如何将大量无序的信息准确及时的提取、整理并组织成便于检索的形式,是急待解决的问题,信息抽取技术就是围绕这个目的展开的。其中事件抽取是信息抽取的重要组成部分,事件抽取就是从非结构化文档中抽取出用户感兴趣的事件,同时用结构化形式描述,供用户查询及进一步分析。 本文以自然灾害类事件作为实验对象,研究该类事件领域的信息特点,实现自然灾害类事件信息的抽取与合成。本文首先对实验语料进行预处理,去除文档的高频词和低频词,再利用文档聚类的方法实现了同一类事件侧面特征词的收集,经过一定的人工处理,最终建立了自然灾害事件的框架结构,通过框架结构指导事件的抽取。在事件信息的具体抽取过程中,先建立相关事件的抽取模板,即一组抽取规则,使用这些规则对测试语料进行模板匹配与信息抽取。实现了对自然灾害类事件的事件发生时间、事件发生地点、事件伤亡结果等侧面信息的抽取,并根据时空的一致性原则对同一事件进行了合并。 实验结果表明,本文提出的基于框架的事件抽取方法是切实可行的,对于自然灾害事件的信息抽取得到了较为理想的测试结果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 邱亚娜;;信息抽取在图书馆信息推送服务中的应用研究[J];图书馆工作与研究;2011年01期
2 徐健;张智雄;吴振新;;实体关系抽取的技术方法综述[J];现代图书情报技术;2008年08期
3 肖春;周建龙;;生物医学领域中的文本信息抽取技术与系统综述[J];计算机应用研究;2007年09期
4 陈慧炜;;公安领域案件文本信息抽取研究综述[J];文教资料;2010年18期
5 周晶;;基于条件随机域模型的中文实体关系抽取[J];计算机工程;2010年24期
6 陆科进,李新颖;基于Ontology的文本信息抽取[J];计算机应用研究;2003年07期
7 李向阳;苗壮;肖江;;无结构文本信息抽取综述[J];军事通信技术;2004年02期
8 贺令亚;柳佳刚;;基于Web的包装器技术的现状与发展[J];电脑开发与应用;2007年06期
9 张春明;;Web挖掘技术研究[J];廊坊师范学院学报(自然科学版);2008年05期
10 张岩;;基于本体的信息抽取技术研究[J];科技信息(学术研究);2008年36期
11 邹荣;;对垂直搜索技术的分析[J];福建电脑;2009年02期
12 吴芳;郑君;刘金亮;宗克玄;;基于GATE框架的中文信息抽取技术的研究[J];电脑知识与技术;2009年24期
13 于薇;;包装器的自动生成方法介绍[J];才智;2009年28期
14 张涛;胡正华;夏明星;;远洋运输业业务邮件信息抽取系统的设计及实现[J];电脑知识与技术;2010年01期
15 朱青;吕晓旭;;基于机器学习的HTML标题抽取[J];微计算机信息;2010年09期
16 祝伟华;卢熠;刘斌斌;;基于HMM的Web信息抽取算法的研究与应用[J];计算机科学;2010年02期
17 胡致涌;胡迎松;;基于领域本体的信息抽取系统的设计与实现[J];价值工程;2010年14期
18 王立建;尹四清;;基于Web页面有效信息抽取的分类方法[J];电脑开发与应用;2010年06期
19 丁君军;郑彦宁;化柏林;;国内外属性抽取研究综述[J];情报科学;2011年05期
20 周纯;;垂直搜索引擎技术进展[J];知识经济;2011年09期
中国重要会议论文全文数据库 前10条
1 崔欣辰;曲宁;陈青华;;隐马尔可夫模型在Web信息抽取中的几点改进[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
2 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
3 郭宏蕾;郭志立;;基于模型组合训练机制的特定领域名词性实体识别[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 姜吉发;王树西;;一种自举的二元关系获取方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
6 徐林昊;杨文柱;陈少飞;郝亚南;李天柱;;基于XPath的Web信息抽取[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
7 乔春庚;肖诗斌;孙丽华;施水才;;规则与统计相结合的案件名称识别[A];第三届学生计算语言学研讨会论文集[C];2006年
8 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 徐云风;蒋文蓉;;Web页面信息抽取的分析与研究[A];IT服务促进企业信息化——第十一届中国Java技术及应用交流大会文集[C];2008年
10 孟红;钟华;;基于htmlparser的搜索引擎信息抽取系统设计与实现[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
2 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
3 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
4 刘晓江;基于统计滚雪球模型的知识挖掘理论与方法[D];中国科学技术大学;2011年
5 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
6 刘慧;信息检索中用户需求的概念分析研究[D];上海交通大学;2009年
7 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
8 张乃洲;实体搜索爬虫和信息抽取研究[D];武汉大学;2011年
9 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
10 钱伟中;基于判别式模型的蛋白质互作用文本挖掘技术研究[D];电子科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
2 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年
3 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年
4 杨文柱;基于领域知识和信息抽取的个性化Web查询系统[D];河北大学;2002年
5 张志强;Web信息抽取技术研究与基于Web service的实现[D];河北大学;2004年
6 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
7 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
8 王花;Web信息抽取技术研究[D];西北农林科技大学;2010年
9 杨秀丽;基于网页内容分析的Web信息抽取技术及其应用[D];河北科技大学;2010年
10 廉成洋;基于树结构的Web信息抽取技术研究[D];南京航空航天大学;2010年
中国重要报纸全文数据库 前10条
1 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
2 彭芳;搜索也专业[N];中国计算机报;2004年
3 本报记者 王翌;8848:优化EC流程[N];计算机世界;2004年
4 上海交通大学APEX数据和知识管理实验室 王昊奋俞勇;语义Web推动下一代搜索[N];计算机世界;2007年
5 司静辉;直击数字环境下情报技术发展动向[N];科技日报;2007年
6 董振东;到用户中去[N];中国计算机报;2003年
7 任一鸣;垂直搜索:抓住细分需求[N];计算机世界;2007年
8 张友林 甘肃省武威市凉州区中医院;开发中医专用软件很有必要[N];中国中医药报;2009年
9 马志彦;悄然而至的EIP[N];中国计算机报;2002年
10 本报记者 于翔;BI:电信业渗透中[N];网络世界;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978