收藏本站
《苏州大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于主题的中文事件抽取技术研究及应用

吴刚  
【摘要】: 随着社会的发展,人们被包围在信息的汪洋大海之中。准确有效的从大量无序、杂乱、无结构的信息中提取感兴趣的事件信息,这正是事件抽取要解决的问题。现有的事件抽取的研究还主要局限在句子范围,然而,一个主题事件通常由多个状态和动作组成,其描述信息通常分散在一个或多个文档中,现有的事件抽取方法显然无法满足主题事件抽取的需要。 本文在研究上述问题时,提出了将主题事件的抽取划分为三个层次,并将其应用到访问主题事件的抽取中。第一,句子范围的元事件抽取,主要抽取一些相关的动作和状态。第二,篇章范围内的事件信息抽取,根据主题事件的框架结构,在句子范围的元事件抽取的基础上,通过篇章范围的语义信息将这些元事件进行串联,形成主题事件片段。第三,跨篇章的事件信息归并,首先本文使用聚类的方法确定事件归并的范围;其次按照一定的归并条件,将满足条件的主题事件片段进行归并。通过这三个层次的信息抽取和归并,就可以得到一个主题事件的完整信息描述。 本文首先介绍了事件抽取的基本概念,研究现状和当前面临的主要困难。其次提出了一种定义在论元结构层次的事件抽取模式,并提出了一种机器学习方法来获取事件抽取规则;该方法的特点是将语义角色标注技术应用于事件抽取,通过将触发动词支配的语义角色与待抽取的事件元素相对应,实现了句子范围内面向动词的事件信息的抽取。接着,本文介绍了一种基于元事件的事件知识表示框架,将主题事件看作是元事件的集合;抽取出框架中定义的元事件后,对其中的人物、地点、时间进行规格化处理,再利用指代关系、时间、地点这些重要的语义载体,在篇章范围内进行了初步的信息串联,从而获取了主题事件片段信息。然后,本文提出一种基于摘要的聚类方法将语料集合按照主题进行聚类,以此来确定跨篇章事件信息归并的范围。最后提出了一种简单的归并条件,用于对分散在不同文档的主题片段信息进行归并。 对访问主题事件的抽取实验结果表明,本文提出的基于元事件的框架定义对事件知识的表达是有效的,指代关系、时间、地点等语义载体的规格化处理,有效的进行了篇章范围内事件信息的串联,排除了干扰信息。在主题事件聚类实验中,本文提出的基于摘要的主题事件聚类方法和相似度计算方法的改进,相比常规的聚类方法,其效果得到了明显提升。
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP391.1

【引证文献】
中国期刊全文数据库 前4条
1 魏勇;李响;王丰;;运用文本处理框架抽取中文事件[J];测绘科学;2016年04期
2 孟令恩;何彦青;李颖;;中文语义角色标注在情报分析领域的应用研究[J];情报工程;2016年01期
3 高强;游宏梁;;事件抽取技术研究综述[J];情报理论与实践;2013年04期
4 许旭阳;韩永峰;宋文政;;事件抽取技术的回顾与展望[J];信息工程大学学报;2011年01期
中国博士学位论文全文数据库 前3条
1 李风环;主题事件挖掘及动态演化分析研究[D];哈尔滨工业大学;2016年
2 胡德鹏;基于农业本体问句分析的问答系统研究与架构设计[D];中国农业科学院;2013年
3 雷兵;基于网站客户访问行为的客车产品需求获取方法研究[D];武汉理工大学;2013年
中国硕士学位论文全文数据库 前10条
1 王蓉;汉语文本事件链自动生成系统[D];山西大学;2015年
2 高源;中文事件抽取关键技术研究[D];解放军信息工程大学;2015年
3 孟环建;突发事件领域事件抽取技术的研究[D];上海大学;2015年
4 吴奇;基于领域本体的Web实体事件抽取问题研究[D];山东大学;2014年
5 潘清清;越南语新闻事件元素抽取方法研究[D];昆明理工大学;2014年
6 张祖传;基于时态信息的搜索引擎的研究与实现[D];广东工业大学;2013年
7 韩永峰;网络新闻突发事件信息抽取技术研究[D];解放军信息工程大学;2012年
8 许旭阳;网络新闻多文档自动摘要技术研究[D];解放军信息工程大学;2011年
9 陈慧炜;刑事案件文本信息抽取研究[D];南京师范大学;2011年
10 钟鸿鹏;基于时态信息的网页排序系统的研究与实现[D];华南理工大学;2010年
【参考文献】
中国期刊全文数据库 前10条
1 张启宇;朱玲;张雅萍;;中文分词算法研究综述[J];情报探索;2008年11期
2 于江德;樊孝忠;庞文博;;事件信息抽取中语义角色标注研究[J];计算机科学;2008年03期
3 周文;刘宗田;孔庆苹;;基于事件的知识处理研究综述[J];计算机科学;2008年02期
4 赵妍妍;秦兵;车万翔;刘挺;;中文事件抽取技术研究[J];中文信息学报;2008年01期
5 张晓艳;王挺;陈火旺;;基于多向量和实体模糊匹配的话题关联识别[J];中文信息学报;2008年01期
6 洪宇;张宇;刘挺;李生;;话题检测与跟踪的评测及研究综述[J];中文信息学报;2007年06期
7 于江德;肖新峰;樊孝忠;;基于隐马尔可夫模型的中文文本事件信息抽取[J];微电子学与计算机;2007年10期
8 刘迁;焦慧;贾惠波;;信息抽取技术的发展现状及构建方法的研究[J];计算机应用研究;2007年07期
9 雷震;吴玲达;刘宇弛;李卓;;基于事件的新闻报道分析技术研究进展[J];计算机应用研究;2007年05期
10 梁晗;陈群秀;吴平博;;基于事件框架的信息抽取系统[J];中文信息学报;2006年02期
中国博士学位论文全文数据库 前1条
1 姜吉发;自由文本的信息抽取模式获取的研究[D];中国科学院研究生院(计算技术研究所);2004年
【同被引文献】
中国期刊全文数据库 前10条
1 李景玉;张仰森;蒋玉茹;;基于多特征融合的中文微博评价对象抽取方法[J];计算机应用研究;2016年02期
2 张帆;乐小虬;;领域科技文献创新点句中主题属性实例识别方法研究[J];现代图书情报技术;2015年05期
3 曾建勋;魏来;;大数据时代的情报学变革[J];情报学报;2015年01期
4 孟令恩;李颖;何彦青;屈鹏;王惠临;;基于语义角色标注的专利主题提取研究[J];图书情报工作;2014年19期
5 文必龙;李云静;王琪超;金宗泽;高快;;基于GATE的油田信息抽取技术研究[J];计算机与数字工程;2014年07期
6 孙荣;周文;刘宗田;;用规则抽取句子中事件信息[J];小型微型计算机系统;2011年11期
7 安晓亚;李颖;孙群;严薇;;面向空间数据主动更新的地理事件模型研究[J];北京大学学报(自然科学版);2011年03期
8 刘宁锋;史晓东;;中文问答系统中答案抽取的研究[J];电脑知识与技术;2011年12期
9 丁效;宋凡;秦兵;刘挺;;音乐领域典型事件抽取方法研究[J];中文信息学报;2011年02期
10 李世奇;赵铁军;李晗静;刘鹏远;刘水;;基于特征组合的中文语义角色标注[J];软件学报;2011年02期
中国博士学位论文全文数据库 前10条
1 郭静;社交网络影响力传播的分析与挖掘研究[D];北京邮电大学;2014年
2 陈宇;基于深度置信网络的中文信息抽取方法[D];哈尔滨工业大学;2014年
3 白雪;气象领域事件挖掘相关问题的研究[D];复旦大学;2013年
4 姚远;海量动态数据流分类方法研究[D];大连理工大学;2013年
5 赵旭剑;中文新闻话题动态演化及其关键技术研究[D];中国科学技术大学;2012年
6 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
7 李世奇;面向文景转换的中文浅层语义分析方法研究[D];哈尔滨工业大学;2011年
8 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
9 张志宏;电子商务模式下的顾客行为特征提取及利润挖掘[D];天津大学;2010年
10 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
中国硕士学位论文全文数据库 前10条
1 徐霞;半监督中文事件抽取方法的研究[D];苏州大学;2014年
2 李婷玉;基于语义的文本事件信息抽取方法的研究与实现[D];上海交通大学;2012年
3 陈鸿;Web网页的时态文本索引研究[D];中国科学技术大学;2011年
4 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
5 严桂夺;基于主题聚类的网页目录结构构建方法研究[D];华南理工大学;2010年
6 周杰;网络舆情话题情感倾向性分析技术研究[D];解放军信息工程大学;2010年
7 孙中友;基于主题的事件融合技术的研究与实现[D];苏州大学;2010年
8 李阜;基于滑窗取词的单文档自动摘要技术研究[D];国防科学技术大学;2010年
9 何翔;新闻传播框架理论研究[D];新疆大学;2009年
10 宋凡;音乐领域典型事件抽取技术的研究[D];哈尔滨工业大学;2009年
【二级引证文献】
中国期刊全文数据库 前8条
1 赵文娟;刘忠宝;;基于汉语框架的网络事件抽取及相关算法研究[J];情报理论与实践;2016年10期
2 魏勇;李响;王丰;;运用文本处理框架抽取中文事件[J];测绘科学;2016年04期
3 杨建林;王文龙;;公共卫生类突发事件的抽取研究[J];情报理论与实践;2016年04期
4 吉久明;陈锦辉;李楠;孙济庆;;中文事件抽取研究文献之算法效果分析[J];现代情报;2015年12期
5 夏威;黄廷磊;刘久云;华绿绿;;基于马尔可夫模型的新闻事件抽取方法[J];桂林电子科技大学学报;2015年04期
6 仇培元;张恒才;陆锋;;互联网文本蕴含道路交通信息抽取的模式匹配方法[J];地球信息科学学报;2015年04期
7 陈天莹;苏智慧;;基于语义推理的文本信息关联关系分析技术[J];电讯技术;2014年01期
8 王政霄;黄征;;一种中文微博观点抽取技术[J];信息安全与通信保密;2013年01期
中国博士学位论文全文数据库 前2条
1 韩冬;基于知识管理的高校学生工作能力形成机理及提升对策研究[D];吉林大学;2014年
2 尹国伟;基于Android的农技推广数据可靠采集系统研究[D];中国农业科学院;2014年
中国硕士学位论文全文数据库 前5条
1 朱丽娟;基于后缀树聚类算法的越南语新闻话题识别方法研究[D];昆明理工大学;2016年
2 李云静;基于石油领域本体的Web信息抽取技术研究[D];东北石油大学;2015年
3 龙文旭;汉越双语新闻话题分析方法研究[D];昆明理工大学;2015年
4 李嘉锐;本体知识库构建研究[D];中国农业科学院;2015年
5 李艳;基于本体的毒品案件信息抽取研究[D];西北大学;2013年
【相似文献】
中国期刊全文数据库 前10条
1 高强;游宏梁;;事件抽取技术研究综述[J];情报理论与实践;2013年04期
2 黄勋;游宏梁;于洋;;关系抽取技术研究综述[J];现代图书情报技术;2013年11期
3 梁颖红;;紧凑结构多词表达抽取技术综述[J];苏州市职业大学学报;2013年03期
4 王政霄;黄征;;一种中文微博观点抽取技术[J];信息安全与通信保密;2013年01期
5 陈永秋,唐文明,王亚萍,葛江华,隋秀凛;一种改进的二值图像抽取技术的原理及实现[J];信息技术;2000年07期
6 王怡;周明全;耿国华;;虚拟内窥镜中心路径抽取技术[J];西北大学学报(自然科学版);2005年06期
7 刘鹏博;车海燕;陈伟;;知识抽取技术综述[J];计算机应用研究;2010年09期
8 黄葆华;一种基于内插和抽取技术的样点序列延迟器[J];军事通信技术;1998年03期
9 程娟;;基于机器学习的网页文本抽取技术[J];图书馆学研究;2008年05期
10 赵妍妍;秦兵;车万翔;刘挺;;中文事件抽取技术研究[J];中文信息学报;2008年01期
中国重要会议论文全文数据库 前4条
1 赵妍妍;秦兵;车万翔;刘挺;;中文事件抽取技术研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 王倩;何婷婷;闻彬;宋乐;张茂元;;基于依存关系的中文情感要素抽取技术研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 杨洁;季铎;蔡东风;代翠;;基于TextRank的多文档关键词抽取技术[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
4 陆忠良;苏厚勤;;基于Oracle/Linux环境数据抽取技术的研究与实践[A];第四届中国软件工程大会论文集[C];2007年
中国硕士学位论文全文数据库 前10条
1 刘培谦;面向海量数据的用户观点抽取技术实现与应用[D];中山大学;2015年
2 刘璟;面向问答的社区型知识抽取技术研究[D];哈尔滨工业大学;2009年
3 吴刚;基于主题的中文事件抽取技术研究及应用[D];苏州大学;2009年
4 周佳颖;面向普适计算的正文抽取技术的研究与设计[D];湘潭大学;2009年
5 刘兆庆;博客社区发现及其主题抽取技术的研究[D];苏州大学;2013年
6 徐卉鸣;基于ZMET方法的虚拟礼物用户情感体验研究[D];江南大学;2012年
7 潘高源;Deep Web查询结果抽取技术的研究[D];吉林大学;2011年
8 宋凡;音乐领域典型事件抽取技术的研究[D];哈尔滨工业大学;2009年
9 杨洁;多文档关键词抽取技术的研究[D];沈阳航空工业学院;2009年
10 杨柳;Deep Web查询接口识别与抽取技术研究[D];西安电子科技大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026