收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

面向事件的文本表示研究

单建芳  
【摘要】:事件作为人类知识的基本单元,较之静态概念可以表达出更高层的语义信息,近年来受到越来越多研究者的关注。文本是信息的载体,对文本资料的理解与应用,是知识得以传播的重要手段。大量的文本,如小说、戏剧、人物传记、新闻报道等都包含有大量事件。按照语言学家的观点,从语义理解的角度,文本不仅仅是属性、概念的集合,在更高的粒度上是对一个个事件的描述,可以把文本语义看作一组相关的事件及其之间关系的集合。面向事件的文本表示,符合人们的阅读和记忆规律,可以体现更高层次的语义信息,为基于语义的知识处理提供了新的方法与技术。 近年来,在文本应用领域趋向于更丰富的表示方法,而不仅仅基于关键词和概念。本文围绕事件,针对当前文本表示方法的不足,提出一种面向事件的文本表示方法——事件网络,它是一种文本表示的新模型,保留了文本的语义信息、体现了事件与事件之间的关系,反映出事件的重要度和事件发生的动态行为等重要信息。研究该模型的性质,并建立起高度抽象层次的运算,为基于语义的文本信息处理提供支持。事件网络上的运算将支持大量的关于文本的处理应用,是语义计算的很好的形式。本文的研究内容和创新点主要包括: (1)事件相似度计算。基于给定的事件模型,定义事件间的相似度。事件要素的相似度作为衡量事件相似度的指标,把对事件的相似度计算转化为事件要素的相似度计算,根据事件各要素的特征,结合语法、语义、词语序列、时间关系计算事件的相似度。 (2)事件网络模型及其性质研究。定义事件网络的结构和表示,阐述事件网络系统。以事件作为文本的特征项,事件间的关系看作事件间的边,构建文本的事件网络。实验表明,文本的事件网络具有小世界性质,基于这一发现,对网络中的事件节点按照它们对网络拓扑结构小世界特性的重要度排序,提取文本的重要事件,这些被提取的事件是对原文很好的概括。 (3)事件网络匹配。无论采用何种文本表示方法,都必须有一个好的文本对比方法。当前有关图的匹配主要来源于图论和信息检索,但是普通图和概念图在结构和语义上都与事件网络存在很大区别,现有的匹配方法均不能很好的适用于事件网络匹配,因此,有必要研究新的事件网络匹配方法。本文提出一种新的事件网络匹配方法:基于相似度极大值优先的事件匹配、基于关系距离同位矩阵的关系匹配、最后整合事件和关系上的匹配完成事件网络的匹配。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵俊杰;;论文抄袭检测中特征选择[J];计算机系统应用;2009年09期
2 曾致远;张莉;;基于向量空间模型的网页文本表示改进算法[J];计算机工程;2006年03期
3 杜友福;程彩凤;赵鸣;;搜索引擎中智能代理技术及启发式搜索策略研究[J];长江大学学报(自然科学版)理工卷;2009年02期
4 杨峰;;文本局部特征的向量表示研究[J];情报理论与实践;2009年04期
5 刘海娟;张佳骥;陈勇;;基于改进权重计算的话题跟踪[J];无线电工程;2008年04期
6 刘海峰;王元元;姚泽清;王倩;;一种基于特征聚类的文本分类模型研究[J];情报学报;2008年02期
7 台德艺;谢飞;胡学钢;;文本分类技术研究[J];合肥学院学报(自然科学版);2007年03期
8 张小艳;宋丽平;;论文本分类中特征选择方法[J];现代情报;2009年03期
9 金春霞;;Web文本挖掘相关技术研究及应用[J];现代计算机(专业版);2009年03期
10 郭少友;;一种基于词上下文向量的文本自动分类方法[J];情报科学;2008年07期
11 倪洁琼;吴耿锋;郑宇;;基于关系权重的文本表示法[J];计算机应用与软件;2009年05期
12 金春霞;;Web文本挖掘相关技术研究及应用[J];微型电脑应用;2009年07期
13 张青;熊前兴;;文本分类中词语权重计算的改进[J];电脑知识与技术;2011年01期
14 熊德兰;柴玉梅;;领域内文本褒贬倾向性分类中的特征提取技术[J];微计算机信息;2006年36期
15 谭金波;;文本层次分类中特征项权重算法的比较研究[J];情报杂志;2007年09期
16 蒲筱哥;;Web自动文本分类技术研究综述[J];情报学报;2009年02期
17 王煜;;机器学习技术在文本分析中的应用[J];华南金融电脑;2007年05期
18 高秀梅;陈芳;宋枫溪;金忠;;特征权对贝叶斯分类器文本分类性能的影响[J];计算机应用;2008年12期
19 李星毅;曾路平;施化吉;;基于单词相似度的文本聚类[J];计算机工程与设计;2009年08期
20 侯亚南;黄映辉;;用于形式背景提取的中文文本表示[J];计算机技术与发展;2010年09期
中国重要会议论文全文数据库 前10条
1 周昭涛;卜东波;程学旗;;文本的图表示初探[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 苏伟峰;李绍滋;李堂秋;尤文建;;可分义原向量空间中的跨语种文本过滤模型[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 刘功申;李建华;李生红;;基于类信息的特征选择和加权方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 刘健;张维明;;基于文本概念序列的非线性分析方法初探[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 黄云平;孙乐;李文波;;基于上下文图模型文本表示的文本分类研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 李增扬;李兵;何克清;;本体中复杂网络特性的发现[A];2006全国复杂网络学术会议论文集[C];2006年
7 张虎;郭玉翠;宫尚宝;;移动Ad-hoc网络中基于第三方观察机制的信任管理研究[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
8 王志松;;决策树中数据遗失值填充方法的研究[A];2001年中国智能自动化会议论文集(下册)[C];2001年
9 汤丽华;赵吴静;金菊良;张明;;基于熵的水质综合评价的相似插值模型[A];第八届中国管理科学学术年会论文集[C];2006年
10 王娟;;一种基于粗糙集理论的操作风险判别方法[A];科学发展观与系统工程——中国系统工程学会第十四届学术年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 单建芳;面向事件的文本表示研究[D];上海大学;2012年
2 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
3 王素格;基于Web的评论文本情感分类问题研究[D];上海大学;2008年
4 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
5 谭建龙;串匹配算法及其在网络内容分析中的应用[D];中国科学院研究生院(计算技术研究所);2003年
6 顾本柏;客体相似性表征的认知和发展机制研究[D];西南大学;2011年
7 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
8 王乐;短语消息聚类相关技术研究[D];国防科学技术大学;2008年
9 杜方;复杂网络系统间相似性识别及其应用[D];浙江大学;2010年
10 肖宇;聚类分析及其在图像处理中的应用[D];北京交通大学;2012年
中国硕士学位论文全文数据库 前10条
1 彭俊杰;中文短文本表示及分类的研究与实现[D];河南大学;2012年
2 范桂群;论坛用户行为分析及文本表示模型研究[D];北京邮电大学;2012年
3 庞俊;基于确定话题和情感极性的博客文本聚类研究[D];武汉理工大学;2010年
4 张剑;基于概念的文本表示模型的研究[D];清华大学;2006年
5 张桂喜;基于语义的领域相关文本分类研究[D];北京工业大学;2011年
6 吴夙慧;基于引用分析的学术检索系统改进研究[D];南京大学;2012年
7 刘岚;Web News Hunter智能代理[D];中国科学院研究生院(软件研究所);2003年
8 孙爽;基于语义相似度的文本聚类算法的研究[D];南京航空航天大学;2007年
9 刘巧凤;基于图结构的中文文本聚类方法研究[D];大连理工大学;2009年
10 张剑;汉语文本作者识别方法的研究与实现[D];上海交通大学;2007年
中国重要报纸全文数据库 前10条
1 上渊;新一代网络技术IPv9走向商用[N];中国高新技术产业导报;2004年
2 王萍;Web文本的知识化管理[N];计算机世界;2006年
3 证券时报记者  韩如冰;基金投资相似度趋高[N];证券时报;2006年
4 聂磊 曹进 罗国安;中药指纹图谱相似度评价方法各有千秋[N];中国医药报;2006年
5 孟祥宁 张亚萌 郭青剑;山寨文化:是一种什么样的文化[N];中国艺术报;2009年
6 商荣;国清;帮你开办“卡通小世界”[N];中国商报;2002年
7 ;帮你开办“卡通小世界”[N];经理日报;2002年
8 本报记者 薛原;篮球“小世界杯”登陆中国[N];人民日报;2005年
9 聂磊;曹进;罗国安;中药指纹图谱相似度评价方法作用各一[N];中国医药报;2005年
10 海潮;俄研究发现妊娠中毒症疑与夫妇HLA基因相似度有关[N];中国医药报;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978