收藏本站
《上海大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

面向事件的文本表示研究

单建芳  
【摘要】:事件作为人类知识的基本单元,较之静态概念可以表达出更高层的语义信息,近年来受到越来越多研究者的关注。文本是信息的载体,对文本资料的理解与应用,是知识得以传播的重要手段。大量的文本,如小说、戏剧、人物传记、新闻报道等都包含有大量事件。按照语言学家的观点,从语义理解的角度,文本不仅仅是属性、概念的集合,在更高的粒度上是对一个个事件的描述,可以把文本语义看作一组相关的事件及其之间关系的集合。面向事件的文本表示,符合人们的阅读和记忆规律,可以体现更高层次的语义信息,为基于语义的知识处理提供了新的方法与技术。 近年来,在文本应用领域趋向于更丰富的表示方法,而不仅仅基于关键词和概念。本文围绕事件,针对当前文本表示方法的不足,提出一种面向事件的文本表示方法——事件网络,它是一种文本表示的新模型,保留了文本的语义信息、体现了事件与事件之间的关系,反映出事件的重要度和事件发生的动态行为等重要信息。研究该模型的性质,并建立起高度抽象层次的运算,为基于语义的文本信息处理提供支持。事件网络上的运算将支持大量的关于文本的处理应用,是语义计算的很好的形式。本文的研究内容和创新点主要包括: (1)事件相似度计算。基于给定的事件模型,定义事件间的相似度。事件要素的相似度作为衡量事件相似度的指标,把对事件的相似度计算转化为事件要素的相似度计算,根据事件各要素的特征,结合语法、语义、词语序列、时间关系计算事件的相似度。 (2)事件网络模型及其性质研究。定义事件网络的结构和表示,阐述事件网络系统。以事件作为文本的特征项,事件间的关系看作事件间的边,构建文本的事件网络。实验表明,文本的事件网络具有小世界性质,基于这一发现,对网络中的事件节点按照它们对网络拓扑结构小世界特性的重要度排序,提取文本的重要事件,这些被提取的事件是对原文很好的概括。 (3)事件网络匹配。无论采用何种文本表示方法,都必须有一个好的文本对比方法。当前有关图的匹配主要来源于图论和信息检索,但是普通图和概念图在结构和语义上都与事件网络存在很大区别,现有的匹配方法均不能很好的适用于事件网络匹配,因此,有必要研究新的事件网络匹配方法。本文提出一种新的事件网络匹配方法:基于相似度极大值优先的事件匹配、基于关系距离同位矩阵的关系匹配、最后整合事件和关系上的匹配完成事件网络的匹配。
【学位授予单位】:上海大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:TP391.1

【参考文献】
中国期刊全文数据库 前10条
1 仲兆满;刘宗田;周文;付剑锋;;基于事件的文本相似度计算[J];广西师范大学学报(自然科学版);2009年01期
2 吕奕;;新闻报道:体裁模式及其文体分析——以大学英语教材中一则新闻报道为例[J];和田师范专科学校学报;2011年04期
3 贾自艳 ,何清 ,张海俊 ,李嘉佑 ,史忠植;一种基于动态进化模型的事件探测和追踪算法[J];计算机研究与发展;2004年07期
4 于满泉;骆卫华;许洪波;白硕;;话题识别与跟踪中的层次化话题识别技术研究[J];计算机研究与发展;2006年03期
5 秦兵;刘挺;陈尚林;李生;;多文档文摘中句子优化选择方法研究[J];计算机研究与发展;2006年06期
6 潘云鹤,耿卫东,何志均;面向智能计算的记忆结构理论综述[J];计算机研究与发展;1994年12期
7 刘宗田;黄美丽;周文;仲兆满;付剑锋;单建芳;智慧来;;面向事件的本体研究[J];计算机科学;2009年11期
8 李彬,刘挺,秦兵,李生;基于语义依存的汉语句子相似度计算[J];计算机应用研究;2003年12期
9 吴平博,陈群秀,马亮;基于事件框架的事件相关文档的智能检索研究[J];中文信息学报;2003年06期
10 郑家恒,王兴义,李飞;信息抽取模式自动生成方法的研究[J];中文信息学报;2004年01期
中国博士学位论文全文数据库 前7条
1 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
2 刘岩;关于图的最大匹配问题的若干结果[D];郑州大学;2000年
3 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
4 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
5 朱海平;基于概念图匹配的语义搜索[D];上海交通大学;2006年
6 周文;基于概念的若干知识表示模型及相关方法研究[D];上海大学;2007年
7 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
中国硕士学位论文全文数据库 前1条
1 蔡颂梅;语义增强的关系相似度度量算法研究[D];华东师范大学;2011年
【共引文献】
中国期刊全文数据库 前10条
1 徐文婷;李承鹏;;基于自适应遗传算法的离散化方法[J];合肥师范学院学报;2011年03期
2 蔡莉;胡学钢;;一种基于粗集的决策表求核算法[J];安徽大学学报(自然科学版);2007年06期
3 周玉华;李景杰;;不完备决策表的一种属性约简方法[J];安徽大学学报(自然科学版);2009年04期
4 杨萍,万上海,陈耿;一种基于可变支持度的缺省规则挖掘算法[J];安徽工程科技学院学报(自然科学版);2004年02期
5 孙全玲;基于粗集和神经网络的建模方法研究[J];安徽建筑工业学院学报(自然科学版);2005年02期
6 孙虹;方敏;;基于Rough集和RBF网络的车牌字符识别方法[J];安徽建筑工业学院学报(自然科学版);2006年04期
7 孙虹;;粗糙集神经网络系统在车牌字符识别中的研究[J];安徽建筑工业学院学报(自然科学版);2007年04期
8 邓胜;戴小鹏;陈垦;黄璜;;粗糙集理论在农业生物灾害预测中的应用[J];安徽农业科学;2010年06期
9 刁占峰;张丹;张同军;;基于粗集-模糊综合评价法的水质指标约简研究[J];安徽农业科学;2010年26期
10 夏春艳;宋志超;张伟;;数据挖掘技术在农作物灾害预测中的应用[J];安徽农业科学;2011年08期
中国重要会议论文全文数据库 前10条
1 陈树文;高琼;;网络结构视角下中关村产业集群创新驱动困境与建议[A];创新驱动与首都“十二五”发展——2011首都论坛文集[C];2011年
2 危前进;董荣胜;孟瑜;崔更申;;基于粗糙集的机械装配知识发现方法[A];广西计算机学会25周年纪念会暨2011年学术年会论文集[C];2011年
3 ;Fuzziness in Covering Generalized Rough Sets[A];第二十六届中国控制会议论文集[C];2007年
4 耿志勇;;具有静态非线性互联结构的分布式异构系统的稳定性[A];第二十六届中国控制会议论文集[C];2007年
5 李雄;党生;;基于Rough集理论的战场侦察情报处理[A];第二十六届中国控制会议论文集[C];2007年
6 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
7 李鑫滨;王腊梅;刘仙;;基于动态复杂网络的Van der pol振子同步[A];第二十九届中国控制会议论文集[C];2010年
8 龚锦红;杨辉;衷路生;;稀土萃取分离过程的Rough集案例推理方法[A];第二十九届中国控制会议论文集[C];2010年
9 ;Influence Diagram Based on Rough Set Theory[A];第二十九届中国控制会议论文集[C];2010年
10 ;The Prediction of Soil Moisture Based on Rough Set-Neural Network Model[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
2 姜延吉;多传感器数据融合关键技术研究[D];哈尔滨工程大学;2010年
3 杜文博;面向航空交通系统的复杂网络与网络动力学研究[D];中国科学技术大学;2010年
4 籍艳;几类时滞系统的稳定与同步[D];江南大学;2010年
5 徐旭林;社会群体行为建模及其动力学分析[D];南开大学;2010年
6 张目;高技术企业信用风险影响因素及评价方法研究[D];电子科技大学;2010年
7 苏煜;基于SCF范式的在线P300脑机接口研究[D];浙江大学;2010年
8 杜方;复杂网络系统间相似性识别及其应用[D];浙江大学;2010年
9 张建辉;节点势能导向多下一跳路由协议研究与性能评价[D];解放军信息工程大学;2009年
10 郭戈;数字视频语义信息提取与分析[D];解放军信息工程大学;2010年
中国硕士学位论文全文数据库 前10条
1 苏延森;刺激下拟南芥基因逻辑网络构建与分析[D];山东科技大学;2010年
2 罗义兵;领域文本相似度计算方法研究[D];山东科技大学;2010年
3 李二艳;刺激下拟南芥基因相关网络构建与分析[D];山东科技大学;2010年
4 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
5 周斌;复杂网络的社团结构挖掘及应用研究[D];广西师范学院;2010年
6 张晓冬;基于全矢谱的智能诊断技术研究[D];郑州大学;2010年
7 李昕哲;关系邻域系统的属性约简[D];郑州大学;2010年
8 刘琪;正态云模型模糊推理系统及其应用研究[D];郑州大学;2010年
9 程国斌;基于指示词语义扩展的词义识别方法的研究[D];哈尔滨工程大学;2010年
10 高萌;复杂神经元网络的同步问题研究[D];哈尔滨工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 高军,陈锡先;无监督的动态分词方法[J];北京邮电大学学报;1997年04期
3 白崇远;;《维基百科》的特性及影响[J];辞书研究;2009年02期
4 秦洪武;第三人称代词在深层回指中的应用分析[J];当代语言学;2001年01期
5 康达周;徐宝文;陆建江;李言辉;;支持语义web模糊本体的描述逻辑(英文)[J];Journal of Southeast University(English Edition);2006年03期
6 强宇,刘宗田,林炜,时百胜,李云;模糊概念格在知识发现的应用及一种构造算法[J];电子学报;2005年02期
7 吴江,黄登仕;区间数排序方法研究综述[J];系统工程;2004年08期
8 卢志茂,刘挺,张刚,李生;基于依存分析改进贝叶斯模型的词义消歧[J];高技术通讯;2003年05期
9 秦兵,刘挺,王洋,郑实福,李生;基于常问问题集的中文问答系统研究[J];哈尔滨工业大学学报;2003年10期
10 郭艳华,周昌乐;一种汉语语句依存关系网协动生成方法研究[J];杭州电子工业学院学报;2000年04期
中国重要会议论文全文数据库 前6条
1 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 车万翔;刘挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 王洋;秦兵;郑实福;;句子相似度计算在FAQ中的应用[A];第一届学生计算语言学研讨会论文集[C];2002年
4 赵妍妍;王啸吟;秦兵;车万翔;刘挺;;中文事件抽取中事件类别的自动识别[A];第三届学生计算语言学研讨会论文集[C];2006年
5 杨丽英;李红娟;张永奎;;突发事件新闻语料分类体系研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 钟涛;陈群秀;;基于层式有限状态自动机的灾难事件抽取系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前8条
1 谢志鹏;基于概念格模型的知识发现研究[D];合肥工业大学;2001年
2 干红华;基于事件的因果关系可计算化分析研究[D];浙江大学;2003年
3 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
4 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
5 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
6 姜吉发;自由文本的信息抽取模式获取的研究[D];中国科学院研究生院(计算技术研究所);2004年
7 周子力;基于WordNet的本体构建及其在安全领域应用关键技术研究[D];华东师范大学;2009年
8 谭红叶;中文事件抽取关键技术研究[D];哈尔滨工业大学;2008年
中国硕士学位论文全文数据库 前6条
1 李大东;区间数的排序和它的一些应用[D];西南交通大学;2004年
2 吴平博;基于事件框架的主题相关文档智能检索的初步研究[D];清华大学;2004年
3 王昀;金融领域中汉语时间信息抽取的研究[D];清华大学;2004年
4 冯礼;基于事件框架的突发事件信息抽取[D];上海交通大学;2008年
5 郭丽;基于上下文的词语相似度计算及其应用[D];沈阳航空工业学院;2009年
6 秦鹏;基于WordNet的本体匹配关键技术研究与实现[D];华东师范大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 赵俊杰;;论文抄袭检测中特征选择[J];计算机系统应用;2009年09期
2 曾致远;张莉;;基于向量空间模型的网页文本表示改进算法[J];计算机工程;2006年03期
3 杜友福;程彩凤;赵鸣;;搜索引擎中智能代理技术及启发式搜索策略研究[J];长江大学学报(自然科学版)理工卷;2009年02期
4 杨峰;;文本局部特征的向量表示研究[J];情报理论与实践;2009年04期
5 刘海娟;张佳骥;陈勇;;基于改进权重计算的话题跟踪[J];无线电工程;2008年04期
6 刘海峰;王元元;姚泽清;王倩;;一种基于特征聚类的文本分类模型研究[J];情报学报;2008年02期
7 台德艺;谢飞;胡学钢;;文本分类技术研究[J];合肥学院学报(自然科学版);2007年03期
8 张小艳;宋丽平;;论文本分类中特征选择方法[J];现代情报;2009年03期
9 金春霞;;Web文本挖掘相关技术研究及应用[J];现代计算机(专业版);2009年03期
10 郭少友;;一种基于词上下文向量的文本自动分类方法[J];情报科学;2008年07期
中国重要会议论文全文数据库 前10条
1 周昭涛;卜东波;程学旗;;文本的图表示初探[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 苏伟峰;李绍滋;李堂秋;尤文建;;可分义原向量空间中的跨语种文本过滤模型[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 刘功申;李建华;李生红;;基于类信息的特征选择和加权方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 刘健;张维明;;基于文本概念序列的非线性分析方法初探[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 黄云平;孙乐;李文波;;基于上下文图模型文本表示的文本分类研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 李增扬;李兵;何克清;;本体中复杂网络特性的发现[A];2006全国复杂网络学术会议论文集[C];2006年
7 张虎;郭玉翠;宫尚宝;;移动Ad-hoc网络中基于第三方观察机制的信任管理研究[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
8 王志松;;决策树中数据遗失值填充方法的研究[A];2001年中国智能自动化会议论文集(下册)[C];2001年
9 汤丽华;赵吴静;金菊良;张明;;基于熵的水质综合评价的相似插值模型[A];第八届中国管理科学学术年会论文集[C];2006年
10 王娟;;一种基于粗糙集理论的操作风险判别方法[A];科学发展观与系统工程——中国系统工程学会第十四届学术年会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 上渊;新一代网络技术IPv9走向商用[N];中国高新技术产业导报;2004年
2 王萍;Web文本的知识化管理[N];计算机世界;2006年
3 证券时报记者  韩如冰;基金投资相似度趋高[N];证券时报;2006年
4 聂磊 曹进 罗国安;中药指纹图谱相似度评价方法各有千秋[N];中国医药报;2006年
5 孟祥宁 张亚萌 郭青剑;山寨文化:是一种什么样的文化[N];中国艺术报;2009年
6 商荣;国清;帮你开办“卡通小世界”[N];中国商报;2002年
7 ;帮你开办“卡通小世界”[N];经理日报;2002年
8 本报记者 薛原;篮球“小世界杯”登陆中国[N];人民日报;2005年
9 聂磊;曹进;罗国安;中药指纹图谱相似度评价方法作用各一[N];中国医药报;2005年
10 海潮;俄研究发现妊娠中毒症疑与夫妇HLA基因相似度有关[N];中国医药报;2007年
中国博士学位论文全文数据库 前10条
1 单建芳;面向事件的文本表示研究[D];上海大学;2012年
2 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
3 王素格;基于Web的评论文本情感分类问题研究[D];上海大学;2008年
4 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
5 谭建龙;串匹配算法及其在网络内容分析中的应用[D];中国科学院研究生院(计算技术研究所);2003年
6 顾本柏;客体相似性表征的认知和发展机制研究[D];西南大学;2011年
7 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
8 王乐;短语消息聚类相关技术研究[D];国防科学技术大学;2008年
9 杜方;复杂网络系统间相似性识别及其应用[D];浙江大学;2010年
10 肖宇;聚类分析及其在图像处理中的应用[D];北京交通大学;2012年
中国硕士学位论文全文数据库 前10条
1 彭俊杰;中文短文本表示及分类的研究与实现[D];河南大学;2012年
2 范桂群;论坛用户行为分析及文本表示模型研究[D];北京邮电大学;2012年
3 庞俊;基于确定话题和情感极性的博客文本聚类研究[D];武汉理工大学;2010年
4 张剑;基于概念的文本表示模型的研究[D];清华大学;2006年
5 张桂喜;基于语义的领域相关文本分类研究[D];北京工业大学;2011年
6 吴夙慧;基于引用分析的学术检索系统改进研究[D];南京大学;2012年
7 刘岚;Web News Hunter智能代理[D];中国科学院研究生院(软件研究所);2003年
8 孙爽;基于语义相似度的文本聚类算法的研究[D];南京航空航天大学;2007年
9 刘巧凤;基于图结构的中文文本聚类方法研究[D];大连理工大学;2009年
10 张剑;汉语文本作者识别方法的研究与实现[D];上海交通大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026