收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

学术文本的词汇功能识别

程齐凯  
【摘要】:本文对词汇功能的类别定义进行研究,构建了一个领域无关词汇功能和领域相关词汇功能相结合的学术文本词汇功能框架。本文在词汇功能框架定义的基础上,提出了两种方法以自动识别学术文本的词汇功能。考虑到词汇功能的领域适用性,本文还将借用开放信息抽取的思想,研究了适用于学术文本分析的开放信息抽取方法。具体而言,本论文的主要贡献在以下几个方面:1.对学术文本词汇功能进行定义,探讨了词汇功能显现的机理;基于对词汇功能显现机理的分析,构建了一个领域无关词汇功能和领域相关词汇功能相结合的学术文本词汇功能框架。2.本文提提出了一种基于条件随机场的学术文本功能识别方法,实验表明,该方法具有较好的实验效果。本文还提出了一种基于word2vec的动词词汇角色聚类方法,能够将原本词义不同但在一定上下文环境下表现出同样功能角色的词汇聚类到一起。3.针对学术文本的核心问题与核心方法识别,提出了一种基于机器排序模型的自动抽取方法。提出了一种基于中英对齐文本的快速构建标注数据的方法。4.针对学术文本,提出了一种开放信息抽取方案以及系统实现EXVerb,通过术语识别、句法分析、概念关系网络构造以及关系生成,EXVerb能够较好的从学术文本中识别关系数据,同其它系统相比,该系统能够在保证准确率近似的的前提下大幅提升召回。虽然本文的研究内容对学术文本的词汇功能分析研究有了一定的推进,但仍然存在一些问题,还需要进一步研究:1.如何进一步提高词汇功能自动识别的效果。当前的方法准确率和召回率依旧很低,还有很大的提升空间和必要,需要进一步探索新的方法,提升自动识别的准确率和召回率。2.学术文本词汇功能识别应该如何应用。本文仅仅给出一种应用的尝试,而学术文本词汇功能识别的潜在应用点很多,如何更好的应用这一个技术和思想,将是未来研究的一个方向。3.本文在定义学术文本词汇功能时,没有对词汇之间的关系进行建模,未来还需要进一步从词汇关系角度探索学术文本的深层语义分析。4.本文提出了一种面向学术文本的开放信息抽取方案,但这仅仅是一个简单的尝试,如何提升抽取效果,还需要进一步研究。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张雄;文学文本中的隐喻认识[J];辽宁师范大学学报;2005年04期
2 胡和平;诗性文本结构的特点[J];重庆工商大学学报(社会科学版);2005年03期
3 龚举善,张永禄;理解的文本与阐释的方向——伽达默尔文本观的当代意义[J];郧阳师范高等专科学校学报;2005年01期
4 托尼·本内特;黄驰;强东红;;文本、读者、阅读型构[J];马克思主义美学研究;2006年00期
5 邵子华;;论文学文本的对话性[J];井冈山学院学报;2007年02期
6 刘海;;主体隐喻·文本空间·读者拓展——关于文本诠释与过度诠释的思考[J];乐山师范学院学报;2008年02期
7 王汶成;高岩;;论文学文本的构成特性[J];湖南工业大学学报(社会科学版);2008年05期
8 梅启波;;文本概念的旅行及其核心要素的生成[J];河南师范大学学报(哲学社会科学版);2011年04期
9 陈昕炜;;序跋之文本定位、内容配置与功能类型分析——以《葵园四种》为例[J];毕节学院学报;2012年10期
10 刘智祥;;论文本的形态和要素[J];贵州师范大学学报(社会科学版);1991年04期
11 刘顺利;文本时长论[J];天津师大学报(社会科学版);1998年02期
12 姚天昉;“自然语言多语种文本生成系统”在上海交通大学研制成功[J];中文信息学报;1999年04期
13 宗守云;;论语体的制约因素及原型效应[J];当代修辞学;2013年01期
14 陈立正;;由马王堆帛书《要》篇谈古代文献中“类似文本”的演变[J];甘肃社会科学;2013年04期
15 李荣启;;文学文本的结构阐析[J];美与时代(下);2010年09期
16 樊遵贤;论“文本空白与未定点”对读者鉴赏的意义[J];湖南社会科学;2000年05期
17 蒲晓彬;;试论文本结构完整的美学路径[J];河南师范大学学报(哲学社会科学版);2006年03期
18 童剑平;林伟杰;;英汉文本结构模式差异的跨文化思考[J];黑龙江社会科学;2009年03期
19 周永秀;毕研韬;;文学文本的解读[J];海南师范大学学报(社会科学版);2007年04期
20 曹龙;何彬;;新媒体与传统文学文本[J];长治学院学报;2013年03期
中国重要会议论文全文数据库 前6条
1 杨艳;李巍;玄萍;;数字图书馆中基于Ontology的文本模型[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
2 唐云廷;;基于TSBT(Text Structure Binary Tree)的文本结构的自动分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 海丽且木·艾沙;维尼拉·木沙江;;Web文本分类及其维、哈、柯多文种信息检索中的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
4 刘玲;周经野;罗慧慧;;基于XML的文本规划方法[A];2005年全国理论计算机科学学术年会论文集[C];2005年
5 苏贵洋 ;李建华 ;马颖华;;XML统一文本自动处理描述接口[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
6 揭春雨;刘晓月;冼景炬;卫真道;;从网络获取香港法律双语语料库[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 方莹;面向热点新闻话题的文本处理技术研究[D];北京理工大学;2015年
2 凤丽洲;文本分类关键技术及应用研究[D];吉林大学;2015年
3 李岩;基于深度学习的短文本分析与计算方法研究[D];北京科技大学;2016年
4 程齐凯;学术文本的词汇功能识别[D];武汉大学;2015年
5 刘赫;文本分类中若干问题研究[D];吉林大学;2009年
6 赖彦;新闻话语对话性的文本分析与阐释[D];南京师范大学;2011年
7 钟茂生;基于内容相关度计算的文本结构分析方法研究[D];上海交通大学;2010年
8 廖一星;文本分类及其特征降维研究[D];浙江大学;2012年
9 单建芳;面向事件的文本表示研究[D];上海大学;2012年
10 孙巧榆;复杂背景图像的文本信息提取研究[D];华东师范大学;2012年
中国硕士学位论文全文数据库 前10条
1 江长柱;用户咨询文本的语义相似度计算方法研究[D];江苏科技大学;2015年
2 李欣;基于维度判别的文本情感聚类方法研究[D];山西大学;2015年
3 黄志锋;中职语文教学“反文本”倾向探究[D];宁波大学;2015年
4 李丽娜;基于BIM的建设项目文本信息集成管理研究[D];大连理工大学;2015年
5 葛文镇;面向微博的短文本多分类研究[D];宁波大学;2015年
6 郭苏颖;文本难度对高职高专生阅读理解的影响研究[D];闽南师范大学;2015年
7 袁媛;基于半监督学习的短文本分类研究[D];西北师范大学;2015年
8 刘茜茜;病理镜检文本的结构化处理系统设计与实现[D];东华大学;2016年
9 高士林;图像中的文本定位技术研究[D];解放军信息工程大学;2014年
10 肖诚求;自然场景图像中文本提取技术研究[D];解放军信息工程大学;2015年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978