收藏本站
《西藏大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

藏文文本情感分析方法研究

李苗苗  
【摘要】:舆情分析作为自然语言处理研究的重要分支,近年来越来越受关注。随着藏文信息技术的发展,藏语也迈入了自然语言处理时代,而针对藏文文本的情感分析研究也越来越受到重视,但由于藏文文本的情感分析研究起步晚等原因使得在该领域有很多有待完善、需要提升的内容,具有很大的研究空间。本文在分析研究了国内外文本情感分析方法的基础上,结合藏文本身的特点,提出了“基于层次结构的藏文文本情感分析方法”,该方法中将藏文情感分析分为词语级、句子级、篇章级三个层次,并基于现有的资源,针对每一个层次的特点提出了不同的研究方法,并设计系统加以实现、验证。三个层次的主要工作如下:1.藏文词语级情感分析方面,针对情感词典缺乏的问题,首先人工整理包括基础情感词典、程度副词词典、否定和双否定词词典、转折词字典的藏文情感词典,验证了基于词向量扩充情感词典的几种方法,提出了knn扩充的方法最优,并用该方法从语料中自动扩充情感词,建立了一部比较实用的藏文情感词典;2.藏文句子级情感分析方面,归纳和总结了藏文句子的语言特性,抽象和提取出藏文句子情感分析的三层规则集:句型规则、句间规则、句内规则,提出了利用情感词典和规则集分析藏文句子情感的一种方法,并设计实现了藏文句子倾向性分析系统;3.藏文篇章级情感分析方面,针对藏文篇章情感分析语料建设困难的问题,先基于情感词典的方法对原始语料进行初步标注,再人工筛选得到标注语料,然后利用标注语料构建SVM模型,对篇章文本进行情感分析。针对传统的词袋模型维度大,且难以捕捉到情感特征等问题,提出采用混合情感特征的方法训练模型,得到了较好的效果。本文在现有的研究基础上,取得了以下成果:1.提出了藏文文本情感分析的三层框架;2.将词向量的方法用于藏文情感词典的扩充中,并对传统的基于相似度扩充词典的方法进行了改进,提高了准确率,获得了一部比较好的藏文情感词典;3.从藏文的文法特点出发,归纳和总结了适用于藏文的句子情感分析规则集,建立了句型规则、句间规则和句内规则,结合情感词典,设计和实现了藏文句子倾向性分析系统;4.不仅实现了基于情感词典的藏文篇章情感分析方法,而且还比较几种篇章情感计算的统计模型后,验证了基于情感特征组合的SVM方法的优越性。
【学位授予单位】:西藏大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1

【相似文献】
中国期刊全文数据库 前10条
1 程琦;;架起学生与文本沟通的桥梁[J];现代教学;2012年06期
2 周德志;刘怀亮;张倩;;基于复杂网络的文本语义社区的构建[J];情报杂志;2013年10期
3 徐玉坤;刘淑芬;李兵;;建模语言中的文本表面语法分析方法研究[J];计算机应用研究;2008年03期
4 林民;萨日娜;嘎日迪;;多语言复杂文本布局引擎分析及应用[J];内蒙古师范大学学报(自然科学汉文版);2008年01期
5 周扬荣;贾彦民;吴健;;基于ICU的复杂文本布局引擎设计与跨平台应用研究[J];计算机应用研究;2007年02期
6 孙卫华;;论构成媒介文本分析的方法体系[J];当代传播;2009年01期
7 李强;;广播语言和文本语言应重修旧好[J];视听界;2009年02期
8 姚大富;杨斌;;QT图形库下基于OpenType字库的复杂文本显示研究[J];成都信息工程学院学报;2010年06期
9 胡熠;陆汝占;李学宁;段建勇;陈玉泉;;基于语言建模的文本情感分类研究[J];计算机研究与发展;2007年09期
10 周扬荣;贾彦民;;复杂文本布局引擎机制及应用研究[J];中国科学院研究生院学报;2006年03期
中国重要会议论文全文数据库 前4条
1 周忠敏;张荣军;;变了味的文本拓展[A];江苏省教育学会2006年年会论文集(文科专辑)[C];2006年
2 吕建明;;语文教学要正确把握文本的度[A];江苏省教育学会2005年小学语文优秀论文集[C];2005年
3 热依玛依·买买提;维尼拉·木沙江;;基于文本的图片检索中图片相关文本提取技术的研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
4 唐剑峰;;文本语言的鉴赏和积淀摭谈[A];江苏省教育学会2005年小学语文优秀论文集[C];2005年
中国重要报纸全文数据库 前7条
1 丹阳市教师进修学校 笪红梅;巧用文本“空白”发展学生语言[N];成才导报.教育周刊;2008年
2 六盘水市第二中学 邓永方;学生与文本之间障碍原因分析[N];六盘水日报;2011年
3 东海县房山中心小学 张启道;文本解构:基于儿童自身发展的考量[N];连云港日报;2011年
4 北京师范大学 王向远;翻译的快感[N];社会科学报;2013年
5 姜堰市溱潼中心小学 吕富荣;优化语言训练 加深情感体验[N];江苏教育报;2010年
6 宝轮中学 赵开新 李应生;“削枝强干”是实施有效教学的策略[N];广元日报;2009年
7 王一川;现实症候与多样景观[N];文艺报;2003年
中国博士学位论文全文数据库 前1条
1 黄杨英;关联翻译理论与幽默讽刺文本的翻译[D];上海外国语大学;2009年
中国硕士学位论文全文数据库 前10条
1 冯贵川;基于Word2vec的文本建模及分类研究[D];深圳大学;2016年
2 李苗苗;藏文文本情感分析方法研究[D];西藏大学;2017年
3 陆彬;面向论坛回帖的文本倾向性分析研究[D];上海交通大学;2011年
4 白海艳;从《俄日联合声明》中看外交文本的语言特点及其翻译原则[D];内蒙古师范大学;2014年
5 徐易;基于短文本的分类算法研究[D];上海交通大学;2010年
6 马玲玲;旅游宣传文本的翻译策略初探[D];上海外国语大学;2011年
7 刘青;文学文本语言品味教学研究[D];四川师范大学;2014年
8 嵇怡;借助示范性文本促进高中作文教学的策略研究[D];苏州大学;2013年
9 张奕智;引导学生与不同的散文对话[D];苏州大学;2008年
10 魏珊;文史哲类中文摘要英译实践报告[D];上海师范大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026