收藏本站
《哈尔滨工业大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于组块分析的中文短语情感倾向研究

孙慧  
【摘要】:随着Internet的迅速发展,特别是论坛和blog等大量的主观性媒体的出现,打破了信息发布者与接收者之间森严的界限,这使文本正在成为最重要的交互方式之一,其中包含的观点信息越来越引起公司和政府的注意。但是这种改变也使网络上的文本信息数量呈爆炸式增长,文本情感倾向性分析作为自动获取其中观点信息的一种手段,成为自然语言处理的一个热点问题。 文本情感倾向性分析,就是对说话人的态度(或称观点、情感)进行分析,也就是对文本中的主观性信息进行分析。词汇情感倾向性分析作为文本倾向性分析的基础,有着举足轻重的作用。短语作为词汇和句子之间过渡的桥梁,可以增大情感分析粒度,对提高句子乃至篇章情感倾向性分析系统性能有重要意义。 本文针对基于词典的词汇情感倾向性分析方法中对情感词倾向绝对化标注问题,提出了一种获取上下文相关的词汇情感倾向方法。同时针对目前缺少包含上下文相关情感词标注资源的问题,使用最大熵交叉验证和手工校正结合的方法加以构造,并在此基础上构造了上下文相关的特征集合用来预测情感词在上下文中的情感倾向。实验表明,此种方法与基于词典的词语情感倾向性分析方法相比,F值提高了4.9%。 针对二词短语情感倾向分析问题,使用了基于规则的分析方法。在此方法中构造了特征模板,使用互信息对组块情感倾向进行计算。并说明了程度副词和否定副词对于组块情感倾向的影响以及收集方法。针对更加普遍的组块情感倾向分析问题,使用了情感分类方法进行分析,本文以短语包含的词的情感倾向以及短语类型等为特征,分别应用了最大熵模型和支持向量机模型对组块情感倾向进行分类,并将结果与传统的基于累加的方法进行比较,最后支持向量机模型取得最好的效果。 最后,分别使用词汇和短语对句子的情感倾向进行分析,结果表明使用短语增大了情感分析的粒度,对于句子的情感倾向性分析性能有很大提高。本文使用上述方法,将短语情感倾向性分析分为两个层次进行了研究,分别是词汇情感倾向消歧以及短语情感倾向性分析,句子级别情感倾向性分析结果表明,本文中系统对于文本情感倾向性分析有积极作用。
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.1

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 王晓莉;古里拉·阿东别克;;哈萨克语语句情感识别研究初探[J];计算机应用与软件;2011年08期
2 杨经;林世平;;基于SVM的文本词句情感分析[J];计算机应用与软件;2011年09期
3 丁菊玲;勒中坚;;基于观点树的网络舆情危机预警方法[J];计算机应用研究;2011年09期
4 田超;朱青;覃左言;李鹏;;基于评论分析的查询服务推荐排序[J];小型微型计算机系统;2011年09期
5 熊菲;刘云;;有记忆的舆论传播建模与仿真[J];系统仿真学报;2011年07期
6 李军辉;周国栋;朱巧明;钱培德;;中文名词性谓词语义角色标注[J];软件学报;2011年08期
7 谭国平;倪新洋;季敏;马赛赛;;一种基于网络编码的移动自组网实时多播协议[J];微电子学与计算机;2011年08期
8 陈发鸿;;基于核方法的文本极性分类研究[J];海峡科学;2011年08期
9 何凤英;;基于语义理解的中文博文倾向性分析[J];计算机应用;2011年08期
10 马玲;;背景材料在增强新闻深度方面的应用[J];群文天地;2011年11期
中国重要会议论文全文数据库 前10条
1 范模;李达;马巍巍;易丛;白雪平;;南海超大型组块浮托的总体设计与关键技术[A];第十三届中国科协年会第13分会场-海洋工程装备发展论坛论文集[C];2011年
2 吴苏红;王素格;;基于依存关系的旅游景点评论的特征-观点对抽取[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 刘超;刘全刚;郭宁;李挺;;海洋平台建造过程中的牵引滑移研究[A];第十五届中国海洋(岸)工程学术讨论会论文集(下)[C];2011年
4 左胜;;秦皇岛32-6油田井口平台组块吊装工艺[A];2003年度海洋工程学术会议论文集[C];2003年
5 李素建;刘群;;汉语组块的定义和获取[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 刘明爽;胆雯;;渤中34-1N WHPC组块称重结构物设计及有限元分析[A];第十五届中国海洋(岸)工程学术讨论会论文集(下)[C];2011年
7 任登君;李珩;张俐;姚天顺;;基于词对齐的双语组块对齐[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 江荻;;现代藏语的句法组块与形式标记[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 刘世岳;李珩;张俐;姚天顺;;Co-training机器学习方法在中文组块识别中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
10 王茂林;;自然口语中的韵律组块过程[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
中国重要报纸全文数据库 前10条
1 唐楠;新闻应避免情感倾向[N];中国新闻出版报;2005年
2 ;蓝疆号完成海上吊装[N];中国证券报;2003年
3 记者 齐芳;“顿悟”是怎么发生的[N];光明日报;2011年
4 记者 梁利华;北京应用透水树脂组块进行树池铺装[N];中国环境报;2004年
5 阎晶明(文学评论家);看善良如何面对残酷[N];中国图书商报;2006年
6 姜兰剑;会议营销是一场完美伏击[N];医药经济报;2006年
7 本报记者 殷元元;城在青山绿水间 人在鸟语花香中[N];黄山日报;2007年
8 松桃民族中学 石桂仙;略谈艺术创作中的情感逻辑和情感性质[N];经济信息时报;2007年
9 本报记者  陈袆淼;亚洲最大海洋石油工程制造场地一期竣工投产[N];中国工业报;2006年
10 江都市二姜中学 蔡美华;动之以情,晓之以理,导之以行[N];成才导报.教育周刊;2007年
中国博士学位论文全文数据库 前10条
1 祁乐瑛;表象表征:心理旋转的实证探索[D];华东师范大学;2009年
2 王素格;基于Web的评论文本情感分类问题研究[D];上海大学;2008年
3 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年
4 王乃弋;数学算式结构加工的ERP研究[D];西南大学;2008年
5 李实;中文网络客户评论中的产品特征挖掘方法研究[D];哈尔滨工业大学;2009年
6 关守义;内隐学习中的知识习得及其无意识性测量[D];华东师范大学;2012年
7 刘健;基于近似文本分析的意见挖掘[D];上海大学;2007年
8 陈毅东;基于短语的统计机器翻译模型若干关键技术研究[D];厦门大学;2008年
9 赵宝春;中国消费者伦理行为研究[D];华中科技大学;2008年
10 王茂林;普通话自然话语的韵律模式[D];中国社会科学院研究生院;2003年
中国硕士学位论文全文数据库 前10条
1 孙慧;基于组块分析的中文短语情感倾向研究[D];哈尔滨工业大学;2010年
2 宋宏珂;工作记忆个体差异和记忆负荷对组块加工的影响[D];西南大学;2010年
3 魏媛;一种应用于文本信息隐藏的组块分析算法的设计与实现[D];西北大学;2012年
4 张宁;组块构建记忆策略训练提高初中学生英语词汇学习质量的应用研究[D];山东师范大学;2010年
5 吴苏红;基于依存关系的旅游景点评论文本倾向分析[D];山西大学;2011年
6 袁超越;情感组块与机器学习相结合的文本倾向性分析[D];哈尔滨工程大学;2011年
7 家会臣;基于组块3×2交叉验证分类学习算法的统计推断[D];山西大学;2012年
8 刘杰;组块对大学英语听力理解影响的研究[D];东北师范大学;2006年
9 魏洪斌;Spar平台上组块就位过程多浮体结构动力分析[D];哈尔滨工程大学;2012年
10 尹鹏;基于SVM的中文组块间依存关系分析[D];大连理工大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026