收藏本站
《华中科技大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

基于情感词典的中文微博情感倾向分析研究

陈晓东  
【摘要】:近年来微博的出现,极大丰富了人们的生活。其简短写作,便捷发布,实时交互的特点深受大众欢迎。越来越多的用户乐于在微博平台上分享信息,交流观点和情感。通过对这些信息展开情感分析,可以实现微博营销、品牌宣传、客户关系管理、舆情监控等。当前微博情感分析研究大多是针对于英文微博的,而中文微博的情感分析研究还处于起步阶段。 情感分析主要是判别微博文本的情感倾向性,即属于正面、负面、中性。根据中文微博的自身特点,在传统文本情感分析的已有基础上,展开对微博的情感倾向分析。首先,对当前已有情感词汇资源加以总结和整理,并运用了扩展的情感倾向点互信息算法(SemanticOrientationPointwiseMutualInformation,SO-PMI)对新浪微博语料进行实验,自动获得领域情感词,构建了一个面向中文微博的情感词典。其次,基于中文微博表达多元化的特点,对微博文本进行了相应预处理,并采用微博消息文本中的情感词作为特征选择方法,对微博消息文本中存在的否定词、程度副词、感叹句、反问句、以及微博表情符号等进行相应分析处理。最后对整条微博消息作加权计算获得其情感倾向性,实现了一个面向中文微博的情感倾向分类系统。 实验数据选用数据堂的新浪微博语料,对来自科技、体育、娱乐三个领域的微博消息进行人工标注后,实验验证了该方法的可行性。实验结果显示:该方法获得的最高准确率为74.2%,平均准确率为70.5%,取得了较好的效果,对中文微博的情感倾向分析进行了初步探索。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 华强;中西文文本压缩的LZWCH算法[J];计算机工程与应用;1999年03期
2 华强;中文文本压缩的 LZSSCH 算法[J];中文信息学报;1998年01期
3 马桂琴;中文搜索引擎研究[J];兰州商学院学报;2001年S2期
4 陈明;网络的安全维护与故障排除[J];微型电脑应用;2001年03期
5 端木艺;网上中文学位论文数据库简评[J];现代情报;2003年01期
6 王永成,许慧敏;OA-1.4 版中文自动摘要系统[J];高技术通讯;1998年01期
7 沈殊璇;Linux平台中文化的实现方案[J];微处理机;2003年01期
8 霍然;普通高校实施中文素质教育探索[J];杭州电子工业学院学报;2004年02期
9 王梦云,曹素青;基于字频向量的中文文本自动分类系统[J];情报学报;2000年06期
10 王知津,孙美丽,蒋伟伟;网上中文社会科学信息资源利用研究——在校与非在校用户对比分析[J];晋图学刊;2003年04期
11 刘其成,肖明,高坚;Java编程中的中文问题及其解决方法[J];计算机系统应用;2003年06期
12 王本中;基于PDA系统的中文语音合成[J];工业技术经济;1998年03期
13 ;ThinkPad315ED着中文套装[J];每周电脑报;1998年11期
14 史廷春;中文文字ASCⅡ码识别与应用系统开发[J];计算机工程;1999年10期
15 华强;在文本压缩中联合使用LZSS和LZW[J];计算机应用与软件;2002年01期
16 贺宏朝,何丕廉,高剑峰,黄昌宁;利用一种衰减的共现模型进行中文信息检索查询扩展(英文)[J];Transactions of Tianjin University;2002年03期
17 杨铭,于振涛,刘希民;“中文科技期刊篇名数据库”系统数据文档结构分析和利用[J];高师理科学刊;1995年04期
18 曹为梅;网页上的中文困扰和解决方案[J];山东电子;1998年03期
19 梁星;科技期刊论文的中英文摘要中常见问题分析[J];合肥工业大学学报(社会科学版);2000年01期
20 梁小枫,焦树英;中文检索刊物存在问题与对策[J];晋图学刊;2000年02期
中国重要会议论文全文数据库 前10条
1 金朝;蒋宗礼;;中文机构名的识别讨论[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年
2 张伟男;张宇;刘挺;;基于中心理论的中文对话省略恢复研究[A];第六届全国信息检索学术会议论文集[C];2010年
3 王中卿;李寿山;朱巧明;李培峰;周国栋;;基于不平衡数据的中文情感分类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 周小甲;李昊旻;吕旭东;段会龙;;中文病历文本中的时间表达分类与识别[A];中国生物医学工程学会成立30周年纪念大会暨2010中国生物医学工程学会学术大会青年优秀论文[C];2010年
5 张小衡;;一个支持人工校对的中文简繁体转换工具[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 吴法洲;苏昊;周明;李春平;;利用英文搜索日志建立中文新词同义词词表[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 王佳;;对中文屋思想实验四个主要版本的考察[A];第三届全国科技哲学暨交叉学科研究生论坛文集[C];2010年
8 周学广;张焕国;;一种柔性中文字符串匹配算法[A];第二十七届中国控制会议论文集[C];2008年
9 计峰;邱锡鹏;黄萱菁;;中文不确定性句子的识别研究[A];第六届全国信息检索学术会议论文集[C];2010年
10 陈劲光;何婷婷;李芳;桂卓民;;基于概率和句法分析的中文句子修剪[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国重要报纸全文数据库 前10条
1 张海桐;用中文把歌剧唱出来[N];人民日报海外版;2011年
2 张伟城;中文热持续升温[N];人民日报海外版;2009年
3 朱珉迕;说中文和“拌洋荤”[N];解放日报;2009年
4 本报驻巴黎记者 姚立;“中文热”在法升温速度令人始料不及[N];光明日报;2010年
5 刘菲;关注特殊的学中文群体[N];人民日报海外版;2011年
6 记者钟哲 通讯员李世举;合编首部“民族版”高校中文教材[N];中国社会科学报;2010年
7 ;“汉语桥”世界大学生中文比赛举行[N];人民日报;2011年
8 晓阳;《选报》落户起点中文网[N];中华新闻报;2009年
9 ;中文在线 “九死一生”的出版经历[N];电脑报;2010年
10 本报记者 原小瑛;欧特克发布中文工厂设计软件[N];中国化工报;2010年
中国博士学位论文全文数据库 前10条
1 李世奇;面向文景转换的中文浅层语义分析方法研究[D];哈尔滨工业大学;2011年
2 于娟;基于文本的领域本体学习方法及其应用研究[D];大连理工大学;2010年
3 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
4 赵世奇;基于统计的复述获取与生成技术研究[D];哈尔滨工业大学;2009年
5 朱麟;中国人说英语的节奏模式及在教学中的运用[D];中央民族大学;2007年
6 陈劲光;基于云模型的中文面向查询多文档自动文摘研究[D];华中师范大学;2011年
7 李旭;基于指纹和语义知识表示的中文文档复制检测方法[D];燕山大学;2010年
8 张志昌;开放域阅读理解关键技术研究[D];哈尔滨工业大学;2010年
9 钱线;快速精确的结构化机器学习方法研究[D];复旦大学;2010年
10 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
中国硕士学位论文全文数据库 前10条
1 陈晓东;基于情感词典的中文微博情感倾向分析研究[D];华中科技大学;2012年
2 余珍芝;中文网络产品评论的情感分析关键技术研究[D];杭州电子科技大学;2011年
3 陈成海;评塞尔的中文屋论证[D];浙江大学;2010年
4 徐德玉;中文文档内容相似度检测方法研究[D];长春工业大学;2010年
5 温艳霞;中文时间规范化方法研究[D];山西大学;2010年
6 刘冬平;面向中文歌词的音乐情感分类研究[D];广东工业大学;2011年
7 李丽娜;中文专家检索关键技术研究[D];昆明理工大学;2011年
8 周琨峰;基于中文维基百科的概念相关词群研究[D];华中师范大学;2012年
9 汤明达;基于近邻传播算法的中文文本聚类的研究[D];广西师范大学;2012年
10 张山山;中文XML压缩技术研究[D];华中科技大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978