收藏本站
《北京邮电大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

情感词的倾向性研究

张玉杰  
【摘要】:根据国内外的相关研究现状可知,词语级别的情感倾向性研究比较薄弱。一般是通过语义词典(WordNet、howNet或同义词词林)来直接得出词语的倾向性,再间接应用于句子片段级别或篇章级别的倾向性研究,对于以词语倾向性分析为重点的研究少之又少。 传统的词语倾向性分析有两种方法,一种是基于词频统计来计算词语的倾向性概率。该方法需要大规模语料,如何选取语境信息作为特征向量也很困难,此种方法复杂且较难得到理想的结果。另一种方法就是基于语义词典得到词语的倾向性。该方法简单易行,但是不能从词典中得到词语倾向性程度,即默认词典倾向性程度大小不同的词语对语句或篇章的情感倾向性贡献相同。如此可知,在多情感词的句子片段中,情感的综合判断会出现误差。同时,词典只能提供词语本身的倾向性,而没有结合语境来分析,虽然有的词典给出词语的一些属性,但是这也不能覆盖词语的语境信息。 本文结合自建词典与语料统计的方法,通过计算词语间的相关度和相似度,给出一个带倾向权值的情感词词典。词典既体现了词语的情感倾向性与倾向强度,也是词语综合语境后得出的结果。如此一个带倾向权值的情感词词典,量化了情感词的倾向性,为了句子及篇章等大粒度语素的情感研究提供了一个更精确分析的平台。
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP391.1

【参考文献】
中国期刊全文数据库 前3条
1 王素格;李伟;;面向中日关系论坛的情感分类问题研究[J];计算机工程与应用;2007年32期
2 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期
3 刘永丹,曾海泉,李荣陆,胡运发;基于语义分析的倾向性文本过滤[J];通信学报;2004年07期
中国重要会议论文全文数据库 前2条
1 王根;赵军;;中文褒贬义词语倾向性的分析[A];第三届学生计算语言学研讨会论文集[C];2006年
2 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[A];第三届学生计算语言学研讨会论文集[C];2006年
【共引文献】
中国期刊全文数据库 前10条
1 李荣军;王小捷;周延泉;;PageRank模型在中文情感词极性判别中的应用[J];北京邮电大学学报;2010年05期
2 庞娜;;增量学习算法对文本情感识别模型的改进[J];电脑开发与应用;2011年07期
3 梁坤;古丽拉·阿东别克;;基于SVM的中文新闻评论的情感自动分类研究[J];电脑知识与技术;2009年13期
4 张彬;杨志晓;;基于基准词的文本情感倾向性研究[J];电脑知识与技术;2011年08期
5 李新;;基于语义的文本信息安全过滤平台[J];信息化研究;2009年06期
6 李艺红;蒋秀凤;;中文句子倾向性分析[J];福州大学学报(自然科学版);2010年04期
7 廖祥文;张小琴;;基于句型结构的领域倾向词表构建[J];福州大学学报(自然科学版);2011年04期
8 陈晖;屠爱萍;;程度副词“太”后面的褒义形容词[J];广东教育学院学报;2008年02期
9 李迎凯;徐小良;;一种改进的基于知网的句子相似度计算方法[J];电子科技;2012年07期
10 罗安;王勇;张福浩;刘纪平;;基于角色标注的中文POI名称语义分类方法[J];测绘通报;2012年S1期
中国重要会议论文全文数据库 前10条
1 韦向峰;张全;缪建明;池毓焕;;基于语义块的事件倾向性分析研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 覃张华;王景中;;基于语境框架的倾向性文本过滤算法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
3 边海容;万常选;李国林;杨莉;;Web金融信息情感倾向与上市公司财务危机的关系研究[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
4 朱宏博;张芊;赵海;宋纯贺;;基于贝叶斯网络英文电影对白的潜在语义分析[A];第八届沈阳科学学术年会论文集[C];2011年
5 ;Comparing Chinese reviews based on Fuzzy PROMETHEE: A new approach to sentiment analysis[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
6 王根;赵军;;中文褒贬义词语倾向性的分析[A];第三届学生计算语言学研讨会论文集[C];2006年
7 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[A];第三届学生计算语言学研讨会论文集[C];2006年
8 姚天昉;聂青阳;李建超;李林琳;娄德成;陈珂;付宇;;一个用于汉语汽车评论的意见挖掘系统[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
9 李斌;卢俊之;章成志;陈小荷;;基于聚类引擎的话题褒贬度计算[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 倪茂树;林鸿飞;;基于关联规则和极性分析的商品评论挖掘[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
2 侯锋;中文报业出版的文字质量智能辅助控制技术研究[D];国防科学技术大学;2010年
3 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
4 杨峰;本体映射关键技术研究[D];吉林大学;2011年
5 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
6 徐军;面向金融信息检索的体裁分类与情感分析技术研究[D];哈尔滨工业大学;2011年
7 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年
8 杨卉;Web文本观点挖掘及隐含情感倾向的研究[D];吉林大学;2011年
9 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
10 刘永丹;文档数据库若干关键技术研究[D];复旦大学;2004年
中国硕士学位论文全文数据库 前10条
1 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
2 邢鑫岩;基于序列模型的情感分析研究[D];大连理工大学;2010年
3 杨鼎;基于朴素贝叶斯的中文文本情感倾向分类研究[D];湖南工业大学;2010年
4 邓忠莹;中文文本倾向性分类系统研究[D];昆明理工大学;2009年
5 周杰;网络舆情话题情感倾向性分析技术研究[D];解放军信息工程大学;2010年
6 李海林;网络舆情热点信息发现及其倾向性研究[D];武汉理工大学;2010年
7 汪前秀;基于改进的VSM的不良文本过滤模型研究[D];东北财经大学;2010年
8 罗亚平;面向网络舆情的中文评论文本情感倾向分析研究[D];东北财经大学;2010年
9 戴霖;网络舆情信息挖掘关键技术研究与应用[D];浙江工商大学;2011年
10 吴秀梅;基于潜在语义分析和最大熵的中文情感分析研究[D];北京交通大学;2011年
【二级参考文献】
中国期刊全文数据库 前6条
1 蒋凡,高俊波,张敏,王煦法;BBS中主题发现原型系统的设计与实现[J];计算机工程与应用;2005年31期
2 都云琪,肖诗斌;基于支持向量机的中文文本自动分类研究[J];计算机工程;2002年11期
3 刘昌钰,唐常杰,于中华,杜永萍,郭颖;基于潜在语义分析的BBS文档Bayes鉴别器[J];计算机学报;2004年04期
4 蔺璜,郭姝慧;程度副词的特点范围与分类[J];山西大学学报(哲学社会科学版);2003年02期
5 朱烨行;戴冠中;李晓宇;慕德俊;;一种文本聚类方法及BBS浏览机制研究[J];微电子学与计算机;2006年08期
6 韩庆玲;网上论坛(BBS)的语体特点[J];修辞学习;2003年04期
中国博士学位论文全文数据库 前1条
1 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 张彦,邵志清;具有概念联想功能的特定领域分词词典的自动构建[J];计算机工程;2004年20期
2 岳峰;孙亮;王宽全;王永吉;左旺孟;;利用构建语义词典的查询自动分类方法[J];哈尔滨工业大学学报;2008年07期
3 裘江南;罗志成;王延章;;基于中文语义词典的语义相关度方法比较研究[J];情报理论与实践;2008年05期
4 李静柏;;多信息源图像的融合技术研究[J];黑龙江科技信息;2011年12期
5 王钟斐;;一种改进的PageRank算法[J];计算机与数字工程;2011年06期
6 范伟,宣国荣;VR系统三维建模中细节水平分割的分析[J];计算机工程;1998年01期
7 李振星,徐泽平,唐卫清,唐荣锡;网页多词元快速聚类算法[J];计算机工程;2003年02期
8 孙宏伟,田新广,李学春,张尔扬;一种改进的IDS异常检测模型[J];计算机学报;2003年11期
9 贺晓,刘景宁,李淑霞;基于灰色关联理论的案例推理在故障智能诊断系统中的应用[J];中国机械工程;2004年22期
10 田捷,何余良,陈宏,杨鑫;一种基于相似度聚类方法的指纹识别算法[J];中国科学E辑;2005年02期
中国重要会议论文全文数据库 前10条
1 邱立坤;邵艳秋;;语义词典归类不当现象自动发现[A];第六届全国信息检索学术会议论文集[C];2010年
2 严灿勋;刘慧敏;;从语义关系的复杂性看语义词典建设[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 王惠;俞士汶;詹卫东;;现代汉语语义词典(SKCC)的新进展[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 李娆娆;雷沛霖;黄兰岚;原思通;刘营;;芫花药材高效液相指纹图谱研究[A];中华中医药学会四大怀药与地道药材研究论坛暨中药炮制分会第二届第五次学术会与第三届会员代表大会论文集[C];2007年
5 郭文宏;范学峰;;基于语义词典和本体知识的概念相似度计算[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
6 张虎;郭玉翠;宫尚宝;;移动Ad-hoc网络中基于第三方观察机制的信任管理研究[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
7 王志松;;决策树中数据遗失值填充方法的研究[A];2001年中国智能自动化会议论文集(下册)[C];2001年
8 王惠;;汉英机器翻译中基于大型语义词典的汉语词义消歧[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
9 汤丽华;赵吴静;金菊良;张明;;基于熵的水质综合评价的相似插值模型[A];第八届中国管理科学学术年会论文集[C];2006年
10 王娟;;一种基于粗糙集理论的操作风险判别方法[A];科学发展观与系统工程——中国系统工程学会第十四届学术年会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 证券时报记者  韩如冰;基金投资相似度趋高[N];证券时报;2006年
2 聂磊 曹进 罗国安;中药指纹图谱相似度评价方法各有千秋[N];中国医药报;2006年
3 孟祥宁 张亚萌 郭青剑;山寨文化:是一种什么样的文化[N];中国艺术报;2009年
4 聂磊;曹进;罗国安;中药指纹图谱相似度评价方法作用各一[N];中国医药报;2005年
5 海潮;俄研究发现妊娠中毒症疑与夫妇HLA基因相似度有关[N];中国医药报;2007年
6 栾海;妊娠中毒症可能与夫妇 HLA基因相似度有关[N];医药经济报;2007年
7 沈阳药科大学药学院 孙国祥;中药指纹图谱研究新进展[N];中国中医药报;2007年
8 记者 李学梅;研究证实:父亲“偏爱”与自己相像的孩子[N];新华每日电讯;2009年
9 小新;妊娠中毒症与夫妇HLA基因相似度有关[N];中国医药报;2007年
10 天相投顾 王聃聃;投资同质化 基金繁荣背后的痛[N];证券时报;2007年
中国博士学位论文全文数据库 前10条
1 蒋本蓉;“意思—文本”模式的词库理论与词库建设[D];黑龙江大学;2008年
2 顾本柏;客体相似性表征的认知和发展机制研究[D];西南大学;2011年
3 李赟;基于中文维基百科的语义知识挖掘相关研究[D];北京邮电大学;2009年
4 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
5 李侠;配价理论与语义词典[D];黑龙江大学;2011年
6 杜方;复杂网络系统间相似性识别及其应用[D];浙江大学;2010年
7 肖宇;聚类分析及其在图像处理中的应用[D];北京交通大学;2012年
8 游扬声;一般分布模式下GIS位置数据的不确定性研究[D];武汉大学;2005年
9 孙平;高科技品牌延伸的评价模型与消费者评价实证研究[D];山东大学;2008年
10 刘晓东;面向无线传感器网络数据传输与查询的节能算法与理论研究[D];中国海洋大学;2009年
中国硕士学位论文全文数据库 前10条
1 张玉杰;情感词的倾向性研究[D];北京邮电大学;2011年
2 谷天娇;中文旅游问答系统设计与实现[D];北京邮电大学;2010年
3 毕焕欢;基于WordNet和FrameNet的领域语义词典的构建研究[D];华中师范大学;2011年
4 吴波;改进的编辑距离算法的研究及其在电子政务中的应用[D];电子科技大学;2011年
5 伍星宇;基于相似度的社区发现算法研究[D];华中科技大学;2012年
6 石安磊;基于文本相似度评分的中医案例分析系统研究与实现[D];西北大学;2011年
7 闵江;基于语义网的本体相似度算法研究[D];华东交通大学;2011年
8 裴运亮;基于切词和语义的中文相似度研究与应用[D];电子科技大学;2011年
9 陆文豪;基于关系数据库的专业领域语义词典构建研究[D];复旦大学;2009年
10 乔善磊;中药色谱指纹图谱相似度评价研究[D];第二军医大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026