收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于潜在语义分析和最大熵的中文情感分析研究

吴秀梅  
【摘要】:目前微博、论坛、贴吧等已经成为人们发表意见、表达情感的重要渠道,这些渠道产生的大量情感信息反映了人们对热点事件、话题的褒贬态度。因此,对这些情感信息进行挖掘和分析能够更好地分析热点舆情,了解大众的观点,给政府、企业等提供重要的决策依据。传统的信息检索技术,大多以关键词为基础,无法对这种需求提供很好的支持;而传统的信息抽取和文本分类技术也均未涉及深层次的语义理解,常常不能很好地挖掘和分析情感信息。文本情感分析从情感的角度对带有情感色彩的主观性文本进分析,能更快地从海量信息中发现网络中新的热点话题、突发性事件,把握社会的舆论导向。它是传统话题发现与跟踪研究的拓展和深化,并为文本分类、信息抽取、自动摘要等提供了新的思路和方法,在企业智能分析、政府舆情分析、信息安全和自动文摘等领域具有广阔的应用空间和发展前景。 情感倾向分析研究的涉及面很广,本文着重对其中情感词、句的识别和分类的关键技术进行了深入的研究。本文首先对文本情感倾向分析的国内外现状进行了介绍。其次,本文提出了基于潜在语义分析和最大熵模型的情感词识别及褒贬分析方法,其主要思想是利用潜在语义分析方法,计算情感词与人工选择的褒贬基准词的相似度,并结合多种情感词特征函数建立最大熵情感词识别模型。本文在情感词识别的基础上提出了一种融合多种特征的中文情感句倾向性分类方法。最后,对情感词、句识别模型进行了实验验证,选取第一届中文倾向性分析测评数据(COAE2008)中935篇中文文档测试,情感词褒贬分类得到83.5%的准确率及79.3%的召回率,情感句褒贬分类得到76.8%的准确率及78.3%的召回率。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘云峰,齐欢,代建民;潜在语义分析在中文信息处理中的应用[J];计算机工程与应用;2005年03期
2 刘昌钰,唐常杰,于中华,杜永萍,郭颖;基于潜在语义分析的BBS文档Bayes鉴别器[J];计算机学报;2004年04期
3 张立岩;吕玲;王井阳;;基于最大熵算法的全文检索研究[J];河北科技大学学报;2009年02期
4 梅丰;孙承杰;孙珂;程明波;林磊;;面向网络文本的中文产品命名实体识别[J];郑州大学学报(理学版);2010年01期
5 王怡,盖杰,武港山,王继成;基于潜在语义分析的中文文本层次分类技术[J];计算机应用研究;2004年08期
6 仲其智;姚建民;;低频词的中文词性标注研究[J];计算机应用与软件;2011年03期
7 李莉;张太红;;LSA在中文短文自动判分系统中的应用研究[J];计算机工程与应用;2007年20期
8 董国志;朱玉全;程显毅;;中文人称代词指代消解的研究[J];计算机应用研究;2011年05期
9 顾榕,王小平,曹立明;一种基于潜在语义分析的查询扩展算法[J];计算机工程与应用;2004年18期
10 余传明;黄建秋;郭飞;;从客户评论中识别命名实体——基于最大熵模型的实现[J];现代图书情报技术;2011年05期
11 刘磊;;基于潜在语义分析的JAVA类库检索方法[J];电脑开发与应用;2006年03期
12 李华云;;潜在语义分析的理论研究及应用[J];现代情报;2006年11期
13 王剑锋;麻丽娜;李新叶;乔冬;;基于潜在语义分析和自组织特征映射神经网络的文本聚类研究[J];计算机与现代化;2010年02期
14 熊忠阳;暴自强;李智星;张玉芳;;结合LSA的中文谱聚类算法研究[J];计算机应用研究;2010年03期
15 胡双演;李俊山;李建军;;基于潜在语义分析的视频检索[J];计算机工程;2007年13期
16 鲍光余;朱东海;;基于潜在语义分析的农户个性化推荐系统的研究与设计[J];计算机与现代化;2011年01期
17 贾宁;张全;;基于最大熵模型的中文姓名识别[J];计算机工程;2007年09期
18 闭剑婷;苏一丹;;基于潜在语义分析的跨语言查询扩展方法[J];计算机工程;2009年10期
19 潘炜;沈超;;面向层次分类标签的词性标注系统[J];计算机工程;2009年21期
20 王剑锋;乔冬;麻丽娜;李新叶;;基于潜在语义分析的网页文本分类研究[J];应用能源技术;2009年11期
中国重要会议论文全文数据库 前10条
1 宋晓雷;王素格;李红霞;;基于概率潜在语义分析的词汇情感倾向判别[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 刘昌钰;郭颖;唐常杰;翟静;李海宏;;基于潜在语义分析与Bayes分类的BBS文档鉴别[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
3 龙长江;万鹏;;近红外检测技术在中药研究中的应用[A];中国农业工程学会2011年学术年会论文集[C];2011年
4 任纪生;王作英;赵敏;;基于潜在语义信息的汉语语音识别方法[A];中文信息处理技术研讨会论文集[C];2004年
5 耿焕同;吴祥;毕硕本;;基于潜在语义分析的BBS主题发现算法研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
6 李晓婷;张磊;沈建京;;面向服务的主动式统计预测报表技术[A];2007年中国智能自动化会议论文集[C];2007年
7 湛高峰;李超;;基于语义的违法上网行为旁路阻断系统的设计与实现[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
8 郭燕慧;王枞;钟义信;;语言认知与主题内容识别[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
9 朱宏博;张芊;赵海;宋纯贺;;基于贝叶斯网络英文电影对白的潜在语义分析[A];第八届沈阳科学学术年会论文集[C];2011年
10 赵伟;赵法兴;王东海;韩达奇;;一种基于改进的最大熵模型的汉语词性自动标注的新方法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
中国博士学位论文全文数据库 前10条
1 宣云干;基于潜在语义分析的社会化标注系统标签语义检索研究[D];南京大学;2011年
2 夏天;研究性学习支持系统[D];华东师范大学;2007年
3 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
4 万源;基于语义统计分析的网络舆情挖掘技术研究[D];武汉理工大学;2012年
5 周晖;高分辨率遥感图像的层次化分析方法[D];国防科学技术大学;2010年
6 张军;基于视频的运动人体异常行为分析识别研究[D];西安电子科技大学;2009年
7 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
8 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
9 姚红玉;基于教师专业化发展的虚拟导师系统设计[D];华东师范大学;2006年
10 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
中国硕士学位论文全文数据库 前10条
1 吴秀梅;基于潜在语义分析和最大熵的中文情感分析研究[D];北京交通大学;2011年
2 张剑豪;基于潜在语义分析的军事情报检索系统的研究与实现[D];东北大学;2009年
3 刘森;概率潜在语义分析及其应用[D];浙江大学;2011年
4 郑翠翠;面向领域文本的潜在语义分析研究[D];南京理工大学;2010年
5 蔡云雷;基于潜在语义分析的专利文本分类技术研究[D];沈阳航空航天大学;2011年
6 鲍光余;基于潜在语义分析的农户个性化推荐系统[D];海南大学;2011年
7 张洪;结合概率潜在语义分析的文本谱聚类研究[D];重庆大学;2012年
8 王洋;基于潜在语义分析的智能搜索技术研究[D];哈尔滨工程大学;2010年
9 宋晓雷;基于Web的汽车产品评论观点挖掘方法研究[D];山西大学;2010年
10 刘霞;基于潜在语义分析的单文本自动摘要方法研究[D];南京邮电大学;2011年
中国重要报纸全文数据库 前10条
1 张海桐;用中文把歌剧唱出来[N];人民日报海外版;2011年
2 张伟城;中文热持续升温[N];人民日报海外版;2009年
3 朱珉迕;说中文和“拌洋荤”[N];解放日报;2009年
4 本报驻巴黎记者 姚立;“中文热”在法升温速度令人始料不及[N];光明日报;2010年
5 刘菲;关注特殊的学中文群体[N];人民日报海外版;2011年
6 记者钟哲 通讯员李世举;合编首部“民族版”高校中文教材[N];中国社会科学报;2010年
7 ;“汉语桥”世界大学生中文比赛举行[N];人民日报;2011年
8 晓阳;《选报》落户起点中文网[N];中华新闻报;2009年
9 ;中文在线 “九死一生”的出版经历[N];电脑报;2010年
10 本报记者 原小瑛;欧特克发布中文工厂设计软件[N];中国化工报;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978