收藏本站
《北京交通大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于潜在语义分析和最大熵的中文情感分析研究

吴秀梅  
【摘要】:目前微博、论坛、贴吧等已经成为人们发表意见、表达情感的重要渠道,这些渠道产生的大量情感信息反映了人们对热点事件、话题的褒贬态度。因此,对这些情感信息进行挖掘和分析能够更好地分析热点舆情,了解大众的观点,给政府、企业等提供重要的决策依据。传统的信息检索技术,大多以关键词为基础,无法对这种需求提供很好的支持;而传统的信息抽取和文本分类技术也均未涉及深层次的语义理解,常常不能很好地挖掘和分析情感信息。文本情感分析从情感的角度对带有情感色彩的主观性文本进分析,能更快地从海量信息中发现网络中新的热点话题、突发性事件,把握社会的舆论导向。它是传统话题发现与跟踪研究的拓展和深化,并为文本分类、信息抽取、自动摘要等提供了新的思路和方法,在企业智能分析、政府舆情分析、信息安全和自动文摘等领域具有广阔的应用空间和发展前景。 情感倾向分析研究的涉及面很广,本文着重对其中情感词、句的识别和分类的关键技术进行了深入的研究。本文首先对文本情感倾向分析的国内外现状进行了介绍。其次,本文提出了基于潜在语义分析和最大熵模型的情感词识别及褒贬分析方法,其主要思想是利用潜在语义分析方法,计算情感词与人工选择的褒贬基准词的相似度,并结合多种情感词特征函数建立最大熵情感词识别模型。本文在情感词识别的基础上提出了一种融合多种特征的中文情感句倾向性分类方法。最后,对情感词、句识别模型进行了实验验证,选取第一届中文倾向性分析测评数据(COAE2008)中935篇中文文档测试,情感词褒贬分类得到83.5%的准确率及79.3%的召回率,情感句褒贬分类得到76.8%的准确率及78.3%的召回率。
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP391.1

【参考文献】
中国期刊全文数据库 前10条
1 王维娜;康耀红;伍小芹;;文本分类中特征选择方法研究[J];信息技术;2008年12期
2 娄德成;姚天昉;;汉语句子语义极性分析和观点抽取方法的研究[J];计算机应用;2006年11期
3 周立柱;贺宇凯;王建勇;;情感分析研究综述[J];计算机应用;2008年11期
4 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期
5 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[J];中文信息学报;2007年01期
6 王根;赵军;;基于多重冗余标记CRFs的句子情感分析研究[J];中文信息学报;2007年05期
7 唐慧丰;谭松波;程学旗;;基于监督学习的中文情感分类技术比较研究[J];中文信息学报;2007年06期
8 姚天昉;程希文;徐飞玉;汉思·乌思克尔特;王睿;;文本意见挖掘综述[J];中文信息学报;2008年03期
9 赵妍妍;秦兵;刘挺;;文本情感分析[J];软件学报;2010年08期
10 李晓红;;中文文本分类中的特征词抽取方法[J];计算机工程与设计;2009年17期
中国重要会议论文全文数据库 前1条
1 王根;赵军;;中文褒贬义词语倾向性的分析[A];第三届学生计算语言学研讨会论文集[C];2006年
【共引文献】
中国期刊全文数据库 前10条
1 蔡华利;刘鲁;王理;;突发事件Web新闻多层次自动分类方法[J];北京工业大学学报;2011年06期
2 李荣军;王小捷;周延泉;;PageRank模型在中文情感词极性判别中的应用[J];北京邮电大学学报;2010年05期
3 崔大志;刘影;李媛;;论网络社区评论情感语义的模糊化[J];大连海事大学学报(社会科学版);2010年03期
4 庞娜;;增量学习算法对文本情感识别模型的改进[J];电脑开发与应用;2011年07期
5 梁坤;古丽拉·阿东别克;;基于SVM的中文新闻评论的情感自动分类研究[J];电脑知识与技术;2009年13期
6 张彬;杨志晓;;基于基准词的文本情感倾向性研究[J];电脑知识与技术;2011年08期
7 杨梁彬;文本检索的潜在语义索引法初探[J];大学图书馆学报;2003年06期
8 潘文富;郭友实;;网络舆情监测技术研究综述[J];福建电脑;2011年08期
9 李艺红;蒋秀凤;;中文句子倾向性分析[J];福州大学学报(自然科学版);2010年04期
10 许细清;林世平;;面向中文文本的观点检索技术研究[J];福州大学学报(自然科学版);2010年05期
中国重要会议论文全文数据库 前10条
1 周惠巍;黄德根;高洁;杨元生;;最大生成树算法和Nivre算法相结合的中文依存关系解析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 韦向峰;张全;缪建明;池毓焕;;基于语义块的事件倾向性分析研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 边海容;万常选;李国林;杨莉;;Web金融信息情感倾向与上市公司财务危机的关系研究[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
4 朱宏博;张芊;赵海;宋纯贺;;基于贝叶斯网络英文电影对白的潜在语义分析[A];第八届沈阳科学学术年会论文集[C];2011年
5 黄威;靳亚辉;;面向评论挖掘的产品属性集合构建[A];第六届(2011)中国管理学年会——信息管理分会场论文集[C];2011年
6 ;Comparing Chinese reviews based on Fuzzy PROMETHEE: A new approach to sentiment analysis[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
7 周国民;丘耘;郑彦妍;曾枝连;樊景超;;基于SDD算法的特定网页采集技术[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
8 王根;赵军;;中文褒贬义词语倾向性的分析[A];第三届学生计算语言学研讨会论文集[C];2006年
9 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[A];第三届学生计算语言学研讨会论文集[C];2006年
10 曹菲菲;朱慕华;朱靖波;;基于抽样的两阶段支持向量机训练算法[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
2 何建民;面向网络社区聆听客户声音方法研究[D];合肥工业大学;2010年
3 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
4 侯锋;中文报业出版的文字质量智能辅助控制技术研究[D];国防科学技术大学;2010年
5 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
6 杨峰;本体映射关键技术研究[D];吉林大学;2011年
7 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年
8 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
9 徐军;面向金融信息检索的体裁分类与情感分析技术研究[D];哈尔滨工业大学;2011年
10 杨卉;Web文本观点挖掘及隐含情感倾向的研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
2 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
3 于洪霞;基于SVM的中文垃圾邮件过滤[D];哈尔滨工程大学;2009年
4 吕韶华;面向中文评论文本的情感倾向性研究[D];大连理工大学;2010年
5 邢鑫岩;基于序列模型的情感分析研究[D];大连理工大学;2010年
6 杨鼎;基于朴素贝叶斯的中文文本情感倾向分类研究[D];湖南工业大学;2010年
7 邓忠莹;中文文本倾向性分类系统研究[D];昆明理工大学;2009年
8 周杰;网络舆情话题情感倾向性分析技术研究[D];解放军信息工程大学;2010年
9 李海林;网络舆情热点信息发现及其倾向性研究[D];武汉理工大学;2010年
10 汪前秀;基于改进的VSM的不良文本过滤模型研究[D];东北财经大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 台德艺;谢飞;胡学钢;;基于位置权重的文本分类[J];安徽水利水电职业技术学院学报;2008年01期
2 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
3 胡佳妮,徐蔚然,郭军,邓伟洪;中文文本分类中的特征选择算法研究[J];光通信研究;2005年03期
4 王东;陈笑蓉;;一种改进的高效分词词典机制[J];贵州大学学报(自然科学版);2007年04期
5 伍建军;康耀红;;文本分类中特征降维方式的研究[J];海南大学学报(自然科学版);2007年01期
6 胥桂仙,苏筱蔚,陈淑艳;中文文本挖掘中的无词典分词的算法及其应用[J];吉林工学院学报(自然科学版);2002年01期
7 付德宇;代成琴;;一个面向文本分类的中文特征词自动抽取方法[J];计算机工程与应用;2006年15期
8 翟伟斌;周振柳;蒋卓明;许榕生;;汉语分词词典设计[J];计算机工程与应用;2007年01期
9 刘丽珍,宋瀚涛;文本分类中的特征选取[J];计算机工程;2004年04期
10 秦进,陈笑蓉,汪维家,陆汝占;文本分类中的特征抽取[J];计算机应用;2003年02期
【相似文献】
中国期刊全文数据库 前10条
1 刘云峰,齐欢,代建民;潜在语义分析在中文信息处理中的应用[J];计算机工程与应用;2005年03期
2 刘昌钰,唐常杰,于中华,杜永萍,郭颖;基于潜在语义分析的BBS文档Bayes鉴别器[J];计算机学报;2004年04期
3 张立岩;吕玲;王井阳;;基于最大熵算法的全文检索研究[J];河北科技大学学报;2009年02期
4 梅丰;孙承杰;孙珂;程明波;林磊;;面向网络文本的中文产品命名实体识别[J];郑州大学学报(理学版);2010年01期
5 王怡,盖杰,武港山,王继成;基于潜在语义分析的中文文本层次分类技术[J];计算机应用研究;2004年08期
6 仲其智;姚建民;;低频词的中文词性标注研究[J];计算机应用与软件;2011年03期
7 李莉;张太红;;LSA在中文短文自动判分系统中的应用研究[J];计算机工程与应用;2007年20期
8 董国志;朱玉全;程显毅;;中文人称代词指代消解的研究[J];计算机应用研究;2011年05期
9 顾榕,王小平,曹立明;一种基于潜在语义分析的查询扩展算法[J];计算机工程与应用;2004年18期
10 余传明;黄建秋;郭飞;;从客户评论中识别命名实体——基于最大熵模型的实现[J];现代图书情报技术;2011年05期
中国重要会议论文全文数据库 前10条
1 宋晓雷;王素格;李红霞;;基于概率潜在语义分析的词汇情感倾向判别[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 刘昌钰;郭颖;唐常杰;翟静;李海宏;;基于潜在语义分析与Bayes分类的BBS文档鉴别[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
3 龙长江;万鹏;;近红外检测技术在中药研究中的应用[A];中国农业工程学会2011年学术年会论文集[C];2011年
4 任纪生;王作英;赵敏;;基于潜在语义信息的汉语语音识别方法[A];中文信息处理技术研讨会论文集[C];2004年
5 耿焕同;吴祥;毕硕本;;基于潜在语义分析的BBS主题发现算法研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
6 李晓婷;张磊;沈建京;;面向服务的主动式统计预测报表技术[A];2007年中国智能自动化会议论文集[C];2007年
7 湛高峰;李超;;基于语义的违法上网行为旁路阻断系统的设计与实现[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
8 郭燕慧;王枞;钟义信;;语言认知与主题内容识别[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
9 朱宏博;张芊;赵海;宋纯贺;;基于贝叶斯网络英文电影对白的潜在语义分析[A];第八届沈阳科学学术年会论文集[C];2011年
10 赵伟;赵法兴;王东海;韩达奇;;一种基于改进的最大熵模型的汉语词性自动标注的新方法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
中国重要报纸全文数据库 前10条
1 张海桐;用中文把歌剧唱出来[N];人民日报海外版;2011年
2 张伟城;中文热持续升温[N];人民日报海外版;2009年
3 朱珉迕;说中文和“拌洋荤”[N];解放日报;2009年
4 本报驻巴黎记者 姚立;“中文热”在法升温速度令人始料不及[N];光明日报;2010年
5 刘菲;关注特殊的学中文群体[N];人民日报海外版;2011年
6 记者钟哲 通讯员李世举;合编首部“民族版”高校中文教材[N];中国社会科学报;2010年
7 ;“汉语桥”世界大学生中文比赛举行[N];人民日报;2011年
8 晓阳;《选报》落户起点中文网[N];中华新闻报;2009年
9 ;中文在线 “九死一生”的出版经历[N];电脑报;2010年
10 本报记者 原小瑛;欧特克发布中文工厂设计软件[N];中国化工报;2010年
中国博士学位论文全文数据库 前10条
1 宣云干;基于潜在语义分析的社会化标注系统标签语义检索研究[D];南京大学;2011年
2 夏天;研究性学习支持系统[D];华东师范大学;2007年
3 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
4 万源;基于语义统计分析的网络舆情挖掘技术研究[D];武汉理工大学;2012年
5 周晖;高分辨率遥感图像的层次化分析方法[D];国防科学技术大学;2010年
6 张军;基于视频的运动人体异常行为分析识别研究[D];西安电子科技大学;2009年
7 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
8 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
9 姚红玉;基于教师专业化发展的虚拟导师系统设计[D];华东师范大学;2006年
10 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
中国硕士学位论文全文数据库 前10条
1 吴秀梅;基于潜在语义分析和最大熵的中文情感分析研究[D];北京交通大学;2011年
2 张剑豪;基于潜在语义分析的军事情报检索系统的研究与实现[D];东北大学;2009年
3 刘森;概率潜在语义分析及其应用[D];浙江大学;2011年
4 郑翠翠;面向领域文本的潜在语义分析研究[D];南京理工大学;2010年
5 蔡云雷;基于潜在语义分析的专利文本分类技术研究[D];沈阳航空航天大学;2011年
6 鲍光余;基于潜在语义分析的农户个性化推荐系统[D];海南大学;2011年
7 张洪;结合概率潜在语义分析的文本谱聚类研究[D];重庆大学;2012年
8 王洋;基于潜在语义分析的智能搜索技术研究[D];哈尔滨工程大学;2010年
9 宋晓雷;基于Web的汽车产品评论观点挖掘方法研究[D];山西大学;2010年
10 刘霞;基于潜在语义分析的单文本自动摘要方法研究[D];南京邮电大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026