收藏本站
《江西财经大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

基于多特征融合的中文情感分类方法研究

张兆年  
【摘要】:近年来,随着网络技术的迅猛发展和传播方式的逐渐完善,网络应用不断丰富,网络购物、网上预订的使用率持续上升。由此,消费者对网购商品作出的评价越来越多,也使得网页评论中包含情感信息的不断增加。一方面,这些信息不仅帮助供应商及时地了解客户对商品的认知感,也为产品或服务的改进提供了支持;另一方面,越来越多的消费者在购买商品时会事先查阅这些评论,而评论中包含的情感信息在很大程度上决定着顾客的购买意向,了解这些情感信息对于供应商和消费者都显得越来越重要。但是,由于网络中所包含的信息量巨大,消费者或供应商要阅读所有的评论,并进行决策将会遇到很大的困难。因此,如何从这些评论中挖掘有用的情感信息,将成为目前一个亟待解决的问题。 情感挖掘可以帮助我们挖掘潜在的观点和情感信息,目前的情感挖掘研究主要从词语、句子和文档、特征级别进行挖掘,将挖掘深入到特征级别可以获得更多评论中关于商品或服务的细节的情感信息。然而,目前关于特征级别的情感挖掘研究还比较少,而且缺少情感挖掘的语料资源的支持。本文主要从领域特征集合的构建以及基于多特征融合的情感分类方面开展研究。 在领域特征的构造方面,本文首先对先前的方法进行了改进,主要通过设计二级特征、构造模式和词汇集合、自动抽取几个步骤从未标注的语料中抽取领域特征和极性词,构成句法规则集合。在情感分类的研究过程中,本文采用了机器学习方法与语义倾向分析方法相融合的技术手段。首先使用HowNet计算情感特征,从文本中抽取情感特征,再将情感特征与机器学习方法中的无内容特征和领域特征进行融合,形成了3个新的特征集合;然后对其中的两个特征进行特征提取,缩减特征规模;继而,获得了2个新的特征集合;最后,将所有特征集合结合支持向量机进行情感分类实验。 本文进行了两组实验,首先对酒店领域的评论进行了抽取领域特征的实验分析,结果显示,所使用的方法在抽取极性词较子特征能够获得更高的正确率;接着,另一组实验通过采集关于多种产品的中文评论,并构造不同特征集合,以无内容特征作为基准进行情感分类实验。实验结果显示,通过加入情感特征、多种类型特征的融合可以提高分类的效果,而进行特征提取能够进一步提高分类效果。
【学位授予单位】:江西财经大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:F713.36

手机知网App
【参考文献】
中国期刊全文数据库 前6条
1 李实;叶强;李一军;Rob Law;;中文网络客户评论的产品特征挖掘方法研究[J];管理科学学报;2009年02期
2 张紫琼;叶强;李一军;;互联网商品评论情感分析研究综述[J];管理科学学报;2010年06期
3 熊德兰;程菊明;田胜利;;基于HowNet的句子褒贬倾向性研究[J];计算机工程与应用;2008年22期
4 李实;叶强;李一军;罗嗣卿;;挖掘中文网络客户评论的产品特征及情感倾向[J];计算机应用研究;2010年08期
5 姚天昉;程希文;徐飞玉;汉思·乌思克尔特;王睿;;文本意见挖掘综述[J];中文信息学报;2008年03期
6 叶强;张紫琼;罗振雄;;面向互联网评论情感分析的中文主观性自动判别方法研究[J];信息系统学报;2007年01期
【共引文献】
中国期刊全文数据库 前10条
1 秦艳琴;朱婧婷;;网络图书评论分析与编辑智慧[J];中国编辑;2011年02期
2 韩耀峰;;产品评论在销售型网站中的价值及实现途径[J];电子商务;2010年02期
3 张昊旻;石博莹;;基于Java实现网络舆情分析系统的研究与实现[J];计算机光盘软件与应用;2012年06期
4 张建欣;;基于半监督学习的在线评论挖掘应用[J];计算机光盘软件与应用;2012年20期
5 杨武;宋静静;唐继强;;中文微博情感分析中主客观句分类方法[J];重庆理工大学学报(自然科学);2013年01期
6 李实;叶强;李一军;Rob Law;;中文网络客户评论的产品特征挖掘方法研究[J];管理科学学报;2009年02期
7 张紫琼;叶强;李一军;;互联网商品评论情感分析研究综述[J];管理科学学报;2010年06期
8 郝媛媛;叶强;李一军;;基于影评数据的在线评论有用性影响因素研究[J];管理科学学报;2010年08期
9 杨善林;罗贺;丁帅;;基于云计算的多源信息服务系统研究综述[J];管理科学学报;2012年05期
10 杨昱昺;吴贤伟;;改进的基于知网词汇语义褒贬倾向性计算[J];计算机工程与应用;2009年21期
中国重要会议论文全文数据库 前7条
1 黄威;靳亚辉;;面向评论挖掘的产品属性集合构建[A];第六届(2011)中国管理学年会——信息管理分会场论文集[C];2011年
2 宋鸿彦;刘军;姚天昉;刘全升;黄高辉;;汉语意见型主观性文本标注语料库的构建[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
3 姚天昉;张霄凯;;一种网络非规范汉语词汇的识别方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
4 张冠元;林健;;一种针对餐馆评论的文本倾向性分析算法[A];第五届全国信息检索学术会议论文集[C];2009年
5 陈奇哲;刘全升;姚天昉;;汉语意见型语句主题与情感关系抽取的研究[A];第五届全国信息检索学术会议论文集[C];2009年
6 杨江;侯敏;王宁;;基于主题情感句的汉语评论文倾向性分析[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 章彦星;张铭;邓志鸿;;基于特征的用户评论自动摘要[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 何建民;面向网络社区聆听客户声音方法研究[D];合肥工业大学;2010年
2 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
3 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
4 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
5 马玉涛;在线客户评论的产品族设计与加工方法研究[D];华中科技大学;2012年
6 黄永文;中文产品评论挖掘关键技术研究[D];重庆大学;2009年
7 李实;中文网络客户评论中的产品特征挖掘方法研究[D];哈尔滨工业大学;2009年
8 褚荣伟;C2C在线反馈机制的特征及角色研究[D];复旦大学;2010年
9 寇广增;基于意见挖掘通用框架的情感极性强度模糊性研究[D];武汉大学;2010年
10 杜伟夫;文本倾向性分析中的情感词典构建技术研究[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
2 杨鼎;基于朴素贝叶斯的中文文本情感倾向分类研究[D];湖南工业大学;2010年
3 王阿婷;基于概念集合的网页内容过滤方法的研究[D];北京交通大学;2010年
4 邓忠莹;中文文本倾向性分类系统研究[D];昆明理工大学;2009年
5 周杰;网络舆情话题情感倾向性分析技术研究[D];解放军信息工程大学;2010年
6 李海林;网络舆情热点信息发现及其倾向性研究[D];武汉理工大学;2010年
7 罗亚平;面向网络舆情的中文评论文本情感倾向分析研究[D];东北财经大学;2010年
8 戴霖;网络舆情信息挖掘关键技术研究与应用[D];浙江工商大学;2011年
9 高振安;网络舆论的情感倾向性评价技术研究[D];北方工业大学;2011年
10 吴秀梅;基于潜在语义分析和最大熵的中文情感分析研究[D];北京交通大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 王永贵;韩顺平;邢金刚;于斌;;基于顾客权益的价值导向型顾客关系管理——理论框架与实证分析[J];管理科学学报;2005年06期
2 李实;叶强;李一军;Rob Law;;中文网络客户评论的产品特征挖掘方法研究[J];管理科学学报;2009年02期
3 周雅倩,郭以昆,黄萱菁,吴立德;基于最大熵方法的中英文基本名词短语识别[J];计算机研究与发展;2003年03期
4 朱艳辉;阳爱民;王平;;基于特征情感色彩的文档流派分类研究[J];计算机工程与应用;2007年04期
5 娄德成;姚天昉;;汉语句子语义极性分析和观点抽取方法的研究[J];计算机应用;2006年11期
6 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期
7 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[J];中文信息学报;2007年01期
8 姚天昉;娄德成;;汉语语句主题语义倾向分析方法的研究[J];中文信息学报;2007年05期
9 唐慧丰;谭松波;程学旗;;基于监督学习的中文情感分类技术比较研究[J];中文信息学报;2007年06期
10 姚天昉;程希文;徐飞玉;汉思·乌思克尔特;王睿;;文本意见挖掘综述[J];中文信息学报;2008年03期
【相似文献】
中国期刊全文数据库 前10条
1 张恒;吴晓娟;董文会;;基于模糊融合的驾驶员眼睛状态识别[J];计算机应用;2007年02期
2 任彪;樊祥;马东辉;;基于多特征融合与粒子滤波的红外弱小目标跟踪方法[J];弹箭与制导学报;2009年05期
3 韩健;彭玉华;刘微;;电视画质测评专家系统[J];计算机工程与应用;2010年24期
4 周斌;林喜荣;贾惠波;宋榕;;多特征融合的手背血管识别算法[J];清华大学学报(自然科学版);2007年02期
5 刘贵喜;范春宇;高恩克;;基于粒子滤波与多特征融合的视频目标跟踪[J];光电子.激光;2007年09期
6 张进;魏敏;卢宇;吴钦章;;基于多特征融合的红外目标关联算法[J];红外与激光工程;2008年03期
7 刘李敦;王星;;基于多特征融合的图像检索技术研究[J];计算机时代;2008年08期
8 胡全;邱兆文;王霓虹;;基于多特征融合的图像语义标注[J];东北林业大学学报;2008年10期
9 黄敏;姜静;;基于多特征自适应阈值检测的关键帧提取[J];郑州轻工业学院学报(自然科学版);2009年06期
10 杜艳明;龙丹;;多特征融合的人脸检测[J];武汉理工大学学报;2010年23期
中国重要会议论文全文数据库 前10条
1 施绍萍;孙兴玉;邱建丁;;基于多特征融合预测蛋白甲基化位点的研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
2 张冬雨;李乃民;王宽全;贾丹兵;刘珊;李艳来;陈倩;;基于决策层多特征融合的脉象分类研究[A];第四次全国中西医结合诊断学术研讨会论文集[C];2010年
3 赵妍妍;秦兵;刘挺;张俐;苏中;;基于多特征融合的句子相似度计算[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 李玉峰;郑德权;赵铁军;;基于SVM和多特征融合的图像分类[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 朱娅妮;杜加友;;基于多特征融合的人脸表情识别[A];浙江省电子学会2009学术年会论文集[C];2009年
6 刘新星;汪增福;;基于连接体搜索和多纹理特征融合的字符提取[A];2005年中国智能自动化会议论文集[C];2005年
7 徐蕊;李国辉;赵福华;来旭;叶泽刚;;一种卫星云图云团多特征分类模型[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
8 邵伟;何婷婷;胡珀;肖华松;;一种面向查询的多文档文摘句选择策略[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 邓金杰;肖诗斌;吕学强;程涛;;基于多特征融合的图像检索研究[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
10 王轶;金立左;潘泓;袁晓辉;;基于人脸和指纹特征融合的多模态识别[A];2009年中国智能自动化会议论文集(第三分册)[C];2009年
中国重要报纸全文数据库 前10条
1 李力;广东云安建国内首个中文信息化城镇[N];经济日报;2004年
2 ;中文信息应用网络应运而生[N];网络世界;2001年
3 詹克山;清除IE地址栏中的中文信息[N];中国计算机报;2002年
4 记者 王兵;中国C网构建中文信息应用系统[N];人民邮电;2001年
5 记者 李琳;中国C网:誓做自主全中文信息网[N];厂长经理日报;2000年
6 罗敏;《中国C网中文信息应用网络系统》近日通过技术成果鉴定[N];中国高新技术产业导报;2001年
7 教育部语信司;第十一届全国民族语言文字信息学术研讨会召开[N];语言文字周报;2007年
8 本报记者  管宏业;新标致307:外观小改 品质大增[N];中国商报;2006年
9 阿祥;没有文化 网站将会怎样?[N];中国信息报;2001年
10 记者李行;海峡两岸共商中文信息技术合作大计[N];新疆日报(汉);2009年
中国博士学位论文全文数据库 前10条
1 李先锋;基于特征优化和多特征融合的杂草识别方法研究[D];江苏大学;2010年
2 田纲;基于多特征融合的Mean shift目标跟踪技术研究[D];武汉大学;2011年
3 郭丽;基于内容的商标图像检索研究[D];南京理工大学;2003年
4 郑建明;基于HMM的多特征融合钻头磨损监测技术的研究[D];西安理工大学;2004年
5 尹宏鹏;基于计算机视觉的运动目标跟踪算法研究[D];重庆大学;2009年
6 王欢;运动目标检测与跟踪技术研究[D];南京理工大学;2009年
7 曾璞;面向语义提取的图像分类关键技术研究[D];国防科学技术大学;2009年
8 陶超;高分辨率遥感影像中的城区与建筑物检测方法研究[D];华中科技大学;2012年
9 商飞;面向大型科学仪器网络实验室的视觉视频关键技术研究与应用[D];吉林大学;2009年
10 刘云鹤;基于注意机制的红外小目标检测与跟踪算法研究[D];哈尔滨工程大学;2009年
中国硕士学位论文全文数据库 前10条
1 张兆年;基于多特征融合的中文情感分类方法研究[D];江西财经大学;2012年
2 REFAS BENABDELLAH;使用跟踪移动对象多特征融合[D];哈尔滨工程大学;2011年
3 曹帅;基于多特征融合的室内机器人视觉环境理解研究[D];沈阳工业大学;2011年
4 陈娟;基于多特征融合的雷达目标识别[D];西安电子科技大学;2010年
5 王芳;多特征融合的博客文章排序和分类算法研究[D];兰州理工大学;2012年
6 张聪;基于多特征融合技术的商标检索系统[D];北京印刷学院;2011年
7 张国宏;基于多特征融合的外观设计专利图像检索算法[D];广东工业大学;2011年
8 贺麒文;基于多特征融合的驾驶员疲劳检测研究[D];中南林业科技大学;2009年
9 崔青;粒子滤波框架下的自适应多特征融合目标跟踪方法研究[D];哈尔滨工业大学;2010年
10 祖永亮;基于多特征融合的中文自动问答系统研究与设计[D];合肥工业大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026