收藏本站
《西安电子科技大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

基于主题模型的在线评论分析方法研究

胡云凤  
【摘要】:在线评论是互联网时代电子商务蓬勃发展的产物,是网络购物中一个重要的组成部分。在人们无法看到具体实物时,评论成为了一个重要的参考渠道,影响着人们的购买决策。评论对商家也具有应用价值,顾客对商品的真实反馈可以帮助商家制定今后的商品改进或营销策略。因此,对在线评论进行分析具有实际应用价值,但在线评论的数量巨大,并且句式多变、内容繁杂、兼具主题和情感两方面的内容,逐条浏览全部评论显然不现实,需要提出有效的在线评论分析方法。本文针对冗杂的在线评论文本,探索评论文本分析的相关技术,旨在挖掘在线评论文本中的有用信息,为评论分析提供更为有效的分析方法和工具,主要工作分为三方面。首先为了解决缺乏属性词的隐式评论对建模造成的不良影响,提出一种属性词-评价词关系库挖掘方法;然后利用该关系库将隐式评论的结构补充完整,并进行否定词探测,利用改进的情感主题模型对评论进行分析;但情感主题模型只能分析静态的全局评论,无法得到评论随时间的动态变化,因此,进一步提出动态情感主题模型,对评论的主题情感进行演化分析。具体的研究方法和成果为:(1)挖掘显式属性词和评价词之间的关系。在线评论的书写不受任何语法和句式的约束,使得很多评论句的结构不完整,根据此特点,可以将评论分为显式评论和隐式评论。显式评论句经过预处理被表示为词向量,通过单字过滤和互信息过滤去除其中的噪音评论词向量,利用基于HowNet的语义相似度算法计算词向量间的相似度,经过AP聚类将相似的评论聚成一簇。最后利用信息增益算法得到属性词和评价词之间的关系紧密度,构建出属性词-评价词关系库。(2)利用改进的SSTM模型对在线评论进行情感分析。隐式评论属性词的缺失,否定词对评价词情感极性的影响,这两方面都会使建模的效果下降,所以根据已得到的关系库进行隐式评论句的属性词识别,然后将被否定词修饰的评价词的情感极性反转。经过对在线评论数据的优化处理后,利用融入先验信息的SSTM模型对评论进行建模分析,提高了情感分类精度。(3)对在线评论进行动态演化分析。评论的主题和情感是随着时间不断变化着的,在研究了几种动态主题模型后,融合评论的内部特征情感和外部特征时间,提出动态情感主题模型DSTM,并进行参数估计。将评论集按照时间片划分为不同的子集,每个子集的状态仅依赖于前一时间片子集的状态,运用DSTM模型建模分析评论的主题情感随时间的变化规律。
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:F713.55

【参考文献】
中国期刊全文数据库 前10条
1 熊蜀峰;姬东鸿;;面向产品评论分析的短文本情感主题模型[J];自动化学报;2016年08期
2 李超雄;黄发良;温肖谦;李璇;元昌安;;基于动态主题情感混合模型的微博主题情感演化分析方法[J];计算机应用;2015年10期
3 荀静;刘培玉;杨玉珍;张艳辉;;基于潜在狄利克雷分布模型的多文档情感摘要[J];计算机应用;2014年06期
4 李霄;丁晟春;;垃圾商品评论信息的识别研究[J];现代图书情报技术;2013年01期
5 王振宇;吴泽衡;胡方涛;;基于HowNet和PMI的词语情感极性计算[J];计算机工程;2012年15期
6 徐戈;王厚峰;;自然语言处理中主题模型的发展[J];计算机学报;2011年08期
7 刁宇峰;杨亮;林鸿飞;;基于LDA模型的博客垃圾评论发现[J];中文信息学报;2011年01期
8 刘康;赵军;;基于层叠CRFs模型的句子褒贬度分析研究[J];中文信息学报;2008年01期
9 娄德成;姚天昉;;汉语句子语义极性分析和观点抽取方法的研究[J];计算机应用;2006年11期
10 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期
【共引文献】
中国期刊全文数据库 前10条
1 刘耘;袁华;;基于大数据的需求驱动的职业能力培养研究[J];电子科技大学学报(社科版);2018年02期
2 赫熙煦;陈雷霆;张民;孙青云;;基于动态认知的微博用户行为关系网络构建方法[J];电子科技大学学报;2018年02期
3 龚浩;崔运鹏;钱平;;面向农业图书资源语义挖掘的主题模型应用设计研究[J];图书馆理论与实践;2018年03期
4 陈兴蜀;马晨曦;王文贤;高悦;王海舟;;基于改进的ccLDA多数据源热点话题检测模型[J];工程科学与技术;2018年02期
5 刘若兰;年梅;玛尔哈巴·艾赛提;;基于连词的维吾尔语情感词库扩展研究[J];中文信息学报;2018年03期
6 王凡;夏晨曦;;中文医学摘要主题建模方法评估[J];医学信息学杂志;2018年02期
7 马晓宁;王婷;董松月;;基于PSO-SVM的网络舆情垃圾观点识别[J];计算机与数字工程;2018年02期
8 李昌兵;庞崇鹏;凌永亮;王强;;基于改进特征提取及聚类的网络评论挖掘研究[J];现代情报;2018年02期
9 李继东;王移芝;;基于扩展词典与语义规则的中文微博情感分析[J];计算机与现代化;2018年02期
10 闫晓东;黄涛;;基于情感词典的藏语文本句子情感分类[J];中文信息学报;2018年02期
【二级参考文献】
中国期刊全文数据库 前10条
1 张林;钱冠群;樊卫国;华琨;张莉;;轻型评论的情感分析研究[J];软件学报;2014年12期
2 徐冰;赵铁军;王山雨;郑德权;;基于浅层句法特征的评价对象抽取研究[J];自动化学报;2011年10期
3 赵妍妍;秦兵;刘挺;;基于图的篇章内外特征相融合的评价句极性识别(英文)[J];自动化学报;2010年10期
4 赵妍妍;秦兵;刘挺;;文本情感分析[J];软件学报;2010年08期
5 蒋昌金;彭宏;陈建超;马千里;;基于主题词权重和句子特征的自动文摘[J];华南理工大学学报(自然科学版);2010年07期
6 杨潇;马军;杨同峰;杜言琦;邵海敏;;主题模型LDA的多文档自动文摘[J];智能系统学报;2010年02期
7 何海江;凌云;;由Logistic回归识别Web社区的垃圾评论[J];计算机工程与应用;2009年23期
8 何海江;;一种适应短文本的相关测度及其应用[J];计算机工程;2009年06期
9 曹娟;张勇东;李锦涛;唐胜;;一种基于密度的自适应最优LDA模型选择方法[J];计算机学报;2008年10期
10 石晶;胡明;石鑫;戴国忠;;基于LDA模型的文本分割[J];计算机学报;2008年10期
【相似文献】
中国期刊全文数据库 前3条
1 朱增强;崔振发;窦富新;;在分类改革背景下地勘单位绩效预算的构建与实施[J];商业会计;2014年09期
2 邹瑜;;ASP.NET技术基本分析[J];现代商贸工业;2011年14期
3 梁卓宇;;试论基于物联网技术的智能交通系统[J];科技创业月刊;2014年05期
中国博士学位论文全文数据库 前4条
1 徐猛;N人雪堆博弈模型的第三种策略引入及其影响探究[D];浙江大学;2017年
2 黄毅敏;主辅制造商协同生产系统博弈模型研究[D];天津大学;2016年
3 冯玉磊;黑洞蒸发的一种幺正模型[D];浙江大学;2017年
4 王鹏;基于细观有限元模型的多胞材料中的局部应力计算方法及应用[D];中国科学技术大学;2017年
中国硕士学位论文全文数据库 前10条
1 胡云凤;基于主题模型的在线评论分析方法研究[D];西安电子科技大学;2017年
2 常东亚;基于上下文的主题模型[D];苏州大学;2017年
3 徐步霄;社会阶层对不诚实行为的影响:一个有中介的调节模型[D];华中师范大学;2017年
4 胡小雪;新手咨询师朋辈互助团体督导模型的构建与研究[D];江西师范大学;2017年
5 陈瑶;连续时间复合二项模型的最优分红问题[D];河北工业大学;2015年
6 康凯;基于Skewed-T Realized GARCH模型的沪深300指数波动性研究[D];天津商业大学;2017年
7 覃利华;若干个双险种风险模型破产问题的研究[D];广西大学;2017年
8 刘冬冬;RF LDMOS功率晶体管的特性分析与模型研究[D];电子科技大学;2017年
9 孙福云;一类相依结构的稀疏风险模型的周期分红研究[D];曲阜师范大学;2017年
10 李海霞;支付破产时刻赤字的连续时间复合二项模型的最优分红问题[D];河北工业大学;2015年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026