收藏本站
《合肥工业大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于特征强化的中文产品评价挖掘研究

史丽君  
【摘要】:随着电子商务的蓬勃发展和网络购物用户的增加,作为消费者反馈信息的在线产品评论也呈现快速增长之势。实现产品评论的自动挖掘对商家和潜在的消费者有着重要意义。由于产品评论挖掘中的任务大多可被转化为分类问题,因此利用现有的监督学习方法解决产品评论挖掘中的问题逐渐成为一种趋势。然而,由于评论文本篇幅较短、描述信号弱的特点,使得现有监督学习方法在评论挖掘中的应用受到很大的限制。为了解决这个问题,本文以中文产品评论为主要研究对象,采用特征强化的方法,从评论整体的情感分类和细粒度的观点挖掘两个层面进行分析研究。论文的主要工作如下: (1)在评论整体的情感分类方面,针对评论文本特征信息弱的特点,提出一种基于关联特征的情感分类方法。该方法首先利用关联规则挖掘算法挖掘关联共现特征集,然后利用获取的关联共现特征增强评论文本的特征信息。最后结合IG特征选择法和SVM分类算法完成情感分类。实验证明,与基于传统布尔权重的评论情感分类方法相比较,基于关联特征的产品评论情感分类方法的宏平均F1值和微平均F1值都得到了很大的提高。 (2)在细粒度的观点挖掘方面,针对词对信息弱而导致传统的分类器F1值不高的问题,本文提出一种基于多特征多分类器的方法识别主观评价关系。一方面,为了强化词对的上下文特征,该方法除了抽取特征观点词对的上下文词特征与位置特征,还引入了词对上下文的句式特征共同构建词对的特征空间;另一方面,为了减弱词对特征信息弱对分类器精度的影响,该方法使用加权投票机制构建集成分类器来识别词对之间的主观评价关系。实验结果表明,句式特征的引入可以大大提高分类器的召回率;基于加权投票机制的集成分类器模型在均衡子分类器准确率和召回率的同时,也提高了识别器的F1值。 (3)基于上述两种方法,本文构建了一个中文产品评论挖掘原型系统,实现对评论网页或评论文本的挖掘与结果展示。
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP391.1

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前1条
1 付琼芳;基于网上产品评论挖掘系统设计与实现[D];暨南大学;2012年
【参考文献】
中国期刊全文数据库 前9条
1 赵妍妍;秦兵;刘挺;;文本情感分析[J];软件学报;2010年08期
2 张紫琼;叶强;李一军;;互联网商品评论情感分析研究综述[J];管理科学学报;2010年06期
3 伍星;何中市;黄永文;;产品评论挖掘研究综述[J];计算机工程与应用;2008年36期
4 姚天昉;程希文;徐飞玉;汉思·乌思克尔特;王睿;;文本意见挖掘综述[J];中文信息学报;2008年03期
5 章剑锋;张奇;吴立德;黄萱菁;;中文观点挖掘中的主观性关系抽取[J];中文信息学报;2008年02期
6 刘康;赵军;;基于层叠CRFs模型的句子褒贬度分析研究[J];中文信息学报;2008年01期
7 叶强;张紫琼;罗振雄;;面向互联网评论情感分析的中文主观性自动判别方法研究[J];信息系统学报;2007年01期
8 唐慧丰;谭松波;程学旗;;基于监督学习的中文情感分类技术比较研究[J];中文信息学报;2007年06期
9 娄德成;姚天昉;;汉语句子语义极性分析和观点抽取方法的研究[J];计算机应用;2006年11期
中国重要会议论文全文数据库 前1条
1 姚天昉;彭思崴;;汉语主客观文本分类方法的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前1条
1 黄永文;中文产品评论挖掘关键技术研究[D];重庆大学;2009年
中国硕士学位论文全文数据库 前2条
1 严孙荣;中文产品评论的意见挖掘研究[D];北京交通大学;2010年
2 宋晓雷;基于Web的汽车产品评论观点挖掘方法研究[D];山西大学;2010年
【共引文献】
中国期刊全文数据库 前10条
1 李昌兵;庞崇鹏;李美平;;基于权重的Apriori算法在文本统计特征提取方法中的应用[J];数据分析与知识发现;2017年09期
2 王丹丹;祖颖;朱平;;AABC-SVM模型及其在商品评论情感分类中的应用[J];计算机应用与软件;2017年09期
3 彭丽徽;李贺;张艳丰;陈远方;;基于品牌声誉感知差异的在线评论有用性影响因素实证研究[J];情报科学;2017年09期
4 李静;孙豪展;苗永超;;竞争情报在企业品牌定位中的应用[J];竞争情报;2017年04期
5 郭传斌;刘琦岩;赵婧;袁嘉莲;李明倩;望俊成;;情报学视角下的文本可视化应用[J];情报工程;2017年04期
6 段钊;何雅娟;钟原;;企业社会责任信息披露是否客观——基于文本挖掘的我国上市公司实证研究[J];南开管理评论;2017年04期
7 刘丽娜;齐佳音;齐宏伟;蒋思;;在线评论中离散情感的分布研究[J];情报科学;2017年08期
8 霍跃红;邓亚丽;;文学作品中情感翻译效度研究[J];大连理工大学学报(社会科学版);2017年03期
9 曾宇;刘培玉;刘文锋;朱振方;;特征加权融合的朴素贝叶斯情感分类算法[J];西北师范大学学报(自然科学版);2017年04期
10 杜晓黎;钱岭;张海文;杨希;;基于数据融合的互联网舆情分析系统[J];电信工程技术与标准化;2017年07期
中国重要会议论文全文数据库 前1条
1 林慧恩;林世平;;中文情感倾向分析中主观句子抽取方法的研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
中国博士学位论文全文数据库 前3条
1 李芳;面向中文Web评论的观点挖掘关键技术研究[D];华中师范大学;2013年
2 黄炜;电子商务环境下商品信息检索的若干问题研究[D];武汉大学;2010年
3 高旻;基于计算语用学和项目的资源协同过滤推荐研究[D];重庆大学;2010年
中国硕士学位论文全文数据库 前7条
1 刘慧慧;评价要素的缺省识别与恢复方法研究[D];山西大学;2015年
2 李敏;基于情感本体树的多属性汽车评价系统[D];山西大学;2015年
3 耿霄;基于用户评论挖掘的Web导购系统设计与实现[D];西安电子科技大学;2014年
4 薛宾;基于评价搭配的产品情感倾向聚类方法研究[D];山西大学;2013年
5 陈琪;基于意见挖掘的网络课程评价研究[D];山东师范大学;2013年
6 史丽君;基于特征强化的中文产品评价挖掘研究[D];合肥工业大学;2011年
7 邱洁;互联网微内容点评信息的序化及其方法研究[D];华中科技大学;2010年
【同被引文献】
中国硕士学位论文全文数据库 前6条
1 翟娜;面向图书评论的观点分析研究[D];河北大学;2011年
2 史丽君;基于特征强化的中文产品评价挖掘研究[D];合肥工业大学;2011年
3 谢政;基于贝叶斯方法的分类问题研究[D];中南大学;2008年
4 陈扬;人工智能在数据清洗中的应用[D];上海交通大学;2006年
5 唐明;文本挖掘及其在多文化交流平台中的应用[D];西南大学;2006年
6 袁志刚;基于贝叶斯理论的海量科学数据挖掘[D];电子科技大学;2005年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 王亮;基于淘宝开放平台的商品评价分类研究[D];内蒙古科技大学;2014年
【二级参考文献】
中国期刊全文数据库 前10条
1 李实;叶强;李一军;Rob Law;;中文网络客户评论的产品特征挖掘方法研究[J];管理科学学报;2009年02期
2 周立柱;贺宇凯;王建勇;;情感分析研究综述[J];计算机应用;2008年11期
3 姚天昉;程希文;徐飞玉;汉思·乌思克尔特;王睿;;文本意见挖掘综述[J];中文信息学报;2008年03期
4 徐琳宏;林鸿飞;赵晶;;情感语料库的构建和分析[J];中文信息学报;2008年01期
5 叶强;张紫琼;罗振雄;;面向互联网评论情感分析的中文主观性自动判别方法研究[J];信息系统学报;2007年01期
6 姚天昉;娄德成;;汉语语句主题语义倾向分析方法的研究[J];中文信息学报;2007年05期
7 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[J];中文信息学报;2007年01期
8 娄德成;姚天昉;;汉语句子语义极性分析和观点抽取方法的研究[J];计算机应用;2006年11期
9 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期
10 周茜,赵明生,扈旻;中文文本分类中的特征选择研究[J];中文信息学报;2004年03期
中国博士学位论文全文数据库 前1条
1 王素格;基于Web的评论文本情感分类问题研究[D];上海大学;2008年
中国硕士学位论文全文数据库 前1条
1 倪茂树;基于语义理解的观点评论挖掘研究[D];大连理工大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 李宝林,张翼英,兰芸;用关联分析技术识别不良信息特征项的新方法[J];计算机工程与应用;2003年28期
2 杨宝华;辜丽川;李绍稳;;基于敏感度分析的案例特征项权重算法的改进[J];计算机科学;2010年05期
3 王洪伟;郑丽娟;刘仲英;霍佳震;;中文网络评论的情感特征项选择研究[J];信息系统学报;2012年01期
4 刘辉;;基于位置的特征项权重算法[J];中国新技术新产品;2011年14期
5 龚静;周经野;;一种基于多重因子加权的文本特征项权值计算方法[J];计算技术与自动化;2007年01期
6 贝雨馨,崔荣一;文本分类中特征项权重的计算方法[J];延边大学学报(自然科学版);2004年03期
7 董小国;甘立国;;基于句子重要度的特征项权重计算方法[J];计算机与数字工程;2006年08期
8 龚静;胡平霞;李春媚;;一种用于文本分类的特征项权值计算方法的研究[J];惠州学院学报;2013年06期
9 张东生;张缨;;一种带有显著特征项的模糊聚类算法[J];河南大学学报(自然科学版);2011年02期
10 龚静;田小梅;;基于文本表示的特征项权值计算方法[J];电脑开发与应用;2008年02期
中国重要会议论文全文数据库 前5条
1 胡金柱;陈俊平;卢丽君;赵东萌;张琮;王益维;;基于本体视图的特征项抽取方法研究[A];第二十三届中国(天津)2009IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2009年
2 胡金柱;陈俊平;卢丽君;赵东萌;张琮;王益维;;基于本体视图的特征项抽取方法研究[A];第二十二届中国(天津)'2008IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2008年
3 商炳章;白清源;;基于特征项权重改进的关联文本分类[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
4 张爱华;靖红芳;王斌;徐燕;;文本分类中特征权重因子的作用研究[A];第五届全国信息检索学术会议论文集[C];2009年
5 易洪川;;四角号码查字法的字形分析观评析[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
中国博士学位论文全文数据库 前2条
1 贾大文;社会网络资源在线共享与推荐方法研究[D];武汉大学;2013年
2 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
中国硕士学位论文全文数据库 前10条
1 罗成飞;结合卡方统计与特征聚类的文本特征降维方法[D];华南理工大学;2015年
2 刘丽娟;基于LDA特征扩展的微博短文本分类[D];燕山大学;2015年
3 温爱霞;比特流数据未知协议特征发现技术研究[D];电子科技大学;2015年
4 王刘阳;文本分类中特征选择与加权算法的研究[D];杭州电子科技大学;2016年
5 张舒雅;基于SPARK的用户特征分析[D];天津工业大学;2017年
6 王娟;农业知识推送模型及向量特征项提取算法研究[D];湖南农业大学;2011年
7 贝雨馨;基于意义信息增益的文本特征项权重计算方法[D];延边大学;2004年
8 温春林;特征选取和SVM算法研究及在股市行业资讯中的应用[D];安徽大学;2014年
9 曾建雄;Web信息资源评价及分类的研究[D];中南大学;2009年
10 徐凤亚;多层次中文文本分类技术的研究[D];清华大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026