收藏本站
《重庆大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

产品评论挖掘的观点抽取和分类技术研究

李培  
【摘要】: 随着Internet和电子商务的发展和普及,Web在很大程度上改变了用户反馈观点的途径。用户购买和使用产品之后会在Web上发表对产品的评论,这些评论中包含用户对产品性能或功能等方面肯定或者否定的态度。生产厂商和用户可以通过分析产品评论获得大量有用信息。但是,Web上评论信息是海量的,属于无结构化数据,生产厂商和用户要想从产品评论中获取信息只有通过人工阅读的方式,而这是一个消耗时间且容易产生错误的过程。因此,产品评论挖掘的研究应运而生,其中用户观点抽取和极性分类是关键的技术,具有十分重要的研究价值。 本文针对产品特征词语的抽取和用户观点抽取和极性分类的技术进行了深入研究,主要包括以下几个方面: 首先,介绍了产品评论挖掘的研究背景及意义和国内外研究现状,阐述产品评论挖掘中的关键技术。同时,提出了进行评论数据的预处理的一套方案。 其次,研究分析了基于统计和基于模式抽取和匹配的产品特征词抽取算法,并将二者结合起来分别用于高频和低频特征词的抽取。抽取包含名词的词语序列作为候选特征词,并制定三个规则进行裁剪获得高频特征词。随后,利用模式抽取和匹配的方法寻找低频特征词。实验结果表明,基于统计和基于模式抽取和匹配的产品特征词抽取算法比基于关联规则挖掘频繁项集和使用支持度裁剪的方法取得了更好的效果。抽取出的特征词语划分为通用特征和专属特征,并构建产品特征库。 然后,提出一种基于句子依存关系产生特征和观点关联对的算法。从评论句子中提取出词语的词性和词语间的依存关系,组成依存关系词性对,并通过特定的依存关系词性对来产生特征和观点关联对,以此找出用户观点和产品特征的对应关系。 接着,研究提出了特征和观点关联对的极性强度计算方法,根据计算结果进行用户观点的极性分类。使用基于HowNet等资源的中文极性词典判断特征和观点关联对的极性和计算极性强度,并进一步说明对产品型号、产品特征和评论文本进行极性分类的方法。实验结果表明,基于特征和观点关联对和极性词典的极性分类方法对中文产品评论的用户观点极性分类取得了较好的结果。 最后,对本文的研究工作进行总结,提出了今后进一步的研究方向。
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP391.1

手机知网App
【引证文献】
中国期刊全文数据库 前4条
1 李爱清;何烁;郗亚辉;;产品评论挖掘可视化实验平台的开发[J];河北大学学报(自然科学版);2012年02期
2 黄晓斌;周珍妮;;观点挖掘在竞争对手分析中的应用[J];情报资料工作;2010年05期
3 郗亚辉;张明;袁方;王煜;;产品评论挖掘研究综述[J];山东大学学报(理学版);2011年05期
4 施国良;石桥峰;;基于文本挖掘的不同购物网站商品评论一致性研究[J];现代图书情报技术;2011年12期
中国硕士学位论文全文数据库 前5条
1 张博;基于SVM的中文观点句抽取[D];北京邮电大学;2011年
2 潘文彬;基于情感词词典的中文句子情感倾向分析[D];北京邮电大学;2011年
3 刘燕美;教育资源评论的倾向性研究及应用[D];重庆大学;2011年
4 卫力;基于图的半监督中文句子主客观分类算法研究[D];北京邮电大学;2011年
5 张铎;基于评论分析的商品推荐系统研究[D];重庆大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 邱立坤;龙志祎;钟华;程葳;;层次化话题发现与跟踪方法及系统实现[J];广西师范大学学报(自然科学版);2007年02期
2 伍星;何中市;黄永文;;产品评论挖掘研究综述[J];计算机工程与应用;2008年36期
3 闵锦;黄萱菁;;基于主题和态度分类的文本过滤系统[J];计算机工程;2007年02期
4 娄德成;姚天昉;;汉语句子语义极性分析和观点抽取方法的研究[J];计算机应用;2006年11期
5 李艳玲;戴冠中;朱烨行;;基于类别空间模型的文本倾向性分类方法[J];计算机应用;2007年09期
6 周立柱;贺宇凯;王建勇;;情感分析研究综述[J];计算机应用;2008年11期
7 李彬,刘挺,秦兵,李生;基于语义依存的汉语句子相似度计算[J];计算机应用研究;2003年12期
8 江宝林,刘永丹,金峰,葛家翔,胡运发;一个基于语义分析的倾向性文档过滤系统[J];计算机应用与软件;2005年01期
9 李良炎,何中市,易勇;基于词联接的诗词风格评价技术[J];中文信息学报;2005年06期
10 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期
中国硕士学位论文全文数据库 前2条
1 倪茂树;基于语义理解的观点评论挖掘研究[D];大连理工大学;2007年
2 赵俊芹;顾客评论信息抽取算法的研究[D];重庆大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 申向阳;;九寨沟方言“把”字句及“给”字句研究[J];阿坝师范高等专科学校学报;2008年01期
2 刘元春;;校园bbs语言概观[J];阿坝师范高等专科学校学报;2008年02期
3 张娟;;《世说新语》“以”字处置式研究[J];阿坝师范高等专科学校学报;2009年03期
4 何清顺;汉英词汇重叠式附加意义对比分析[J];安徽广播电视大学学报;2005年02期
5 高良诚;侯整风;;客户端垃圾邮件过滤系统[J];安徽建筑工业学院学报(自然科学版);2008年04期
6 李淑华;徐良培;陶建平;;基于支持向量机的我国水产品出口贸易风险预警研究[J];安徽农业科学;2008年30期
7 程伟;张燕平;赵姝;;支持向量机在粮食产量预测中的应用[J];安徽农业科学;2009年08期
8 赵万明;黄彦全;谌贵辉;;基于支持向量机的农村用电量需求预测[J];安徽农业科学;2009年25期
9 高志胜;;现代汉语让步连词研究综述[J];安徽文学(下半月);2008年09期
10 张云瑞;;论网络语言[J];安徽文学(下半月);2008年09期
中国重要会议论文全文数据库 前10条
1 唐嘉忆;;汉译英口译材料的难度判断[A];首届海峡两岸外语教学与研究学术研讨会暨福建省外国语文学会2011年会论文集[C];2011年
2 周绮凤;林成德;罗林开;彭洪;;一种基于黎曼度量的训练样本类不平衡SVM分类方法研究[A];第二十六届中国控制会议论文集[C];2007年
3 顾小军;杨世锡;钱苏翔;;基于支持向量机的旋转机械多类故障识别研究[A];第二十六届中国控制会议论文集[C];2007年
4 康传会;汪晓东;汪轲;常健丽;;基于最小二乘支持向量机的迟滞建模方法[A];第二十九届中国控制会议论文集[C];2010年
5 刘英林;刘洪鹏;査星云;宋扬;;基于SVM的热轧钢卷性能分析[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
6 陈晓清;马君国;赵宏钟;付强;;基于二维小波变换的激光成像雷达目标识别算法[A];中国光学学会2010年光学大会论文集[C];2010年
7 加米拉·吾守尔;瓦依提·阿布力孜;吐尔根·依布拉音;;《现代维吾尔语语法信息词典》数据库建设的研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 韦向峰;张全;缪建明;池毓焕;;基于语义块的事件倾向性分析研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 冯辅周;郭恒毅;江鹏程;;支持向量机及其在电机故障诊断中的应用[A];第九届全国振动理论及应用学术会议论文集[C];2007年
10 马君国;赵宏钟;王微;;基于一维距离像的目标识别算法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 邱闯仙;现代汉语插入语研究[D];南开大学;2010年
2 李颖玉;基于语料库的欧化翻译研究[D];上海外国语大学;2010年
3 吴善子;汉韩反诘语气副词对比研究[D];上海外国语大学;2010年
4 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
5 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
6 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
7 李晚龙;六自由度Stewart平台分散智能控制研究[D];哈尔滨工程大学;2010年
8 杨宁;计算机辅助卷烟配方设计关键技术研究[D];中国海洋大学;2010年
9 何建民;面向网络社区聆听客户声音方法研究[D];合肥工业大学;2010年
10 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 龙晓花;英汉指称照应对比研究及其翻译策略[D];南昌航空大学;2010年
2 陈丹;英汉远近指示语的对比研究[D];山东科技大学;2010年
3 罗义兵;领域文本相似度计算方法研究[D];山东科技大学;2010年
4 徐芳芳;优化问题的PVD算法研究[D];山东科技大学;2010年
5 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
6 姜成玉;基于支持向量机的时间序列预测[D];辽宁师范大学;2010年
7 李海清;支持向量机在金融市场预测中的应用[D];辽宁师范大学;2010年
8 顾倩;现代汉语否定副词“不”“没(没有)”“别”的对比研究[D];辽宁师范大学;2010年
9 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
10 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 贺学勤;;X-able形容词的主客观性及其语义分类[J];安徽工业大学学报(社会科学版);2006年01期
2 徐光美;杨炳儒;秦奕青;张伟;;基于互信息的多关系朴素贝叶斯分类器[J];北京科技大学学报;2008年08期
3 张素香;李蕾;谭咏梅;;特定领域下关系模板的研究[J];北京邮电大学学报;2006年05期
4 董振兴;李荣;陈龙;;一种基于主动学习和TCM-EKNN的邮件过滤方法[J];重庆邮电大学学报(自然科学版);2011年01期
5 刘挺;马金山;;汉语自动句法分析的理论与方法[J];当代语言学;2009年02期
6 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
7 宋召青;崔和;胡云安;;支持向量机理论的研究与进展[J];海军航空工程学院学报;2008年02期
8 李实;叶强;李一军;Rob Law;;中文网络客户评论的产品特征挖掘方法研究[J];管理科学学报;2009年02期
9 宫秀军,孙建平,史忠植;主动贝叶斯网络分类器[J];计算机研究与发展;2002年05期
10 王琦,唐世渭,杨冬青,王腾蛟;基于DOM的网页主题信息自动提取[J];计算机研究与发展;2004年10期
中国重要会议论文全文数据库 前1条
1 姚天昉;彭思崴;;汉语主客观文本分类方法的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前3条
1 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
2 黄永文;中文产品评论挖掘关键技术研究[D];重庆大学;2009年
3 杨创新;基于机器学习的高性能中文文本分类研究[D];华南理工大学;2009年
中国硕士学位论文全文数据库 前10条
1 张博;基于SVM的中文观点句抽取[D];北京邮电大学;2011年
2 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
3 龙丽君;网络内容监管系统中基于局部信息的语义倾向性识别算法[D];南京理工大学;2004年
4 叶志刚;SVM在文本分类中的应用[D];哈尔滨工程大学;2006年
5 熊德兰;中文网页褒贬倾向性分类研究[D];郑州大学;2006年
6 娄德成;基于NLP技术的中文网络评论观点抽取方法的研究[D];上海交通大学;2007年
7 崔晓源;词间语义关系的研究及其在文本分类中的应用[D];天津大学;2006年
8 倪茂树;基于语义理解的观点评论挖掘研究[D];大连理工大学;2007年
9 赵俊芹;顾客评论信息抽取算法的研究[D];重庆大学;2007年
10 李林琳;基于特定领域的汉语句子意见挖掘[D];上海交通大学;2008年
【二级引证文献】
中国期刊全文数据库 前7条
1 杨武;宋静静;唐继强;;中文微博情感分析中主客观句分类方法[J];重庆理工大学学报(自然科学);2013年01期
2 胡新海;;中文网络产品评论欺诈性问题研究[J];内江师范学院学报;2012年06期
3 周珍妮;黄晓斌;;网络用户评论在企业竞争情报研究中的应用[J];情报理论与实践;2012年05期
4 马晓;陈娜;王利娟;;基于财务分析法的竞争对手分析[J];企业导报;2011年15期
5 翟东升;徐颖;黄鲁成;赵京;;基于产品评论挖掘的竞争产品优势分析[J];情报杂志;2013年02期
6 唐晓波;王洪艳;;微博产品评论挖掘模型研究[J];情报杂志;2013年02期
7 李金凯;韩立廷;;竞争对手竞争强度综合评估模型[J];知识经济;2012年14期
中国硕士学位论文全文数据库 前2条
1 卫力;基于图的半监督中文句子主客观分类算法研究[D];北京邮电大学;2011年
2 崔春华;基于本体的教育资源语义检索系统的研究与实现[D];重庆大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 武旭,须德;基于向量空间模型的文本自动分类系统的研究与实现[J];北方交通大学学报;2003年02期
2 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
3 蒋群;胡桃;;中国比较购物网站的调查分析和发展建议[J];电子商务;2006年11期
4 李良炎,何中市,易勇;基于词联接的语义表示方法和知识库建设[J];重庆大学学报(自然科学版);2004年04期
5 李良炎,何中市,易勇;基于词联接的语义分析原理及其算法[J];重庆大学学报(自然科学版);2004年08期
6 胡明东,张列平,胡长泰,彭冰;用户满意研究的现状与发展方向[J];系统工程;1998年01期
7 胡佳妮,徐蔚然,郭军,邓伟洪;中文文本分类中的特征选择算法研究[J];光通信研究;2005年03期
8 郭艳华,周昌乐;一种汉语语句依存关系网协动生成方法研究[J];杭州电子工业学院学报;2000年04期
9 谌志群,王大全;网上购物系统若干关键技术研究[J];杭州电子工业学院学报;2003年01期
10 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
中国重要会议论文全文数据库 前1条
1 车万翔;刘挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前1条
1 罗晓光;基于顾客购后行为的顾客满意度评价研究[D];哈尔滨工程大学;2006年
中国硕士学位论文全文数据库 前4条
1 吕晓辉;Web信息提取技术研究[D];西北工业大学;2001年
2 朱国华;文本信息处理中汉语句法分析方法研究[D];大连理工大学;2006年
3 王煜;Internet智能比较购物的研究与实现[D];浙江工商大学;2006年
4 张会鹏;中文词法分析技术的研究与实现[D];哈尔滨工业大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 伍星;何中市;黄永文;;基于弱监督学习的产品特征抽取[J];计算机工程;2009年13期
2 马金山;;特征造型方式及其在Pro/E中的应用[J];机械管理开发;2007年01期
3 任俊;张孝林;;移动终端的产品特征分析评价与发展展望[J];移动通信;2007年01期
4 魏毅峰;;产品评论检索系统设计[J];现代经济信息;2011年14期
5 张艳河;杨颖;韦明俊;雷田;;一种基于产品语意关联的设计方法[J];计算机集成制造系统;2008年06期
6 王小萍;;基于产品特征的数控加工工艺的设计[J];科技创业月刊;2009年01期
7 李玉玲;吴祈宗;;基于粗糙集的产品特征知识获取研究[J];河南农业大学学报;2007年03期
8 李培;何中市;黄永文;;基于依存关系分析的网络评论极性分类研究[J];计算机工程与应用;2010年11期
9 李实;叶强;李一军;罗嗣卿;;挖掘中文网络客户评论的产品特征及情感倾向[J];计算机应用研究;2010年08期
10 龙志祎;程葳;;基于词聚类的热点话题检测算法[J];计算机工程与设计;2011年06期
中国重要会议论文全文数据库 前10条
1 王波;王厚峰;;基于自学习策略的产品特征自动识别(英文)[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 薛胜雄;陈正文;盛业涛;王永强;朱华清;;美国高压水射流技术现状[A];2006年中国机械工程学会年会暨中国工程院机械与运载工程学部首届年会论文集[C];2006年
3 薛胜雄;陈正文;盛业涛;王永强;朱华清;;美国高压水射流技术现状[A];安全与可靠性——2006流体机械与压力容器技术论坛论文集[C];2006年
4 周赳;吴文正;;基于数码技术的提花织物产品创新研究[A];金昇杯第二届全国棉纺织行业中青年科技工作者论坛论文集[C];2007年
5 顾天舒;;闭口型压型钢板在钢结构工程中的应用[A];第17届全国结构工程学术会议论文集(第Ⅰ册)[C];2008年
6 陈淑琴;;浙北沿海地区大风风暴的多普勒雷达产品特征[A];第四届长三角科技论坛论文集(上册)[C];2007年
7 曹秀芝;李月英;;沿海大暴雨过程中CINRAD-SA雷达特征分析[A];中国气象学会雷达气象学委员会第三届学术年会文集[C];2008年
8 丁寒江;;国外农用运输车产品特征概述[A];拖拉机、农用运输车、农用发动机行业背景资料(第一集)[C];2004年
9 吴宁强;;论气象信息产品特征与市场营销策略[A];陕西省气象学会2005年学术交流会论文集[C];2005年
10 胡宏杰;;富氧分子筛生产工艺[A];中国地质科学院“九五”科技成果汇编[C];2001年
中国重要报纸全文数据库 前10条
1 Morningstar晨星(中国) 王蕊;如何正确对待新老基金[N];上海证券报;2008年
2 唐柳杨;多款新车助力 神龙汽车再冲“前十”[N];第一财经日报;2009年
3 Morningstar晨星(深圳)基金研究中心林晟;新基金老基金合适的才是好基金[N];证券时报;2006年
4 陈浩源;Web2.0:不一样的生意[N];第一财经日报;2007年
5 天相投资顾问 刘淑霞;中短债基金 稳健投资者的选择[N];中国证券报;2006年
6 戚海军;投资醋饮为何只开花不结果?[N];经理日报;2006年
7 上海中期 于毅然;股指期货与认沽权证哪个风险更大[N];期货日报;2007年
8 许汇;降低配送成本的五种策略[N];现代物流报;2006年
9 戚海军;投资醋饮为何只开花不结果[N];中国经营报;2006年
10 何珊;三大需求促使客车企业设计创新[N];中国工业报;2007年
中国博士学位论文全文数据库 前10条
1 黄永文;中文产品评论挖掘关键技术研究[D];重庆大学;2009年
2 朱上上;基于知识的产品造型设计技术研究[D];浙江大学;2003年
3 Hamala Sidibe;在华跨国公司大规模定制问题的研究[D];武汉理工大学;2006年
4 李实;中文网络客户评论中的产品特征挖掘方法研究[D];哈尔滨工业大学;2009年
5 王素格;基于Web的评论文本情感分类问题研究[D];上海大学;2008年
6 许多;产品开发时间分析与估计方法的研究[D];东南大学;2005年
7 杜世昌;多源多工序加工系统偏差流建模、诊断和控制系统研究[D];上海交通大学;2008年
8 陈春宝;基于聚类分析与遗传算法的产品多样性优化研究[D];上海交通大学;2008年
9 李贵孚;基于特征价格理论的我国有线数字电视产品价格模型研究[D];吉林大学;2007年
10 杨洁;协同产品创新中客户知识集成模式及其关键技术研究[D];重庆大学;2009年
中国硕士学位论文全文数据库 前10条
1 李培;产品评论挖掘的观点抽取和分类技术研究[D];重庆大学;2009年
2 罗柳茹;深圳J空调品牌动态定位体系研究[D];浙江大学;2006年
3 林栋;网络游戏消费意愿影响因素研究[D];北京邮电大学;2008年
4 胡蕾;论书刊印刷企业的个性化管理[D];曲阜师范大学;2009年
5 杨玉凤;基于XML Web Services的协同设计通信相关支持技术研究[D];山东师范大学;2005年
6 余森林;数码产品设计文化研究[D];武汉理工大学;2006年
7 陈庆伟;产品特征与供应链合同匹配的实证研究[D];上海交通大学;2008年
8 李晓芸;北京浩沙健身俱乐部产品定位策略分析[D];北京体育大学;2009年
9 李玲玲;大学生校园网购物意向驱动因素研究[D];浙江大学;2008年
10 潘九朱;基于供应链战略的物流分销模式研究[D];复旦大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026