收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

中文商品评论倾向性分析研究

李荣军  
【摘要】:在电子商务大潮席卷世界的今天,如何快速、准确地收集到互联网上商品的评论信息,对商家掌握用户的喜好变化和潜在用户了解商品的流行趋势都具有重要的意义。如果单纯地依靠人工对这些评论性信息进行收集、分析和整理,显然是低效和昂贵的。而可以自动、有效地对这些信息进行处理的文本倾向性分析技术,已经成为当前自然语言处理领域中具有极高应用价值的研究热点。 本文针对中文的商品评论倾向性分析系统所涉及的三项关键性技术:中文句子倾向性检测、商品属性词和评价情感词抽取以及情感词的极性判别展开了研究。 (1)中文句子倾向性检测 提出了一种利用自适应算法和多分类器融合框架的跨语言句子倾向性检测方法。 首先,通过多翻译引擎服务将英文训练语料翻译为多份中文训练语料,以消除英文训练语料与中文测试语料的隔阂;其次,在多个分类器的训练过程中,引入了自适应算法,以提高分类器的精度;最后,对多个分类器进行融合,来提高分类结果的稳定性。 在选用NTCIR英文语料作为训练语料、NTCIR中文语料作为测试语料时,句子倾向性检测的F-measure值达到了65.55%,接近实验设定的上限67.35%。 (2)商品属性词和评价情感词抽取 提出了一种基于词性关系模板的商品属性词和评价情感词同步抽取算法。为了测试该算法的有效性,设计了一套新的语料标注规范,并依据规范建立了相应的语料集。 首先,通过有监督的序列规则挖掘算法从训练样本中挖掘出可能的词性依存关系模板;然后,利用高置信度的模板在测试样本中抽取出商品属性词和评价情感词二元组。在所设定的四个领域中进行实验,结果平均准确率达到54.18%,召回率为29.45%。 (3)情感词的极性判别 提出了一种基于PageRank算法的情感词极性判别方法。利用训练域种子情感词准确极性和测试域情感词临时极性来实现对测试域情感词的极性判别。实验结果表明,情感词的判别准确率可以达到90%以上。 最后,综合上述研究,设计并实现了一套面向汽车领域的商品评论倾向性分析系统。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 曹来发;;中文电脑交流会、中文信息全国学术交流会在蓉召开[J];水利电力机械;1991年05期
2 孙宝传;中文信息处理技术如何再创辉煌[J];中国传媒科技;2001年10期
3 ;书讯[J];中文信息学报;2010年02期
4 ;在《中文信息》创刊十周年庆祝会上 四川联合大学龙伟副校长致开幕词[J];中文信息;1994年06期
5 ;推动中文信息现代化工程是炎黄子孙义不容辞的职责——基金会积极筹建 热心人士陆续捐赠[J];中文信息;1995年01期
6 ;读者天地[J];中文信息;1994年01期
7 廖坦,张平;信息港与中文信息环境[J];中文信息;1996年05期
8 许嘉璐;语言学研究与中文信息处理[J];中文信息;1997年03期
9 曲大成;周立峰;;怎样阅读Internet网上的中文信息[J];办公自动化;1997年01期
10 姚进;首都在线——全新本地中文信息网[J];网上出版;1998年02期
11 ;全国高师中文信息资料协会第八次代表会议暨学术研讨会在呼市召开[J];情报资料工作;1999年06期
12 ;中国中文信息学会第五次全国会员代表大会暨学会成立二十周年学术年会征文通知[J];中文信息学报;2001年04期
13 ;中文信息技术产品有了认证中心[J];信息技术与标准化;2001年06期
14 真鸣;中文信息研究会少数民族专委会成立大会简况[J];计算机学报;1986年01期
15 曹军;;中文信息速录成新宠[J];互联网天地;2007年12期
16 张寿萱;SYSTEM C——一个多功能中文信息综合处理系统[J];计算机学报;1984年06期
17 ;COLING 2010即将在北京召开[J];中文信息学报;2010年03期
18 汤九斌;西文UNIX系统用户浏览Internet网中文信息的方法[J];中国计算机用户;1997年08期
19 ;《中文信息学报》征稿简则[J];中文信息学报;2011年02期
20 ;通联网络[J];中文信息;1996年06期
中国重要会议论文全文数据库 前10条
1 ;前言[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 ;前言[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 ;前言[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 ;第十届全国计算语言学学术会议组织情况[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
5 ;第五届全国信息检索学术会议(CCIR 2009)[A];第五届全国信息检索学术会议论文集[C];2009年
6 ;前言[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 ;北京中易中标电子信息技术有限公司公司简介[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
8 ;中文信息的智能处理[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
9 张耀允;王晓龙;王轩;徐睿峰;侯永帅;范士喜;;面向开放的限定领域的交互式问答语料分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
10 嘎日迪;吾守尔.斯拉木;德熙嘉措;;代序[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
2 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
3 耿直;基于语料库的比较句式“跟、有、比”的描写与分析[D];北京大学;2012年
4 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
5 饶萍;时间指称的照应性研究[D];上海外国语大学;2012年
6 杨石乔;基于语料库的汉语医患会话修正研究[D];上海外国语大学;2010年
7 朱娅蓉;教师启动的会话修正研究[D];上海外国语大学;2011年
8 高瑛;社会文化视域下的中国英语课堂师生协商话语研究[D];东北师范大学;2010年
9 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
10 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2010年
中国硕士学位论文全文数据库 前10条
1 李轩;《汉语会话301句》语料的语用价值研究[D];吉林大学;2012年
2 张小倩;情感极性转移现象研究及应用[D];苏州大学;2012年
3 徐斌;对汉语中电话投诉的交流模式及特点的会话分析[D];山西大学;2011年
4 刘昊;基于模板核和扩展特征的蛋白质关系抽取[D];大连理工大学;2011年
5 周宥良;基于WEB的双语翻译对抽取方法研究[D];苏州大学;2010年
6 朱世猛;中文分词算法的研究与实现[D];电子科技大学;2011年
7 邬智慧;中文微博的语体特征研究[D];华中师范大学;2012年
8 程舰;基于内容的Internet Web中文信息过滤[D];北京交通大学;2011年
9 严孙荣;中文产品评论的意见挖掘研究[D];北京交通大学;2010年
10 张鹏;中文意见挖掘的特征层次构建和抽取算法[D];重庆大学;2010年
中国重要报纸全文数据库 前10条
1 李力;广东云安建国内首个中文信息化城镇[N];经济日报;2004年
2 ;中文信息应用网络应运而生[N];网络世界;2001年
3 詹克山;清除IE地址栏中的中文信息[N];中国计算机报;2002年
4 记者 王兵;中国C网构建中文信息应用系统[N];人民邮电;2001年
5 记者 李琳;中国C网:誓做自主全中文信息网[N];厂长经理日报;2000年
6 罗敏;《中国C网中文信息应用网络系统》近日通过技术成果鉴定[N];中国高新技术产业导报;2001年
7 教育部语信司;第十一届全国民族语言文字信息学术研讨会召开[N];语言文字周报;2007年
8 本报记者  管宏业;新标致307:外观小改 品质大增[N];中国商报;2006年
9 阿祥;没有文化 网站将会怎样?[N];中国信息报;2001年
10 记者李行;海峡两岸共商中文信息技术合作大计[N];新疆日报(汉);2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978