收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

文本情感分析中关键问题的研究

李岩  
【摘要】:随着社交网络的发展,互联网中每天都在涌现大量的富含主观情感的信息,如论坛贴子、微博、在线评论等,这些主观信息在互联网信息挖掘中具有重要价值。情感分析,又称为观点挖掘,其研究目的是理解文本中人们对于某个实体(包括产品、服务、个人、组织机构、事件、议题)的评判态度(支持或反对、喜欢或厌恶等)或情绪状态(高兴、愤怒、悲伤、恐惧等)。本文重点研究不同文本粒度下情感分析的关键问题。 在词语级情感分析中,本文重点关注的问题是:词在不同领域下往往会表现出不同的情感倾向性。本文提出亲和力传播算法以判断特定领域下词的语义倾向性。该算法首先基于激活力模型构建原始语料集的词亲和力网络,该网络通过词之间的语义激活关系计算词的链接结构相似度。然后,算法将词表示为富含全局语义信息的亲和力向量以计算该词与种子情感词之间的相似度,从而完成情感信息在整个词网中的传播。实验结果表明,该算法可针对不同领域有效地构建语义倾向性词典。 本文将文档级情感分析看作是一种分类任务而重点研究特征选择对提升文档情感分类性能的作用。借鉴线性鉴别分析算法的思想,本文提出了无监督的情感鉴别分析(SDA),通过每个文档的局部情感散度矩阵构建目标函数,求解最优线性分类器,进而获得每个特征的情感鉴别得分。另一方面,本文利用激活力模型计算每个特征与先验情感词的整体亲和力,即全局情感强度。本文认为SDA保留了文档之间的局部情感结构,而情感强度计算(SSC)则侧重于特征在语料集中的全局情感倾向性,二者具有一定的互补性。因此,本文将SDA和SSC进行线性加权组合并最终形成了无监督情感特征选择算法—USFS。 文档级情感分析的细致度有时无法满足某些应用场合的需求,因而还需要进行要素级情感分析。要素级情感分析是针对情感定义中的五个基本要素进行观点挖掘,是一种更细粒度的情感分析技术。属性抽取是其中的一项重要任务,而对属性的置信度评估则是确保系统抽取性能的关键。本文提出了一种两步置信度评估法:在基于模式的Bootstrapping算法中通过“广泛度”和“可靠度”交互式地评估候选产品特征词和依存模式;第二步将上一步获得的候选特征词聚合为属性类,通过衡量聚合类的“紧凑度”和“材质”进行过滤。针对电子产品评论的实验表明,本文提出的两步置信度评估法可同时保证属性抽取的准确率和召回率。另外,在属性抽取的基础上,本文还提出了一种迭代式地聚合计算策略,从产品属性的所有评价搭配中有效地分析了该属性在整个评论集上的全局信誉度。 最后,本文提出一种在线的产品属性情感摘要系统——SSPA。SSPA综合运用词语级、句子级、要素级的情感分析技术将非结构化的原始产品评论集转化为结构化的基于产品属性的情感摘要。摘要中首先列出关于某类产品的所有属性,然后按情感强度将各个属性下的正、负倾向性句子及其所评论的产品名称展现给用户。SSPA系统可方便消费者或商家浏览某类产品不同属性下的产品评价情况。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张葛祥;金炜东;胡来招;;满意特征选择及其应用[J];控制理论与应用;2006年01期
2 蒋盛益;王连喜;;基于特征相关性的特征选择[J];计算机工程与应用;2010年20期
3 张禹;刘云东;;基于相容粒的特征选择[J];宿州学院学报;2011年02期
4 孙建文;刘三(女牙);杨宗凯;王佩;;采用集成特征选择的网络书写纹识别研究[J];小型微型计算机系统;2012年05期
5 付涛;;基于特征选择的多示例学习算法研究[J];科技通报;2013年08期
6 朱鹏飞;胡清华;于达仁;;基于大间隔粒计算的特征选择[J];重庆邮电大学学报(自然科学版);2010年05期
7 王卫平;唐志煦;;基于混合CatfishPSO-LSSVM特征选择的入侵检测[J];计算机系统应用;2012年01期
8 李丽娜;欧阳继红;刘大有;高文杰;;一种结合特征选择和链接过滤的主动协作分类方法[J];计算机研究与发展;2013年11期
9 宋家勇,杨杰;针对信息缺失的复杂系统的特征选择[J];红外与激光工程;2004年05期
10 桑农;谢衍涛;高如新;张天序;;神经模糊网络特征选择[J];模式识别与人工智能;2006年06期
11 吕彦红;陈基漓;阮百尧;;基于遗传算法的中文自动分类特征选择[J];山东理工大学学报(自然科学版);2009年01期
12 ;生物特征身份识别中的特征选择与先进的识别算法[J];北京邮电大学学报;2009年02期
13 刘阿力;;关系积理论在特征选择中的应用研究[J];微型机与应用;2009年22期
14 孟犇;胡暾;杨杰;;基于多特征选择及粒子滤波的目标稳健跟踪[J];计算机仿真;2011年01期
15 田卫新;郑胜;;一种基于特征选择的主观性文本分析方法[J];计算机系统应用;2011年08期
16 张永;曹东侠;;一种高效的特征选择机制应用于入侵检测[J];甘肃科学学报;2011年03期
17 陆慧娟;张金伟;马小平;杨小兵;;基于特征选择的过抽样算法的研究[J];电信科学;2012年01期
18 曹军;刘光远;赖祥伟;;量子粒子群和相关性分析在心电特征选择中的应用[J];计算机科学;2012年03期
19 王连喜;蒋盛益;;一种基于类别区分互补性的特征选择[J];小型微型计算机系统;2013年08期
20 曹彦;王倩;周驰;;基于特征选择技术的集成方法研究[J];计算机工程与科学;2013年08期
中国重要会议论文全文数据库 前10条
1 靖红芳;王斌;杨雅辉;;基于类别分布的特征选择框架[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 李长升;卢汉清;;排序学习模型中的特征选择[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
3 刘功申;李建华;李生红;;基于类信息的特征选择和加权方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 倪友平;王思臣;马桂珍;陈曾平;;分支界定算法在低分辨雷达飞机架次判别中的应用[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
5 李泽辉;聂生东;陈兆学;;应用多类SVM分割MR脑图像特征选择与优化的实验研究[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
6 蒙新泛;王厚峰;;主客观识别中的上下文因素的研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 万京;王建东;;一种基于新的差异性度量的ReliefF方法[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
8 范丽;许洁萍;;基于GMM的音乐信号音色模型研究[A];第四届和谐人机环境联合学术会议论文集[C];2008年
9 陈友;戴磊;程学旗;;基于MRMHC-C4.5的IP流分类[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 申昇;杨宏晖;袁帅;;用于水声目标识别的互信息无监督特征选择[A];第三届上海——西安声学学会学术会议论文集[C];2013年
中国博士学位论文全文数据库 前10条
1 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
2 张明锦;基于特征选择的多变量数据分析方法及其在谱学研究中的应用[D];华东理工大学;2011年
3 高青斌;蛋白质亚细胞定位预测相关问题研究[D];国防科学技术大学;2006年
4 冯国忠;文本分类中的贝叶斯特征选择[D];东北师范大学;2011年
5 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年
6 王锋;基于粒化机理的粗糙特征选择高效算法研究[D];山西大学;2013年
7 刘波;组稀疏子空间的大间隔特征选择[D];重庆大学;2013年
8 梁建宁;特征选择与图像匹配[D];复旦大学;2011年
9 王瑞;针对类别不平衡和代价敏感分类问题的特征选择和分类算法[D];中国科学技术大学;2013年
10 姚兰;支持向量机特征选择中的L_p正则化方法研究[D];湖南大学;2014年
中国硕士学位论文全文数据库 前10条
1 郑莎;基于特征选择的量表条目筛选方法研究[D];北京交通大学;2008年
2 宁永鹏;高维小样本数据的特征选择研究及其稳定性分析[D];厦门大学;2014年
3 孙伟艳;模式分类中特征选择问题的研究[D];哈尔滨理工大学;2009年
4 陈东;半监督特征选择和特征选择的稳定性研究[D];上海交通大学;2013年
5 唐志煦;基于特征选择的入侵检测研究[D];中国科学技术大学;2011年
6 杨打生;特征选择的信息论算法研究[D];东南大学;2005年
7 颉嘉;文档内容抽取与特征选择技术的研究与实现[D];西安电子科技大学;2011年
8 詹林强;模式识别中的特征选择与评价方法研究[D];天津科技大学;2012年
9 王姝勤;肝脏CT辅助诊断系统中特征选择和提取研究[D];上海交通大学;2010年
10 范小丽;文本分类中特征选择的研究与实现[D];西北大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978