收藏本站
《首都师范大学》 2014年
收藏 | 手机打开
二维码
手机客户端打开本文

面向微博情感分析的本体自动抽取关键技术研究

李清敏  
【摘要】:随着新型互联网应用的迅猛发展,微博快速崛起,用户数达到2.81亿,使用率达到45.5%,每天数以千万人通过微博分享自己对各类话题的观点与情感,如何自动感知微博主体的情感,并从宏观上科学研判微博社区对特定话题的观点倾向性,已经成为微博计算与舆情分析亟待解决的基本科学问题。 然而,以往的情感分析大都是基于整个传统长文本层面,并且由于微博内容短小且不规范,碎片化与主体化特征日益凸显,传统的情感分析算法存在本质缺陷,效率低下且效果很难满足实际需求。利用情感词典分析用户产生内容的情感倾向性是简单有效的方法。但由于情感词典规模有限,同时网络用语新词层出不穷,语言使用不规范,人工整理耗时耗力,领域性强。为解决以上问题,本文提出一种自动挖掘潜在情感词并计算其情感权重的算法,该算法与应用领域无关,具有良好的扩展性。该方法基于贝叶斯原理和大数据挖掘,能够挖掘未知的情感词,并根据其情感权重值的大小判断其情感极性及情感倾向性程度,可有效扩展情感词典,并丰富情感词典的精细化使用,从而实现了情感词库的自动挖掘与获取。同时,在此基础之上,实现情感主体属性的识别,包括观点句识别、情感对象抽取及情感倾向性判断,从而完成情感分析的本体自动抽取。 本文在理论研究的基础上进行算法的实践验证,同时为验证该方法能够实现跨领域,本文又分别针对京东商城、豆瓣、大众点评三组评论语料做了实验。其结果的准确率都基本在90%以上,验证了以上算法的有效性和实用性,为各种互联网应用,不仅仅是微博,提供了情感分析的基础。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 孔敬;;本体学习:原理、方法与相关进展[J];情报学报;2006年06期
2 安纪霞;李锡祚;宋冰;曾伟;;服务于词典编纂的特定领域专业术语自动抽取[J];计算机与数字工程;2007年11期
3 李亚桥;王晓东;李智;;基于树结构的包装器全自动生成方法的研究[J];河北工业大学学报;2007年06期
4 曾苏;马建霞;张秀秀;;元数据自动抽取研究新进展[J];现代图书情报技术;2008年04期
5 何琳;;领域本体的关系抽取研究[J];现代图书情报技术;2008年04期
6 张永奎,赵辄谦,陈鑫卿,白丽君;基于机器学习的网页主题词自动抽取[J];计算机应用;2003年03期
7 张秀秀;马建霞;;PDF科技论文语义元数据的自动抽取研究[J];现代图书情报技术;2009年02期
8 熊平原;王毅;陈庆新;毛宁;;基于压铸模本体的领域概念自动抽取方法研究[J];机械设计与制造;2011年07期
9 刘步中;杨继刚;张曦煌;;多分类SVM和RDF的生物信息元数据自动抽取[J];计算机工程与设计;2010年11期
10 胡少荣;孟嗣仪;刘云;张彦超;丁飞;;网页信息自动抽取技术的研究[J];铁路计算机应用;2010年09期
11 叶昆;;互联网视听节目监管系统简介[J];大众科技;2009年10期
12 聂志强;;本体自动抽取中的概念相似性分析[J];计算机工程与应用;2007年26期
13 许宗文;;蒸汽透平用的新的抽取控制系统[J];石油化工自动化;1977年05期
14 朱明;王庆伟;;半结构化网页中多记录信息的自动抽取方法[J];计算机仿真;2005年12期
15 林贤明,李堂秋,史晓东;基于模板的机器翻译系统中模板库的自动构建技术[J];计算机应用;2004年09期
16 周海英;周菁菁;毛大胜;王影;陈楠;张凌云;曾月蓉;黄光琴;;自动抽取科技期刊目次的技巧[J];中国科技期刊研究;2011年03期
17 李超;王会珍;朱慕华;张俐;朱靖波;;基于领域类别信息C-value的多词串自动抽取[J];中文信息学报;2010年01期
18 刘勇军;聂规划;;多信息源下本体自动抽取的实现[J];计算机应用研究;2007年11期
19 马卫华;多种文献自动标引情报检索系统的设计[J];微计算机应用;1991年01期
20 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报(自然科学版);1998年01期
中国重要会议论文全文数据库 前10条
1 邱艳霞;余正涛;张志坤;司圣涛;韩露;孟祥燕;;领域术语自动抽取方法研究[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
2 岳昆;李劲;石磐;刘惟一;;基于语义的Web服务主题自动抽取[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
3 胡东东;孟小峰;;一种基于树结构的Web数据自动抽取方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
4 王海雄;郭剑毅;余正涛;毛存礼;张朝胜;雷春雅;;基于CRFs的中文领域术语自动抽取研究[A];第六届全国信息检索学术会议论文集[C];2010年
5 王栋;盛玉麒;;汉语否定极项(NPI)自动抽取研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 聂志强;李庆忠;;电子政务信息集成中本体的自动抽取及优化[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
7 封盛;张铭;;基于DOM树的半指导科技文献元数据自动抽取[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
8 肖诗斌;乔春庚;李渝勤;施水才;;基于未标注语料的领域词汇自动抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
9 李超;王会珍;朱慕华;张俐;朱靖波;;基于领域类别信息C-value的多词串自动抽取[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 彭国珍;邹纲;;基于汉英双语语料库述宾短语的自动抽取[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 本报记者 何飞 通讯员 林斓韬;清远落实“一网考”和“三挂钩”严把奖惩关[N];人民公安报;2010年
2 记者 许多;瑞安“三环”智能型湿巾包装机推向市场[N];中国包装报;2005年
3 ;潍坊专家抽取杜绝人为干扰[N];政府采购信息报;2006年
4 文心;不要光治标不治本[N];政府采购信息报;2007年
5 张厚美 李丹;自动监测站盯住千里嘉陵江[N];中国环境报;2007年
6 张厚美 青兴海 记者 张发政;千里嘉陵江第一“眼”实时监控川陕界水质[N];广元日报;2007年
7 王炳良;进场交易 规范运行[N];中国纪检监察报;2008年
8 江苏省淮安市政府采购中心 淮纪妍 孙建英 郑银东;依托科技监控手段确保评审公平公正[N];中国财经报;2009年
9 刘林记者 欧维佳;搬“家”前 先过环保检查关[N];南充日报;2007年
10 胡海啸 张梦谦;青岛国税为税管员配备“征管指南”[N];中国税务报;2005年
中国博士学位论文全文数据库 前10条
1 杨月华;基于领域知识模型的突发事件智能信息检索系统研究[D];北京邮电大学;2013年
2 张宏涛;面向生物文本的实体关系自动抽取问题研究[D];清华大学;2012年
3 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
4 李卫;领域知识的获取[D];北京邮电大学;2008年
5 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
6 刘柏嵩;基于Web的通用本体学习研究[D];浙江大学;2007年
7 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
8 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
9 林贤明;复杂场景下的人体行为识别若干关键技术研究[D];厦门大学;2014年
10 周浪;中文术语抽取若干问题研究[D];南京理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 杨杨;术语自动抽取效率对比实验报告[D];大连海事大学;2014年
2 朱鑫;词语搭配自动抽取方法对比研究[D];大连海事大学;2011年
3 李姗;面向术语自动抽取的英语词汇形态特征分析[D];大连海事大学;2012年
4 李清敏;面向微博情感分析的本体自动抽取关键技术研究[D];首都师范大学;2014年
5 孙蝉娟;航空器及其安全领域术语定义的自动抽取[D];南京航空航天大学;2010年
6 邱艳霞;领域术语自动抽取及关系分类研究[D];昆明理工大学;2009年
7 康琪;基于Bootstrapping的领域知识自动抽取技术的研究[D];山东大学;2012年
8 姚贤明;领域概念自动抽取研究[D];昆明理工大学;2010年
9 马晶晶;金融领域信息的自动抽取与分析方法[D];哈尔滨工业大学;2013年
10 杨继刚;基于J2EE-SSH框架的小鼠信息数据库系统的设计与实现—PBMICE-SR语义检索框架[D];江南大学;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978