收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

细颗粒度情感倾向分析若干关键问题研究

张奇  
【摘要】: 随着互联网和信息处理技术的发展,人们可以从新闻评论、论坛、博客等来源得到海量的评论信息,只有通过对信息的深入分析和提炼,信息才能更有效的为人所用。正是在这一背景下,文本的情感倾向研究成为当前一个具有广泛应用前景且十分新颖的研究领域。 本文工作主要围绕着“细颗粒度”情感倾向分析中若干关键技术展开研究,包括:被评价对象抽取、评价关系抽取、情感倾向判定、知识库半自动构建以及半监督学习在情感倾向分析中的应用等方面。 在文章和句子级倾向极性分析任务中,我们将条件最大熵算法和熵正则化框架结合,提出了半监督条件最大熵算法。该方法在句子级MPQA语料库中,可以达到78.2%的精度,比有监督方法有5.2%的相对提高。 在被评价对象抽取方面,提出了基于条件随机场的被评价对象识别算法。该算法将被评价对象抽取问题转化为序列标注问题,通过上下文、词性、知识库等一系列特征完成被评价对象抽取。通过上述方法被评价对象识别精度可以达到91.17%。 在评价关系方面,提出了一种将关系识别问题转化为序列标注问题的方法。利用条件随机场和一系列特征完成评价关系抽取。这一算法结合了语法层信息、词语层信息,并利用相邻关系的分类结果,因而具有更高的准确性。实验结果表明该方法的F值比最近邻方法有15%的提高。 在模型自适应方面,提出了一种基于最大后验的条件随机场模型自适应算法。通过实验结果说明这种算法可以有效通过背景模型和适应语料,自适应到另外一个领域中,在被评价对象抽取实验中,经过适应的模型比未经适应的模型有34%的相对提高。 此外,在知识库构建方面,我还提出了基于图互增理论的自举学习算法,利用弱监督分类器,从少量种子词和大量未标记语料中自动学习出符合要求的数据,再结合人工判断,半自动的构成所需知识库。 最后,我们结合上述研究实现了面向汽车领域的情感倾向分析系统。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 朱莎莎;刘宗田;付剑锋;朱芳;;基于条件随机场的中文时间短语识别[J];计算机工程;2011年15期
2 刘莉;何中市;邢欣来;毛小丽;;基于语义角色的中文时间表达式识别[J];计算机应用研究;2011年07期
3 张春元;;基于条件随机场的文本分类模型[J];计算机技术与发展;2011年07期
4 于江德;谷川;葛文英;樊孝忠;;一种基于字和子串联合标注的汉语分词方法[J];山西大学学报(自然科学版);2011年03期
5 康旭珍;李茹;李双红;;框架元素语义核心词自动识别研究[J];中文信息学报;2011年04期
6 阳维;张树恒;王莲芸;张素;;基于图像块分类器和条件随机场的显微图像分割[J];计算机应用;2011年08期
7 刘运;蔡志平;钟平;殷建平;程杰仁;;基于条件随机场的DDoS攻击检测方法[J];软件学报;2011年08期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 代翠;周俏丽;蔡东风;;统计和规则相结合的汉语最长名词短语自动识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 陈禹;史晓东;向晓雯;张润延;;基于混合方法的中文命名实体识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 张祝玉;任飞亮;朱靖波;;基于条件随机场的中文命名实体识别特征比较研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
4 王东波;陈小荷;年洪东;;基于条件随机场的有标记联合结构自动识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 徐薇;付滨;刘柳;苑春法;李文捷;;中文命名实体识别系统的领域扩展[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
6 冯元勇;孙乐;张大鲲;李文波;;基于单字提示特征的中文命名实体识别快速算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 宁伟;蔡东风;季铎;;基于条件随机场的冠词选择研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
8 计峰;高沫;邱锡鹏;黄萱菁;;中文机构名简称的自动生成研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 魏玮;杜金华;徐波;;基于分层语块分析的统计翻译研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 何赛克;王小捷;董远;张韬政;白雪;;归一化的邻接类别方法在基于条件随机场的中文分词中的应用[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国博士学位论文全文数据库 前10条
1 张奇;细颗粒度情感倾向分析若干关键问题研究[D];复旦大学;2008年
2 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
3 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
4 禇一平;基于条件随机场模型的视频目标分割算法研究[D];浙江大学;2007年
5 许红涛;Web图像语义分析与自动标注研究[D];复旦大学;2009年
6 黄健斌;基于条件概率图模型的Deep Web数据抽取与集成研究[D];西安电子科技大学;2007年
7 熊英;中文自然语言理解中基于条件随机场理论的词法分析研究[D];上海交通大学;2009年
8 钱线;快速精确的结构化机器学习方法研究[D];复旦大学;2010年
9 郁生阳;基于能量最小化图割的图像与视频目标精确分割研究[D];上海交通大学;2009年
10 王琼华;多分辨率遥感图像复合分类方法研究[D];清华大学;2011年
中国硕士学位论文全文数据库 前10条
1 向晓雯;基于条件随机场的中文命名实体识别[D];厦门大学;2006年
2 柴桦;基于视频的人体运动识别方法研究[D];中南大学;2008年
3 郭家清;基于条件随机场的命名实体识别研究[D];沈阳航空工业学院;2007年
4 刘海鹏;面向手机短信的命名实体识别研究[D];北京邮电大学;2009年
5 苗雪雷;基于条件随机场的汉语词义消歧方法研究[D];沈阳航空工业学院;2007年
6 何楠;基于统计机器学习的两阶段中文命名实体识别研究[D];北京邮电大学;2008年
7 潘晓雯;人体运动捕捉数据的检索[D];大连理工大学;2009年
8 丁卓冶;中文命名实体识别的研究[D];大连理工大学;2008年
9 代翠;汉语最长名词短语的自动识别与分析[D];沈阳航空工业学院;2009年
10 曾冠明;基于条件随机场的中文命名实体识别研究[D];北京邮电大学;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978