收藏本站
《东北财经大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于依存句法分析的互联网细粒度观点挖掘研究

王文然  
【摘要】:随着网民数量的快速增长和网络信息平台的日渐丰富,论坛、博客、个人主页和BBS等成为人们在网络上关注信息和发表评论的重要媒介。网络上的影评、书评和对某些产品服务的评论也迅速地增多。于是,当企业或者消费者需要获取有价值的评论信息的时候,他们很难在网络中海量评论中快速而全面地找到自己想要的信息。这时观点挖掘技术产生了巨大的作用,它能够自动对网络上大量的非结构化文本信息进行挖掘,从而迅速得到有价值的观点态度等。国外韵许多专家学者对观点挖掘做了一些有益的研究,并且已经有相关的系统投入了使用。但是因为汉语在机器语言处理中存在一些自身的特点和难点,所以国内的观点挖掘的研究还处在探索和开发的阶段。近几年,国内的许多专家学者也取得了一定的进步与突破。 传统的观点挖掘能够在对主观性观点型文本的分析处理后得出观点持有者的褒贬态度,即对被评论对象的态度是褒、贬或者中立的。但是这种技术越来越不能满足人们日趋深入的观点挖掘需求。于是,近年来观点挖掘的研究开始倾向于细粒度挖掘,即不仅能够获取公众的褒贬态度,更能识别出是对哪一产品的哪一特征所持的观点。 本文根据观点挖掘的过程和应用到的主要技术方法,介绍了观点挖掘中的网页爬取和预处理技术,中文分词技术,基于情感和基于特征的观点挖掘方法。观点型主观性文本拥有四个要素:主题、观点持有者、陈述和情感,本文分别介绍了主题、观点持有者的提取和基于情感的分类。然后针对细粒度观点挖掘详细介绍了句法分析技术,并提出了实现细粒度观点挖掘的流程,利用了一些已经取得不错效果的分析工具,如:ICTCLAS中文分词工具和Deparser句法分析器,另外编写了对依存关系对进行统计分析的程序。然后对特征和极性词匹配的算法进行了介绍和改进。最后,通过实验和数据分析对细粒度观点挖掘的实现方法进行了必要的验证。 由于细粒度观点挖掘是一个处于前沿的研究领域,并且研究者的个人能力有限,本文还存在一些不足之处,需要进一步的研究探讨。如中文分词和句法分析的精度问题,流程实现的衔接问题等。
【学位授予单位】:东北财经大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP391.1

【参考文献】
中国期刊全文数据库 前10条
1 孙宏林,俞士汶;浅层句法分析方法概述[J];当代语言学;2000年02期
2 冯志伟;基于短语结构语法的自动句法分析方法[J];当代语言学;2000年02期
3 刘挺;马金山;;汉语自动句法分析的理论与方法[J];当代语言学;2009年02期
4 刘红芝;;中文分词技术的研究[J];电脑开发与应用;2010年03期
5 余战秋;中文分词技术及其应用初探[J];电脑知识与技术;2004年32期
6 李朝虹,陆建湖;现代汉语自动分析研究现状综述[J];广西教育学院学报;2003年01期
7 王鹏,戴新宇,陈家骏,王启祥;基于规则的汉语句法分析方法研究[J];计算机工程与应用;2003年29期
8 熊德兰;程菊明;田胜利;;基于HowNet的句子褒贬倾向性研究[J];计算机工程与应用;2008年22期
9 李娟;张全;贾宁;;中文词语倾向性分析处理[J];计算机工程与应用;2009年02期
10 王素格;杨安娜;李德玉;;基于汉语情感词表的句子情感倾向分类研究[J];计算机工程与应用;2009年24期
中国硕士学位论文全文数据库 前1条
1 李林琳;基于特定领域的汉语句子意见挖掘[D];上海交通大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 李荣军;王小捷;周延泉;;PageRank模型在中文情感词极性判别中的应用[J];北京邮电大学学报;2010年05期
2 向毅;王成敏;;基于Abney的组块识别方法研究[J];重庆科技学院学报(自然科学版);2008年04期
3 冯志伟;自然语言处理中的概率语法[J];当代语言学;2005年02期
4 刘挺;马金山;;汉语自动句法分析的理论与方法[J];当代语言学;2009年02期
5 于洪波;;中文分词技术研究[J];东莞理工学院学报;2010年05期
6 崔大志;刘影;李媛;;论网络社区评论情感语义的模糊化[J];大连海事大学学报(社会科学版);2010年03期
7 庞娜;;增量学习算法对文本情感识别模型的改进[J];电脑开发与应用;2011年07期
8 王雪钢;陶友公;;“ちょっと”与独词句的机器翻译[J];电脑知识与技术(学术交流);2007年03期
9 梁坤;古丽拉·阿东别克;;基于SVM的中文新闻评论的情感自动分类研究[J];电脑知识与技术;2009年13期
10 阿布都克力木·阿不力孜;哈里旦木·阿布都克里木;吐尔根·依布拉音;帕里旦·吐尔逊;艾山·吾买尔;;基于自顶向下算法的维吾尔语句法分析初探[J];电脑知识与技术;2010年05期
中国重要会议论文全文数据库 前10条
1 周惠巍;黄德根;高洁;杨元生;;最大生成树算法和Nivre算法相结合的中文依存关系解析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 吴苏红;王素格;;基于依存关系的旅游景点评论的特征-观点对抽取[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 韦向峰;张全;缪建明;池毓焕;;基于语义块的事件倾向性分析研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 边海容;万常选;李国林;杨莉;;Web金融信息情感倾向与上市公司财务危机的关系研究[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
5 朱宏博;张芊;赵海;宋纯贺;;基于贝叶斯网络英文电影对白的潜在语义分析[A];第八届沈阳科学学术年会论文集[C];2011年
6 黄威;靳亚辉;;面向评论挖掘的产品属性集合构建[A];第六届(2011)中国管理学年会——信息管理分会场论文集[C];2011年
7 ;Comparing Chinese reviews based on Fuzzy PROMETHEE: A new approach to sentiment analysis[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
8 徐艳华;陈小荷;李斌;陈钟;;面向自动句法分析的现代汉语“V+V”结构歧义研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 王根;赵军;;中文褒贬义词语倾向性的分析[A];第三届学生计算语言学研讨会论文集[C];2006年
10 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
2 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
3 郭戈;数字视频语义信息提取与分析[D];解放军信息工程大学;2010年
4 侯锋;中文报业出版的文字质量智能辅助控制技术研究[D];国防科学技术大学;2010年
5 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
6 杨峰;本体映射关键技术研究[D];吉林大学;2011年
7 刘志富;现代汉语领属性偏正结构及其相关句法现象[D];华中师范大学;2011年
8 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年
9 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
10 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
中国硕士学位论文全文数据库 前10条
1 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
2 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
3 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
4 吕韶华;面向中文评论文本的情感倾向性研究[D];大连理工大学;2010年
5 邢鑫岩;基于序列模型的情感分析研究[D];大连理工大学;2010年
6 陈旭;地理编码引擎的设计与实现[D];辽宁工程技术大学;2009年
7 王玉丹;基于SVM的汉语依存句法分析研究[D];中国海洋大学;2010年
8 杨鼎;基于朴素贝叶斯的中文文本情感倾向分类研究[D];湖南工业大学;2010年
9 王阿婷;基于概念集合的网页内容过滤方法的研究[D];北京交通大学;2010年
10 胡少荣;一种舆情信息预处理平台的研究与实现[D];北京交通大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 胡锡衡;;正向最大匹配法在中文分词技术中的应用[J];鞍山师范学院学报;2008年02期
2 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
3 李智超;马少平;;针对搜索引擎的媒体倾向性研究[J];江西师范大学学报(自然科学版);2008年02期
4 孙铁利,杨凤芹;根据用户隐式反馈建立和更新用户兴趣模型[J];东北师大学报(自然科学版);2003年03期
5 冯志伟;;特思尼耶尔的从属关系语法[J];国外语言学;1983年01期
6 李艳玲;戴冠中;覃森;;快速的文本倾向性分类方法(英文)[J];电子科技大学学报;2007年06期
7 谌志群,周昌乐;汉语机器理解研究现状及展望[J];电脑学习;1999年02期
8 李舟军,王兵山;语义树方法及其可靠性和完备性[J];国防科技大学学报;1994年03期
9 李广原,陈丹;文本信息检索技术[J];广西科学院学报;2001年02期
10 张桂宾;相对程度副词与绝对程度副词[J];华东师范大学学报(哲学社会科学版);1997年02期
中国重要会议论文全文数据库 前1条
1 刘海涛;;影响依存句法分析的因素探讨[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国硕士学位论文全文数据库 前1条
1 李东林;中文信息过滤技术的研究与应用[D];辽宁科技大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 万建成;自然语言句法分析的有界深度控制和早期剪枝[J];软件学报;1995年06期
2 杨思春,陈家骏;汉语自动句法分析中结构歧义分析与研究[J];昆明理工大学学报(理工版);2005年02期
3 邵银波,贺玲,秦江敏;BMP神经网络在句法分析中的运用[J];空军雷达学院学报;2000年04期
4 段建勇;李俊;张梅;马礼;;限定领域的自动问答系统研究[J];北方工业大学学报;2010年01期
5 王鹏,戴新宇,陈家骏,王启祥;基于规则的汉语句法分析方法研究[J];计算机工程与应用;2003年29期
6 吴华;徐甜;;机器翻译中源语分析的研究与探讨[J];安阳工学院学报;2006年02期
7 亓超;张美娜;迟呈英;战学刚;;基于合一的链接文法[J];计算机应用与软件;2008年04期
8 王立群;;依存关系正确理解的基础上的日中翻译[J];电脑知识与技术;2009年28期
9 仲其智;姚建民;;低频词的中文词性标注研究[J];计算机应用与软件;2011年03期
10 王顺迁;叶大兴;;一个并行属性计值算法[J];同济大学学报(自然科学版);1990年04期
中国重要会议论文全文数据库 前10条
1 斯·劳格劳;华沙宝;萨如拉;;基于统计方法的蒙古语依存句法分析模型[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 陈鑫;车万翔;刘挺;;基于主动学习的中文依存句法分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 陈劲光;何婷婷;李芳;桂卓民;;基于概率和句法分析的中文句子修剪[A];第五届全国青年计算语言学研讨会论文集[C];2010年
4 王丹;姬东鸿;黄玮;;一种基于MIRA和遗传算法的句法分析模型构造方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 才藏太;;基于规则的汉藏机器翻译系统中二分法的句法分析方法研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
6 张晓甜;赵海;;基于树结构模式挖掘的非监督中文短语结构句法分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 赵铁军;李生;孟遥;黄玉;杨沐昀;;机器翻译系统中句法分析技术的研究实践[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
8 张浩;刘群;白硕;;结构上下文相关的概率句法分析[A];第一届学生计算语言学研讨会论文集[C];2002年
9 曹海龙;孟遥;李生;赵铁军;;一个改进的头驱动英语句法分析模型[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
10 胡凤国;;一个简单人机对话系统的实现方法[A];第一届学生计算语言学研讨会论文集[C];2002年
中国重要报纸全文数据库 前9条
1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
2 李琨;IBM百度共拓企业搜索[N];中国计算机报;2006年
3 记者 潘竑;企业搜索:激活被遗忘的信息财富[N];金融时报;2006年
4 北京京华英语学校 张占杰;英语培训切勿陷入“名师”误区[N];北京人才市场报;2005年
5 本报记者 霍立峰;中科院免费大餐怎么吃[N];中国高新技术产业导报;2002年
6 ;语言信息处理呼唤知识应用[N];中国计算机报;2003年
7 清华大学外语系 许建平;2005年考研英语阅读、翻译备考要点[N];中国教育报;2004年
8 ;句法语文学科召开工作研讨会[N];中国社会科学院院报;2003年
9 高安市村前中学 龚铁梅;培养学生的英语自学能力[N];宜春日报;2011年
中国博士学位论文全文数据库 前10条
1 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
2 李正华;汉语依存句法分析关键技术研究[D];哈尔滨工业大学;2013年
3 杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;2009年
4 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
5 李军辉;中文句法语义分析及其联合学习机制研究[D];苏州大学;2010年
6 唐秀玲;论话题及其在汉语语法分析中的应用[D];上海师范大学;1997年
7 徐艳华;现代汉语实词语法功能考察及词类体系重构[D];南京师范大学;2006年
8 刘水;融入头—修饰词调序模型的短语统计机器翻译方法研究[D];哈尔滨工业大学;2011年
9 洪淼;现代汉语连动结构研究[D];南京师范大学;2004年
10 吴戈;基于数字水印的文本信息隐藏方法的研究[D];长春理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 皮晓峰;基于概率上下文无关语法的句法分析研究与实现[D];电子科技大学;2005年
2 刘琍;“程度副词+名词”的语义、语用和句法分析[D];四川师范大学;2005年
3 金天;论汉语及英语中否定歧义的消除[D];广东外语外贸大学;2007年
4 尹鹏;基于SVM的中文组块间依存关系分析[D];大连理工大学;2006年
5 张萍;现代汉语标语语法研究[D];南京师范大学;2006年
6 赵德玉;汉语句法分析技术及其在机器人辅助教育智能接口中的应用研究[D];天津师范大学;2004年
7 顾芸;名词短语移位的句法分析[D];南京师范大学;2006年
8 任晓娜;基于统计的汉语依存句法分析研究[D];沈阳航空航天大学;2011年
9 马学喆;依存句法分析的若干关键问题的研究[D];上海交通大学;2013年
10 陈豪;基于句法分析的商品评价情感倾向性分析[D];上海交通大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026