收藏本站
《上海交通大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于特定领域的汉语句子意见挖掘

李林琳  
【摘要】: 英特网上的信息与日剧增,蕴藏着巨大的信息量。对产品的各种评价出现在各大论坛、电子公告板以及门户网站上,厂商需要了解顾客使用其产品的反馈意见,潜在的购买者也需要做出是否购买某个产品的决定。因此,意见挖掘技术应运而生。本文实现了一个基于领域的汉语句子意见挖掘系统(OMS)。该系统主要解决了意见挖掘问题中的主题识别、陈述定界和极性分析三个子问题。系统主要包含基于模式匹配的陈述选择模块和基于核函数的意见分析模块。在陈述选择模块中,我们提出了基于SPD n与SND n特征选择的单一/混合意见句识别算法,介绍了基于汽车本体的主题抽取的过程,并说明了混合意见倾向句陈述的细颗粒度分析方法。我们提出了基于“投影映射”规则的模式生成策略,以及直接模式、结点模式、混合模式三种匹配策略。针对意见倾向分析模块我们提出了基于核的意见分类思想,它通过计算输入陈述之间的极性相似度对句子的极性进行识别。通过良好的核函数定义,基于核的方法能够从上下文和句法层面捕获极性信息,从而可以提高分类的准确率。
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP391.1

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 邵晓良,刘红;Web主题信息采集中信息主题的识别[J];现代图书情报技术;2004年10期
2 刘娇蛟,龚丽,李建华;基于本体实现对网页文本的自动主题分类[J];计算机工程;2003年11期
3 邵晓良,刘红;Web信息采集中军事主题信息的识别[J];情报杂志;2004年07期
4 王晓斌;温春;石昭祥;;基于贝叶斯信息准则的文本主题数估计[J];计算机工程;2009年07期
5 刘军;姚天昉;;基于Wikipedia的语义相关度计算[J];计算机工程;2010年19期
6 余传明;陈雷;张小青;;基于支持向量机的产品属性识别研究[J];情报学报;2010年06期
7 仇光;郑淼;张晖;朱建科;卜佳俊;陈纯;杭航;;基于正则化主题建模的隐式产品属性抽取[J];浙江大学学报(工学版);2011年02期
8 郭霄峰,吴杰宏,张玉杰,高福祥;基于NDIS中间层驱动的信息防火墙设计实现[J];沈阳航空工业学院学报;2003年02期
9 夏斌;丁立;乔红波;高瑞;;中文农业信息垂直搜索引擎的设计与实现[J];河南农业大学学报;2010年06期
10 李娟;张全;贾宁;;中文词语倾向性分析处理[J];计算机工程与应用;2009年02期
中国重要会议论文全文数据库 前10条
1 丁秉公;黄昌宁;黄德根;;文本主题识别研究及应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 陈文亮;朱靖波;姚天顺;张宇新;;基于Bootstrapping的领域词汇自动获取[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 陈文亮;朱靖波;姚天顺;;企业网络监管系统CNM的设计与实现[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
4 刘全升;姚天昉;黄高辉;刘军;宋鸿彦;;汉语意见型主观性文本类型体系的研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 姚天昉;张霄凯;;一种网络非规范汉语词汇的识别方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 蔡健平;林世平;;基于机器学习的词语和句子极性分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 郝博一;夏云庆;郑方;;OPINAX:一个有效的产品属性挖掘系统[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
8 夏云庆;郝博一;徐睿峰;;意见目标网络与意见目标抽取研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 吴晨;宋丹;薛德军;师庆辉;;科技主题识别及表示[A];第五届全国信息检索学术会议论文集[C];2009年
10 郭燕慧;王枞;钟义信;;语言认知与主题内容识别[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
中国博士学位论文全文数据库 前1条
1 刘健;基于近似文本分析的意见挖掘[D];上海大学;2007年
中国硕士学位论文全文数据库 前10条
1 李林琳;基于特定领域的汉语句子意见挖掘[D];上海交通大学;2008年
2 王军利;科技英语语篇的主题识别[D];中国海洋大学;2005年
3 岳笑峥;基于领域本体的意见挖掘系统[D];北京邮电大学;2008年
4 郭谢;基于Web Community识别的专业搜索引擎研究[D];浙江大学;2006年
5 宋鸿彦;基于主动学习的语料自动标注方法研究[D];上海交通大学;2010年
6 秦宏宇;网络舆情热点发现相关技术研究[D];哈尔滨工程大学;2010年
7 梁文婷;汉语文本主题分析技术的研究与实现[D];重庆大学;2008年
8 尹航;基于特定领域汉语意见型问答系统的研究[D];上海交通大学;2009年
9 张国梁;专项主题新闻自动检索方法研究与应用[D];中国科学技术大学;2011年
10 周杰;网络舆情话题情感倾向性分析技术研究[D];解放军信息工程大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026