收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

博客意见检索关键问题研究

李茜  
【摘要】:近年来,互联网中意见性信息的价值逐渐受到人们的重视,与此同时,越来越多的科研人员致力于意见检索的研究。博客作为网络中一种含有大量意见性信息的媒体,成为意见检索研究的主要对象之一。如何从海量博客中检索到既与某一主题持续相关又包含意见性信息的博客,即博客意见检索问题,是当前意见检索、数据挖掘等领域的一个研究热点。文本检索会议(Text Retrieval Evaluation Conference,TREC)早在2006年就引入了博客意见检索任务,从此,越来越多的研究人员借助该平台展开了博客意见检索的相关研究并取得了较为丰硕的研究成果,但在博客表示、主题得分和意见得分的融合、意见得分计算等问题上,仍需要进一步探讨。本文针对前人在博客意见检索中遇到的一些关键问题,进行了如下研究:1.针对全局模型对于多主题的局限性和伪簇选择模型参数固定的问题,本文通过分析不同的表示模型,并结合任务特点,提出了一个新的博客表示模型,该模型使用得分最高的前k个博文来表示博客并且k值可随相关博文数量而变化。2.针对传统两阶段处理方案中主题得分和意见得分的融合问题,本文借鉴了前人的博文意见检索框架,将通过贝叶斯方法推导出的生成模型应用到博客意见检索中主题得分和意见得分的融合问题上。3.针对计算意见得分时忽略了与主题相关的意见性信息的问题,本文提出了一种新的意见检索模型:从通用意见词典出发,使用点互信息方法为不同主题扩展不同的情感词,然后使用伪相关反馈技术和语言模型方法来计算博客的意见相关度,该模型不仅在扩展情感词时考虑到了备选词与主题的相关信息,在计算意见得分时也充分考虑了这些信息。本文对上述三种模型分别进行了对比实验,实验结果验证了本文方法的有效性。实验采用TREC 2010提出的主题和数据集进行评测,本文系统的整体实验结果超过了当年TREC的最好结果。此外,本文研究的意见检索方法不需要任何训练数据,因此可以应用到其他类似问题中。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 肖健;徐建;朱姝;万缨;许亮;;基于翻译和语义方法的情感词挖掘研究[J];计算机工程与应用;2011年32期
2 赵鹏;赵志伟;卓景文;;一种情感词语义加权的句子倾向性识别方法[J];计算机工程与应用;2011年35期
3 孙艳;周学广;付伟;;基于依存关联分析的情感词扩展[J];北京邮电大学学报;2012年05期
4 代大明;李寿山;李培峰;朱巧明;;基于情绪词与情感词协作学习的情感分类方法研究[J];计算机科学;2012年12期
5 李勇敢;周学广;孙艳;张焕国;;结合依存关联分析和规则统计分析的情感词库构建方法[J];武汉大学学报(理学版);2013年05期
6 彭庆喜;钱铁云;;基于量化情感的网店垃圾评论检测[J];山东大学学报(理学版);2013年11期
7 杜嘉忠;徐健;刘颖;;网络商品评论的特征–情感词本体构建与情感分析方法研究[J];现代图书情报技术;2014年05期
8 张清亮;徐健;;网络情感词自动识别方法研究[J];现代图书情报技术;2011年10期
9 黄俊;田生伟;禹龙;冯冠军;;基于维吾尔语情感词的句子情感分析[J];计算机工程;2012年09期
10 孙劲光;马志芳;孟祥福;;基于情感词属性和云模型的文本情感分类方法[J];计算机工程;2013年12期
11 柳位平;朱艳辉;栗春亮;向华政;文志强;;中文基础情感词词典构建方法研究[J];计算机应用;2009年10期
12 魏志生;吉阳生;罗春勇;陈家骏;;加入领域先验知识的产生式情感分类模型[J];计算机科学与探索;2011年12期
13 唐晓波;肖璐;;基于情感分析的评论挖掘模型研究[J];情报理论与实践;2013年07期
14 杨立公;樊孝忠;朱俭;;利用语义词典的情感词快速识别[J];计算机工程与设计;2013年08期
15 任远;巢文涵;周庆;李舟军;;基于话题自适应的中文微博情感分析[J];计算机科学;2013年11期
16 王勇;吕学强;姬连春;肖诗斌;;基于极性词典的中文微博客情感分类[J];计算机应用与软件;2014年01期
17 苏杰;缪裕青;刘少兵;吴孔玲;;基于语义倾向计算器的情感分析方法[J];桂林电子科技大学学报;2012年04期
18 张珊;于留宝;胡长军;;基于表情图片与情感词的中文微博情感分析[J];计算机科学;2012年S3期
19 周胜臣;瞿文婷;石英子;施询之;孙韵辰;;中文微博情感分析研究综述[J];计算机应用与软件;2013年03期
20 佘莉;夏虎;傅彦;;音乐评论的情感挖掘研究[J];计算机科学;2009年05期
中国重要会议论文全文数据库 前5条
1 陈奇哲;刘全升;姚天昉;;汉语意见型语句主题与情感关系抽取的研究[A];第五届全国信息检索学术会议论文集[C];2009年
2 孙慧;关毅;董喜双;;中文情感词倾向消歧[A];第六届全国信息检索学术会议论文集[C];2010年
3 段秀婷;何婷婷;宋乐;;基于PMI-IR算法的Blog情感分类研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
4 李先斌;袁平波;俞能海;;基于局部最优的情感标签图像自动标注算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
5 王枞;涂序彦;刘嘉;;注意-情绪协调的个性化信息推荐模型[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
中国博士学位论文全文数据库 前7条
1 董喜双;基于免疫多词主体自治学习的情感分析研究[D];哈尔滨工业大学;2013年
2 寇广增;基于意见挖掘通用框架的情感极性强度模糊性研究[D];武汉大学;2010年
3 杨玉珍;基于Web评论信息的倾向性分析关键技术研究[D];山东师范大学;2014年
4 黄胜;Web评论文本的细粒度意见挖掘技术研究[D];北京理工大学;2014年
5 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
6 施寒潇;细粒度情感分析研究[D];苏州大学;2013年
7 李芳;面向中文Web评论的观点挖掘关键技术研究[D];华中师范大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978