收藏本站
收藏 | 论文排版

基于主题模型和混合模型的微博客交叉话题发现研究

詹勇  
【摘要】:微博客是一个基于用户关系的信息分享、传播以及获取的平台。微博已经成为互联网上的主要信息源之一。跟其他网络文本不同,微博客内容简单(一般少于140个字)且可以通过各种通讯手段(手机、QQ等)实时发布,容易在短时间内产生大量数据,且这些数据通常数量巨大且杂乱无章,所以很难及时准确地获取感兴趣的信息。 话题发现是自然语言处理领域一个新的研究方向,它能够把属于同一话题下的分散的信息有效的汇集并组织起来,从而帮助用户在大数据中快速准确地找到自己感兴趣的信息。传统基于向量空间模型(VSM)和聚类算法相结合的话题检测算法虽得到广泛的应用,且取得了不错的效果,但应用在大规模微博文本话题发现时仍存在很多不足:一是用特征词表示微博文本会出现维度过高、稀疏、同意问题;二是采用文本聚类的话题发现算法大部分都是基于划分的,没有考虑话题之间的关联性,所以存在一定的局限性。 在上述基础上,针对微博文本的特点,采用主题模型作为文本表示模型。常用的主题模型主要有潜在语义分析LSA (Latent Semantic Analysis)、概率潜在语义分析PLSA (Probability Latent semantic Analysis)和潜在狄里克利分布LDA (Latent Dirichlet Allocation),其中LDA是当前最流行和常用的主题模型,所以本文使用该模型用于提取微博文本隐主题。为了解决传统话题发现算法存在的不足,提出混合模型交叉话题发现算法用于微博交叉话题发现。本文设计完成了微博交叉话题发现系统,在真实数据上的实验结果表明,本文提出的算法具有一定的可行性和有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王泽文;奇异值检验中的混合模型及EM算法[J];武汉大学学报(信息科学版);1990年01期
2 林遂芳,张海英,潘永湘;基于DTW和LVQ网络混合模型的语音识别方法[J];系统仿真学报;2005年08期
3 陈立伟;张晔;;基于改进的隐马尔可夫和神经网络混合模型的语音识别[J];应用声学;2006年02期
4 周宇;覃征;;聚类分析中特征选择的研究[J];计算机应用研究;2006年05期
5 王昕;覃征;韩峰岩;;基于UML的软件可靠性测试用例生成的混合模型[J];西安交通大学学报;2007年04期
6 王林鸿;姜萌;;数控工作台的组成与混合模型[J];南阳理工学院学报;2011年02期
7 陈冬亮;钢铁企业MES中质量控制系统的研究与设计[J];工业控制计算机;2005年06期
8 王祚栋,魏少军;微处理器功能验证的模拟加速方法[J];计算机辅助设计与图形学学报;2005年08期
9 易翔,王蔚然;基于小波域统计混合模型的图像降噪方法[J];电子与信息学报;2005年11期
10 于林森;张田文;;一种结合位置信息的混合模型图像分割方法[J];信号处理;2007年03期
11 宋浩远;;基于模型的聚类方法研究[J];重庆科技学院学报(自然科学版);2008年03期
12 于灏;钟霞;;基于高斯混合模型的多目标跟踪航迹相关算法[J];现代雷达;2008年09期
13 何小阳;李健;闵力;韩宇星;段军霞;;精馏塔的机理-神经网络混合建模[J];控制工程;2009年02期
14 王西锋;张晓孪;;基于混合模型的网络流量预测研究[J];西华大学学报(自然科学版);2009年02期
15 张晴晴;潘接林;颜永红;;基于混合模型状态修正算法的非母语语音识别[J];数字通信;2009年01期
16 郭新明;弋改珍;;混合模型的用户兴趣漂移算法[J];智能系统学报;2010年02期
17 马珺;库亚晓;马福昌;;传感器信号在下水道内传播的信道模型[J];辽宁工程技术大学学报(自然科学版);2010年03期
18 孙晓莹;王秋芬;;一种改进的C/S模式在管理信息系统中的应用[J];现代计算机(专业版);2010年14期
19 章伟;;混合模型在经济时间序列预测中的应用研究[J];计算机仿真;2011年06期
20 张敏,赵猛,贾云得,王俊;基于自适应高斯混合模型的图像稳定方法[J];北京理工大学学报;2004年10期
中国重要会议论文全文数据库 前10条
1 汪传建;李晓光;王大玲;于戈;;一种基于混合模型的文本分类器的研究与实现[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
2 纪琳;黄震宇;;中频振动混合模型理论的应用局限性分析[A];现代振动与噪声技术(第九卷)[C];2011年
3 张胜利;张沅;;混合模型方法对QTL的检测及定位效果[A];生命科学与生物技术:中国科协第三届青年学术年会论文集[C];1998年
4 张文波;蒋春华;姚天昉;;基于贝叶斯及多模式串模糊匹配算法的不良短消息甄别混合模型[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 顾冲时;吴中如;蔡新;;拱坝动态空间位移场的混合模型研究[A];第五届全国结构工程学术会议论文集(第三卷)[C];1996年
6 许世冈;高新陵;;ES-SOFM混合模型及其在水环境评价中的应用[A];新世纪 新机遇 新挑战——知识创新和高新技术产业发展(下册)[C];2001年
7 欧智坚;王作英;;一种基于DDBHMM的利用帧间相关性的混合模型[A];第六届全国人机语音通讯学术会议论文集[C];2001年
8 赵广建;贠超;;基于SVM/HMM混合模型的银行票据识别系统研究[A];《制造业自动化与网络化制造》学术交流会论文集[C];2004年
9 施红英;沈毅;;混合模型在临床试验重复测量资料中的应用[A];应对突发公共卫生事件论坛论文集[C];2005年
10 陈道文;;MLP/HMM混合模型语音识别研究[A];第四届全国人机语音通讯学术会议论文集[C];1996年
中国博士学位论文全文数据库 前10条
1 彭伟才;基于混合模型的中频振动声学分析[D];华中科技大学;2010年
2 沈承;城市供水管网节点混合模型研究[D];浙江大学;2012年
3 杨萌;基于Taxonomy-folkonomy混合模型的社会化标注系统资源聚合研究[D];吉林大学;2014年
4 凌晓亮;混合模型中的随机比较[D];兰州大学;2013年
5 王婵;基于Dirichlet过程混合模型的话题识别与追踪[D];北京邮电大学;2013年
6 李永华;稳健可靠性理论及优化方法研究[D];大连理工大学;2006年
7 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
8 杨庆;空化初生机理及比尺效应研究[D];四川大学;2005年
9 熊太松;基于统计混合模型的图像分割方法研究[D];电子科技大学;2013年
10 贾炜玮;樟子松人工林枝条生长及节子大小预测模型的研究[D];东北林业大学;2006年
中国硕士学位论文全文数据库 前10条
1 许忠好;关于粒子系统的拟平稳测度[D];安徽师范大学;2004年
2 金蓉;神经网络结构优化及混合建模研究[D];北京化工大学;2000年
3 王左;压滤机在精矿选矿中的应用与研究[D];辽宁科技大学;2008年
4 舒凯;与文本无关话者识别算法研究及其DSP系统实现[D];西安理工大学;2005年
5 李莉;半参数混合模型在长期生存者资料分析中的应用[D];山西医科大学;2005年
6 袁磊;基于概率模型的文本聚类[D];吉林大学;2005年
7 汪传建;基于混合模型的文本分类的研究[D];东北大学;2005年
8 杜金阳;油气管线点蚀深度的时间序列预测方法与应用研究[D];西南石油学院;2005年
9 钱峰;混合模型参数估计的研究[D];东南大学;2005年
10 吴茹笑;交易型物流公共信息平台信任模型研究[D];同济大学;2008年
中国重要报纸全文数据库 前10条
1 ;变化中的分支机构[N];网络世界;2007年
2 赵克斌;社会学所举办青年学术论坛[N];中国社会科学院院报;2007年
3 ;统一的时候到了[N];计算机世界;2002年
4 韦乐平;压扁网络构架[N];中国计算机报;2001年
5 本报记者  谢文砚;要重视并行环境开发[N];网络世界;2006年
6 中国PKI论坛 宁家骏;一要发展二要管理[N];计算机世界;2002年
7 ;智能光网络的网络模型[N];人民邮电;2003年
8 ;Web交换新气象[N];网络世界;2000年
9 刘琦编译;对比测试:Chrome对抗IE 8[N];中国计算机报;2008年
10 韩永江;高技能人才薪酬设计方略[N];组织人事报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978