收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于朴素贝叶斯的文本分类研究及其在微博分类中的应用

李偲  
【摘要】:现在新浪微博的注册用户达到10亿以上,微博数据有着非常巨大的潜在价值,但是目前对这些大量的数据并没有进行管理分类,整体上还是比较杂乱的,很多有用信息都需要我们进行挖掘,本文通过朴素贝叶斯分类方法对微博数据进行分类,数据处理的结果应该会有很大的商业价值。本文主要做的工作从宏观上来讲就是进行文本分类,从上世纪60年代开始,人们就开始研究文本分类,初期的文本分类主要是基于知识工程(Knowledge Engineering),通过人工定义一些规则来给文本分门别类,这种方法不仅非常耗时耗力,而且要求人们必须对某一领域有足够的了解,才能够写出比较合适的规则。到上世纪90年代,网上电子文本使用的非常多,机器学习也很流行,基于机器学习的文本自动分类方法逐渐成为主流。文本分类的方法有很多种,其中朴素贝叶斯(Na?ve Bayes)分类器是当前被广泛接受的一种文本分类方法,也是本文对微博数据进行分类所用的方法。本文首先对文本分类的过程及方法进行简单的介绍,并且细化到介绍一些特征提取方法,如文档频次方法、TF-IDF方法等,同时对基于朴素贝叶斯方法的文本分类原理进行详细的研究,并运用文档频次方法、TF-IDF两种提取特征方法对朴素贝叶斯分类器进行训练,将得到的结果进行比较,最后对文本分类这项研究内容进行展望。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 钱颖能;胡运发;;用朴素贝叶斯分类法选股[J];计算机应用与软件;2007年06期
2 欧阳泽华;郭华平;范明;;在逐渐缩小的空间上渐进学习朴素贝叶斯参数[J];计算机应用;2012年01期
3 裴亚辉;熊盛武;;朴素贝叶斯及其扩展模型[J];网络安全技术与应用;2007年08期
4 赵彦琦;谢小西;荀宇畅;;朴素贝叶斯分类法的应用[J];电子制作;2013年07期
5 菅小艳;崔彩霞;;基于朴素贝叶斯的文本分类[J];电脑开发与应用;2013年12期
6 王实;高文;;增强型朴素贝叶斯学习[J];计算机科学;2000年04期
7 杨忠强;秦亮曦;;一种基于属性加权的朴素贝叶斯改进算法[J];广西大学学报(自然科学版);2013年05期
8 张彩丽;杨帆;张玉杰;;柴油机供油系统状态的朴素贝叶斯诊断方法研究[J];计算机测量与控制;2008年08期
9 白耀辉;陈明;王举群;;利用朴素贝叶斯方法实现异常检测[J];计算机工程与应用;2005年34期
10 王双成;冷翠平;侯彩虹;;操作风险等级预测的朴素贝叶斯方法研究[J];计算机工程与应用;2008年12期
11 谭小球;;基于朴素贝叶斯方法的数字化学习过程评价[J];现代计算机(专业版);2008年07期
12 安艳辉;董五洲;游自英;;基于改进的朴素贝叶斯文本分类研究[J];河北省科学院学报;2007年01期
13 李柏生;林亚平;鄢喜爱;;基于朴素贝叶斯网络的入侵检测分析[J];网络安全技术与应用;2007年09期
14 姜立标;马乐;余建伟;刘永花;;多阶段聚类—朴素贝叶斯的异常检测[J];重庆大学学报;2009年08期
15 杨光祖;王国军;;一种新的朴素贝叶斯属性选择算法[J];科学技术与工程;2009年04期
16 王小丽;远俊红;;基于加权朴素贝叶斯分类法的成绩预测模型[J];电子技术与软件工程;2013年19期
17 周文刚;金鑫;;基于树扩展朴素贝叶斯的高效网络入侵检测系统[J];北京师范大学学报(自然科学版);2007年01期
18 曾文赋;;样本-属性加权的朴素贝叶斯改进算法[J];微型机与应用;2014年06期
19 林国;;基于朴素贝叶斯的农业土地适宜性评价算法设计[J];杭州师范大学学报(自然科学版);2010年02期
20 江小平;李成华;向文;张新访;;云计算环境下朴素贝叶斯文本分类算法的实现[J];计算机应用;2011年09期
中国重要会议论文全文数据库 前3条
1 石志伟;吴功宜;;改善朴素贝叶斯在文本分类中的稳定性[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 李海军;王钲旋;王利民;苑森淼;;基于主成分分析提升朴素贝叶斯[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
3 李毅;顾健;顾铁军;;基于朴素贝叶斯方法的邮件样本预筛选[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
中国硕士学位论文全文数据库 前9条
1 胡为成;基于遗传算法的朴素贝叶斯分类研究[D];合肥工业大学;2006年
2 李偲;基于朴素贝叶斯的文本分类研究及其在微博分类中的应用[D];北京理工大学;2015年
3 刘勇华;基于朴素贝叶斯的中文段落情感分析[D];太原理工大学;2015年
4 周龙;基于朴素贝叶斯的分类方法研究[D];安徽大学;2006年
5 王翔;基于朴素贝叶斯和One-R的入侵检测问题研究[D];合肥工业大学;2008年
6 周远阳;基于朴素贝叶斯方法的新闻分类系统的实现[D];暨南大学;2012年
7 李忠波;基于改进朴素贝叶斯的蛋白质提纯方法选择[D];大连理工大学;2014年
8 孙秀亮;基于属性加权的选择性朴素贝叶斯分类研究[D];哈尔滨工程大学;2013年
9 华林森;中文文本情感分类研究[D];重庆大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978