收藏本站
收藏 | 论文排版

基于稀疏贝叶斯模型的文本分类方案研究

燕荣江  
【摘要】:文本分类是按照一定的分类标准进行自动的标记分类的。这种智能化的分类使得我们无需通过文本的表达等信息,就能从中得知后面的文本是否是自己所需要的。文本分类一般包括文本的表达、分类器的选择、分类结果的评价和反馈等过程。随着网络技术的发展,自动文本成为行业先驱以及各种智能化、个性化的搜索引擎,并且在许多领域独领风骚。文章不仅对部分特征提取的工作做了细化,还对各种算法和一些基本概念以及分类器的选择作出了说明,并对文本分类的问题进行了剖析并说明其优缺点,以及如何更好的应用它们。其次,针对各种算法存在的弊端提出了稀疏贝叶斯概率模型,使其能够更好的适应文本分类的需要,并完善相关的技术。再次,通过判断收缩因子的类密度以及相关的性质,给出了必要的证明和解释。稀疏贝叶斯概率模型大大提升了文本分类的准确度,使人力成本大幅降低。我们还利用了统计学习的办法,对分类器进行了有效的分类,最后对各类分类器的优缺点进行了评价,指明了模型的用途和相应的局限性。现今,统计方法已成为文本分类领域的主要方法以及明确的标准,这样应用起来更加的得心应手。我们采用的稀疏贝叶斯模型不仅降低了文本分类的计算量,还提高了文本分类的速度。我们的实验结果表明,稀疏贝叶斯模型在大数据方面优于传统的模型的算法,不仅有效的提高了查重率和分类速度,还更好的实现面向对象的准确率。


知网文化
【相似文献】
中国期刊全文数据库 前15条
1 伍杰华;;基于树状朴素贝叶斯模型的社会网络关系预测[J];计算机应用;2013年11期
2 程岚岚,何丕廉,孙越恒;基于朴素贝叶斯模型的中文关键词提取算法研究[J];计算机应用;2005年12期
3 吴陈;王万川;;基于原型的EM朴素贝叶斯模型在直接营销中的应用[J];计算机应用与软件;2012年09期
4 周珵岑;;单声部音乐节奏感知的贝叶斯模型[J];科技视界;2013年26期
5 杜艳明;韩冰;肖建华;;基于贝叶斯模型的IP网拥塞链路诊断算法[J];计算机应用;2012年02期
6 朱立;;基于稀疏贝叶斯模型的视频恢复方法研究[J];中山大学学报(自然科学版);2012年05期
7 郭炜强,文军,文贵华;基于贝叶斯模型的专利分类[J];计算机工程与设计;2005年08期
8 崔超;崔连和;;贝叶斯模型在垃圾文本分类中的应用研究[J];北京石油化工学院学报;2013年03期
9 陈祥叶;蔡理;王森;崔焕卿;汪志春;;基于贝叶斯模型的QCA扇出结构转换特性[J];微纳电子技术;2014年02期
10 石琼豪;马莉;邹绍芳;;基于视觉双通路与贝叶斯模型的烟雾检测方法[J];杭州电子科技大学学报;2012年05期
11 傅博;王晅;马建峰;;基于三分类的击键序列身份认证[J];计算机应用;2007年01期
12 杨国鹏;周欣;余旭初;;稀疏贝叶斯模型与相关向量机学习研究[J];计算机科学;2010年07期
13 刘明;葛磊;丁丽丽;任洪强;谢文蔚;;污水随机排污的不确定性研究[J];计算机应用与软件;2010年12期
14 张媛媛;;一种基于非参数贝叶斯模型的聚类算法[J];宁波大学学报(理工版);2013年04期
15 ;[J];;年期
中国重要会议论文全文数据库 前5条
1 曾勇;唐小我;;无偏组合预测的贝叶斯模型及其分析[A];1996中国控制与决策学术年会论文集[C];1996年
2 何彬;姜明艳;王程飞;赵卉;王先龙;;基于分子指纹的朴素贝叶斯模型预测小分子直接作用靶标[A];中国化学会第28届学术年会第14分会场摘要集[C];2012年
3 高丽君;;基于贝叶斯模型平均生存模型的中小企业信用风险估计[A];第十四届中国管理科学学术年会论文集(上册)[C];2012年
4 石琼豪;马莉;邹绍芳;;基于视觉双通路与贝叶斯模型的烟雾检测方法[A];浙江省电子学会2012学术年会论文集[C];2012年
5 刘信恩;肖世富;莫军;;复杂数值模拟的贝叶斯模型确认框架及其简化[A];中国力学学会学术大会'2009论文摘要集[C];2009年
中国硕士学位论文全文数据库 前10条
1 高艳滨;基于贝叶斯模型更新的结构损伤识别方法改进及应用[D];中国地震局工程力学研究所;2015年
2 李杨;基于增量贝叶斯模型的自助挂号系统研究[D];北方工业大学;2016年
3 陈伟;基于贝叶斯模型的云服务QoS预测和保障研究[D];江苏大学;2016年
4 李云瑞;相关贝叶斯模型在非寿险准备金中的应用[D];郑州大学;2016年
5 燕荣江;基于稀疏贝叶斯模型的文本分类方案研究[D];辽宁师范大学;2016年
6 苏乐群;稀疏贝叶斯模型在分类与回归上的研究与应用[D];南京航空航天大学;2015年
7 马欣;基于预测似然的贝叶斯模型平均及其在电力负荷预测中的应用[D];重庆师范大学;2010年
8 陈慧;基于贝叶斯模型的微博虚假话题数据分析研究[D];山东大学;2013年
9 李明景;基于ARMA-稀疏贝叶斯模型的汇率预测研究[D];合肥工业大学;2014年
10 邓志超;类别归纳推理贝叶斯模型的实验研究[D];北京工业大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978