收藏本站
《郑州大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

贝叶斯分类器研究及其在Web文档分类中的应用

侯小静  
【摘要】:Web上的信息资源有着海量、动态、异构、半结构化等显著特点,由于缺乏统一的组织和管理而显得杂乱无章,给Web检索带来了一定的困难。使用Web文档自动分类技术可以更加有效地组织和管理Web资源,提高信息检索的效率,它目前已成为Web挖掘的研究热点之一。 作为数据挖掘中的重要分类算法,贝叶斯分类器有着易于实现、工作效率高等优点。本文从贝叶斯网络入手,研究了各种基于贝叶斯网络的分类器的工作原理,按照网络中属性结点间的依赖关系将分类模型归纳为三类,重点讨论了其中有代表性的分类器的学习方法,并用贝叶斯分类器为工具研究Web文档的分类问题。 网页是Web信息的主要表现形式,其绝大多数以HTML文档形式存在。本文首先分析了Web页面的组织特点,对文本自动分类中使用到的向量空间模型、分词、特征选择等关键技术进行了深入的探讨,并实现了一个多项式朴素贝叶斯分类器对中文网页进行分类。文中在大量实验的基础上对文档频率、信息增益、互信息、开方拟和检验、文本证据权、期望交叉熵、优势率等七种文本特征选择方案进行了对比研究与分析。针对于单分类器的弱点,提出利用两种组合分类技术Boosting与Bagging实现多个文本分类器的集成以提高分类的准确率,并通过实验证实了组合方案的有效性。 最后,本文讨论了一种使用贝叶斯网络对半结构化的Web文档进行表示和分类的方法。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张小红;张倩;;一种基于Bayesian的图像分类算法[J];计算机应用与软件;2009年09期
2 曹玲玲;潘建寿;;基于Fisher判别分析的贝叶斯分类器[J];计算机工程;2011年10期
3 苏中,张宏江,马少平;基于贝叶斯分类器的图像检索相关反馈算法[J];软件学报;2002年10期
4 文桥;王卫平;;基于改进贝叶斯算法的入侵检测方法[J];计算机工程;2006年12期
5 董立岩;苑森淼;刘光远;贾书洪;;基于贝叶斯分类器的图像分类[J];吉林大学学报(理学版);2007年02期
6 李锦善;王志海;王中锋;;一种基于假设检验的贝叶斯分类器[J];计算机工程与应用;2008年21期
7 耿姝;秦玉平;;结合SVM与Bayesian为不带类别标记的兼类文本分类[J];科技信息(科学教研);2008年21期
8 丁厉华;张小刚;;一种基于类支持度的增量贝叶斯学习算法[J];计算机工程;2008年22期
9 张琼;;基于贝叶斯方法的高考成绩类别预测[J];太原师范学院学报(自然科学版);2009年02期
10 董立岩;李真;阎鹏飞;;基于贝叶斯分类器的重大危险源辨识[J];吉林大学学报(理学版);2009年04期
11 汪霞;郑宁;徐明;陈默;;基于中文变形词匹配的贝叶斯邮件过滤模型[J];计算机应用与软件;2010年01期
12 李红彪;张洪业;;QPSO算法在朴素贝叶斯分类上的应用研究[J];哈尔滨理工大学学报;2010年04期
13 薛静锋;曹元大;;贝叶斯分类在入侵检测中的应用研究[J];计算机科学;2005年08期
14 陈景年;黄厚宽;田凤占;乔珠峰;;一种基于不完整数据的朴素贝叶斯分类器[J];计算机工程;2006年17期
15 周立兵;柳景超;;贝叶斯理论在垃圾邮件过滤中的应用分析[J];网络安全技术与应用;2006年11期
16 张家勇;刘建辉;;基于中文分词技术的信息智能过滤系统[J];信息技术;2006年12期
17 应晓槟;吴炜;滕奇志;杨晓敏;朱强军;;基于Dirichlet分布的贝叶斯分类算法的手写数字字符识别[J];电子测量技术;2007年02期
18 连国云;刘辉;邓彬;;基于贝叶斯分类在人脸识别应用中的研究与实现[J];山西电子技术;2007年06期
19 李芳;钟映春;张毅;戚剑;刘小林;;神经切片图像中识别定位线断面的研究[J];计算机工程与应用;2010年22期
20 蒋方纯;赵静;诸振家;;机器学习在个性化网络课程学习中的应用分析[J];深圳信息职业技术学院学报;2010年04期
中国重要会议论文全文数据库 前10条
1 岳全中;朱永利;;基于朴素贝叶斯分类器的电流互感器状态评估[A];中国高等学校电力系统及其自动化专业第二十四届学术年会论文集(上册)[C];2008年
2 孟中强;卢锦玲;;基于贝叶斯分类器的暂态稳定评估方法研究[A];中国高等学校电力系统及其自动化专业第二十四届学术年会论文集(上册)[C];2008年
3 吴铭;徐蔚然;郭军;;基于统计的中文标点识别算法研究[A];第八届全国汉字识别学术会议论文集[C];2002年
4 田京雷;毕胜;;基于视频的客流计数系统的研究[A];第十二届全国图象图形学学术会议论文集[C];2005年
5 吴崇斌;张全;;上下文边界可变的贝叶斯分类器词义消歧方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
6 程泽凯;泰锋;;贝叶斯网络分类器结构学习:基于启发式的G2算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
7 杨源;马云龙;林鸿飞;;基于权重标准化SimRank与半监督学习的产品属性归类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 李庆奇;马莉;;基于小波能量的轮廓抖动性烟雾检测算法[A];浙江省电子学会2011学术年会论文集[C];2011年
9 秦文政;马莉;;基于视觉显著性和小波分析的烟雾检测方法[A];浙江省信号处理学会2011学术年会论文集[C];2011年
10 徐蔚然;于武贵;郭军;;基于统计方法的混排文字切分与分类[A];第八届全国汉字识别学术会议论文集[C];2002年
中国博士学位论文全文数据库 前10条
1 张聪;基于信度网的不确定性推理、学习与分类研究[D];重庆大学;2005年
2 董立岩;贝叶斯网络应用基础研究[D];吉林大学;2007年
3 卢锦玲;电力系统暂态脆弱性评估及连锁故障跳闸预测研究[D];华北电力大学(河北);2009年
4 李永丽;应急平台建设若干问题研究[D];吉林大学;2010年
5 梁大为;视频运动对象跟踪技术研究[D];哈尔滨工业大学;2010年
6 李超群;名词性属性距离度量问题及其应用研究[D];中国地质大学;2012年
7 郭烁;DNA信号序列分析的基因预测方法研究[D];大连海事大学;2010年
8 邵非;基于位置感知的移动信息服务若干关键技术研究[D];华东师范大学;2012年
9 安百国;关于模型稀疏性的研究[D];东北师范大学;2012年
10 杨磊;转录因子结合位点和动物毒素的分析与预测[D];内蒙古大学;2010年
中国硕士学位论文全文数据库 前10条
1 高岩;朴素贝叶斯分类器的改进研究[D];华南理工大学;2011年
2 余民杰;贝叶斯网络分类器与应用[D];云南财经大学;2012年
3 王国才;朴素贝叶斯分类器的研究与应用[D];重庆交通大学;2010年
4 施轶青;监督学习下的贝叶斯分类器研究[D];西安电子科技大学;2011年
5 郑宏;贝叶斯分类器在汽车发动机喷射故障诊断中的应用研究[D];重庆大学;2011年
6 左红江;基于样本定邻域概率的贝叶斯分类器[D];河北大学;2013年
7 范彦勤;基于贝叶斯分类器的个人信用评估研究[D];西安电子科技大学;2014年
8 王影;L1正则化的贝叶斯分类器研究及在陨石坑检测中的应用[D];合肥工业大学;2012年
9 钟骏;朴素贝叶斯分类法在氡预测应用中的初步研究[D];中国地质大学(北京);2013年
10 张步良;基于贝叶斯的神经元分类[D];重庆交通大学;2012年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978