收藏本站
《山东师范大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于校园网的网络信息过滤系统的设计与实现

李欣  
【摘要】:校园网给用户提供便利的同时也带来了危害,大量的不良信息充斥在网络世界里,给高校校园网的管理和维护带来了严重挑战。信息过滤是一种系统化方法,他能够自动的将网络上的动态信息流与过滤模板进行匹配,过滤掉有害信息。 贝叶斯理论在信息过滤中得到了很好的应用,他与KNN、支持向量机等相比,加油高效、节约空间以及有利于实现个性化过滤的优势。但是也存在忽略了特征词之间的联系、忽略误判所带来的风险以及不支持增量学习机制等缺陷。本文针对校园网垃圾和不良信息问题,将朴素贝叶斯引入到信息过滤中,并且针对其存在的问题提出了改进方案,最终构建了基于改进贝叶斯的校园网信息过滤系统。本文主要工作包括: 1、深入研究了网络信息过滤关键技术及相关过滤模型 探讨了信息过滤的一般模型及其相关算法,分析了现有的信息过滤模型中存在的问题,重点研究了网络信息过滤中的网络数据的获取和表示、特征权值的计算方法、文本信息的表示、分类算法等。 2、提出一种对朴素贝叶斯的改进算法 针对传统的朴素贝叶斯算法在对文本信息进行分类与过滤时,没有充分考虑到被过滤信息的个性化特征,具有一定的局限性。因此,本文考虑代价最小化的概念,将其与朴素贝叶斯算法结合起来,并根据被过滤信息的特性做了改进,给出一种改进的朴素贝叶斯文本过滤算法。 3、设计和实现了基于改进贝叶斯算法的校园网信息过滤系统。 我们将改进贝叶斯算法在信息过滤技术上进行了实际效果测试,实验数据证明了算法的可靠性和有效性,取得了令人满意的测试效果。
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP393.09

手机知网App
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026