收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

XML Engine安全网关语义过滤的研究与实现

吴红娟  
【摘要】: 在庞杂的互联网信息中,不良信息以各种不同的方式,通过多种途径从不同的方面对人们造成了不良影响。因此,必要和有效的不良信息过滤对于建设健康、安全的互联网环境显得尤为重要。但是,传统的文本信息过滤算法仅能从结构对应的层次上进行判断,而无法实现文本的语义,很难满足当今信息智能化的要求。 本课题结合计算语言学知识,提出并实现了一种语义分析的过滤方法,对于那些不能通过关键字匹配过滤而漏掉的长文本信息,通过语义分析,可以进行很好地鉴别处理,从而有效的防止大量不良垃圾信息的散播。 本课题的先进性如下:1、针对各种自动分词方法中出现的问题,改进了具有自学习机制的智能词典的概念,并实现了智能词典的基本模型。该模型在分词的同时,实现了对新词的自学习功能,不需要人工干预,很好地完成了系统的智能性。分词算法采用正向和逆向最大匹配方法相结合的特点,分词的准确率大大提高,同时,配合词频库,能够有效地消解分词歧义,也是对分词准确率的进一步保证。2、通过对特征值算法的深入研究,基于TFIDF的特征值提取算法,在TFIDF稳定性的基础上引入词性系数来改善特征集的选取效果。采用潜在语义标注的方法,对不同词性的特征乘以不同的词性系数,突出不同词性的特征表示文档类别的能力,以减轻文本分类器的工作量,进一步提高处理的速度和效果。3、通过对几种主要的分类器算法的研究,依据贝叶斯算法性能高,复杂度低的特点,并针对项目的实际情况,批量大、速度快、分类种类少的特点,提出一套基于朴素贝叶斯算法的分类器模型,利用特征值的词性系数,利用统计方法对待分类文本进行训练分类。试验证明,该分类器算法具有很高的查全与查准率,为整个语义过滤模块的过滤质量提供了有效的保障。 论文研究成果已经应用到国家支撑计划、广东省科技项目XML Engine安全网关上。在整个XML Engine中加入本课题的语义过滤模块,极大的阻止了对大量不良信息的智能过滤,进一步保证了整个XML Engine的安全性能。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 林建;张帆;;网络不良信息过滤研究[J];情报理论与实践;2007年04期
2 姚磊岳;熊建英;;一种基于中文分词算法的信息过滤技术[J];科技广场;2007年07期
3 范士勇;肖胜刚;李博;安海宁;;基于分词索引的全文检索技术介绍[J];电脑知识与技术(学术交流);2007年17期
4 张帆;杨炳儒;;基于语义语言的网络信息过滤技术[J];微计算机信息;2007年12期
5 徐义峰;蒋慧新;周浩;;基于Web的信息过滤模型研究[J];商场现代化;2006年31期
6 王俊生;施运梅;张仰森;;基于Hadoop的分布式搜索引擎关键技术[J];北京信息科技大学学报(自然科学版);2011年04期
7 杜阿宁,方滨兴,胡铭曾,云晓春;中文交互式网络搜索引擎及其自学习能力[J];计算机工程与应用;2003年10期
8 ;华为3Com安全网关构建客户化的VPN网络[J];计算机安全;2004年06期
9 小球;惊涛骇浪,屹立不倒——双墙防护重庆沙区教委[J];网络与信息;2004年12期
10 贾美娟;李娟;;基于分级匹配的信息过滤研究[J];大庆师范学院学报;2007年05期
11 阿呆;;Blue Coat:复合型Web安全网关提供云安全[J];通讯世界;2009年12期
12 ;方正熊猫硬件安全网关应用案例[J];网络安全技术与应用;2004年12期
13 王锟月;;安全网关结合端点安全——Check Point推出Connectra 2.0[J];每周电脑报;2005年04期
14 ;联想网御承担国家级火炬计划项目 打造自主知识产权综合安全网关[J];每周电脑报;2008年16期
15 ;趋势科技与戴尔签订全球OEM协议持续其在硬件安全网关市场策略[J];信息网络安全;2008年11期
16 ;Blue Coat领导网络内容安全网关产品市场[J];计算机安全;2009年02期
17 汪海航,李琼,葛勤耕;安全VPN网关服务器的配置管理[J];同济大学学报(自然科学版);2003年08期
18 ;惊涛骇浪,屹立不倒——双墙防护重庆沙区教委[J];信息安全与通信保密;2004年12期
19 段红;;无间协作 打造天清汉马[J];计算机安全;2006年05期
20 ;Hillstone发布创新一代桌面级高性能智能安全网关[J];电信技术;2008年07期
中国重要会议论文全文数据库 前10条
1 徐润华;陈小荷;;一种利用注疏的《左传》分词新方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 张增军;肖军模;;一种数据库安全网关系统的研究与设计[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 李怡平;吴飞;;多语言环境下的分布式互联网分词平台[A];第十六届全国数据库学术会议论文集[C];1999年
4 ;安全网关节能技术[A];电子信息节能技术与产品推广应用专集[C];2009年
5 赵伟;路永刚;吴琼;;一种新的基于BMM和RMM分词方法的研究与实现[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
6 张玉连;张波;张敏;;改进的个性化信息推荐系统的设计与实现[A];2005年全国理论计算机科学学术年会论文集[C];2005年
7 张小兵;李靖;;试论信息过滤技术的发展趋势[A];第十八次全国计算机安全学术交流会论文集[C];2003年
8 赵文兵;杨冬青;廖湖声;;关键字在XML模式中的结构特征研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
9 徐冰;姚建民;杨沐昀;赵铁军;;汉语分词在机器翻译评价中的影响[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 陈丽江;;ACL-SIGHAN第一届国际中文分词竞赛评述[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 黄建年;农业古籍的计算机断句标点与分词标引研究[D];南京农业大学;2009年
2 梁金宝;藏语历史文献词汇统计研究[D];中国社会科学院研究生院;2013年
3 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
4 侯锋;中文报业出版的文字质量智能辅助控制技术研究[D];国防科学技术大学;2010年
5 李东方;Web 2.0环境下互联网信息过滤理论与方法研究[D];中国科学技术大学;2009年
6 费晓飞;空间通信协议安全性研究[D];解放军信息工程大学;2008年
7 何儒汉;Web图像的多模融合检索研究[D];华中科技大学;2007年
8 喻梅;基于P2P系统的分布式查询算法的研究[D];天津大学;2008年
9 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
10 姚崎;高性能可信区域边界防护体系结构及关键技术[D];北京交通大学;2011年
中国硕士学位论文全文数据库 前10条
1 吴红娟;XML Engine安全网关语义过滤的研究与实现[D];电子科技大学;2009年
2 徐佳;基于IP和VPN安全网关的设计实现[D];中国科学院研究生院(软件研究所);2002年
3 姜文;Linux下VPN安全网关实现技术研究[D];浙江大学;2005年
4 鲍洪生;IPSec协议研究及基于Linux的安全网关的实现[D];南京理工大学;2004年
5 陈科;基于XML和Web Service的XML Engine中过滤的实现[D];电子科技大学;2006年
6 陈蓓;基于嵌入式Linux安全网关的实现[D];西南交通大学;2003年
7 刘怀英;基于分布式并行计算的搜索引擎的研究与设计[D];武汉理工大学;2005年
8 陈雪松;3G移动通信系统网关技术研究[D];大庆石油学院;2003年
9 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
10 屈浩然;基于Linux的数据转发平台的研究与应用[D];西北工业大学;2003年
中国重要报纸全文数据库 前10条
1 ;上海安达通SGW 25C 安全网关[N];中国计算机报;2006年
2 刘宏伟;Servgate 做高性能安全网关[N];中国计算机报;2003年
3 Hillstone山石网科副总裁 赵彦利;新一代多核安全网关瞄准应用可视化[N];中国计算机报;2009年
4 本报记者 王军;安全网关替代防火墙将成趋势[N];通信产业报;2010年
5 广西福利彩票发行中心 林岗;安全网关确保数据安全[N];中国计算机报;2004年
6 张戈;CP Secure:安全网关市场急需“降”噪[N];电脑商报;2007年
7 特约撰稿 李昕;ServGate 模块化安全网关护航厦门海关[N];通信信息报;2004年
8 赵晓涛;安全网关死机成难题[N];网络世界;2007年
9 韩勘;Secure Computing Web安全网关点评[N];计算机世界;2008年
10 戈;联想网御发布万兆安全网关产品[N];电脑商报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978