收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于支持向量机的文本分类方法研究

李强  
【摘要】: 计算机与通讯技术的飞速发展迫切需要有效的分类方法对信息资源进行分类,而传统的分类方法又存在着费时费力等缺点,这就使得文本的自动分类越来越受人们的重视,支持向量机和文本分类问题有着良好的结合点,从而使得基于支持向量机的文本分类成为这个领域的研究热点。支持向量机是一种基于结构风险最小化准则的分类学习机模型,它的应用十分广泛。虽然支持向量机算法的性能在许多实际问题的应用中得到了验证,但是还存在着一些需要改进的地方,如:训练算法速度慢、测试阶段运算量大等。 本文在研究文本分类和支持向量机理论的基础上,针对支持向量机在样本数目较多时其训练速度较慢的问题,用聚类方法处理支持向量机的训练样本,减少训练样本个数,提高支持向量机的训练速度;同时,针对支持向量机在样本维数较高时其训练和分类速度较慢的问题,用哈尔小波变换对训练样本和分类样本向量进行降维处理,降低支持向量机在模型训练和分类测试阶段的运算量,有效提高训练和分类的时间效率。本文在分析实验数据的基础上对上述两种方法的应用效果做了总结。聚类分析和小波变换都是对支持向量机用向量表示的样本进行加工处理。从应用的出发点来看,二者的目的都是为了提高训练和分类的时间效率,不同之处在于聚类分析使用的策略是降低样本的数量,小波变换使用的策略则是降低向量的维数;从应用的效果来看,小波变换的效果要好于聚类分析,虽然二者都在一定程度上降低了训练和分类时间,但小波变换能够更好的保证分类的准确率。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张晓煜;史军勇;;基于支持向量机的快速人脸检测[J];福建电脑;2007年08期
2 张晓煜;赵秀英;李向;;基于小波变换和支持向量机的人脸检测[J];微计算机信息;2007年34期
3 卢祖友;桑永胜;;基于球向量机的中文文本分类[J];计算机工程与科学;2008年12期
4 郝海涛;;基于向量机的文本分类中词典结构研究[J];福建电脑;2009年03期
5 朱斌;胡双俊;;基于支持向量机(SVM)的电力电子故障诊断[J];控制工程;2009年S1期
6 王彦明;奉永桃;奉国和;;1999-2008年我国SVM文本分类文献计量分析[J];图书情报工作;2009年20期
7 吴守用;;基于SVM的哈萨克语文本分类初探[J];现代计算机(专业版);2010年04期
8 赵延平;谢丽聪;;面向电信领域的文本分类研究[J];计算机与现代化;2011年02期
9 张恒;周杰;惠建新;;支持向量机在步态识别算法中的应用研究[J];计算机仿真;2011年03期
10 吴巧敏;林亚平;;一种基于重复训练的支持向量机方法[J];计算机工程与应用;2007年31期
11 冀胜利;李波;;基于SVM的中文文本分类算法[J];重庆工学院学报(自然科学版);2008年07期
12 闫超;;基于改进的SVM线性可分文本分类算法[J];电脑开发与应用;2010年08期
13 张玉峰;何超;;基于潜在语义分析和HS-SVM的文本分类模型研究[J];情报理论与实践;2010年07期
14 陈立孚,周宁,李丹;基于机器学习的自动文本分类模型研究[J];现代图书情报技术;2005年10期
15 陈志坚;朱峰;李峰;;一种基于小波过零检测和SVM的虹膜识别方法[J];计算机应用研究;2006年05期
16 张伟;邹汉斌;雷红艳;刘琼;;一种基于正例的SVM分类方法[J];江南大学学报(自然科学版);2007年01期
17 熊忠阳;杜圣东;张玉芳;;一种改进的支持向量机邮件分类器[J];计算机科学;2007年09期
18 刘怀亮;张治国;赵捧未;;中文文本分类反馈学习研究[J];情报理论与实践;2009年06期
19 刘秀松;;基于改进的SVM文本分类建模[J];情报理论与实践;2007年06期
20 赖敏;;支持向量机及其应用研究[J];成功(教育);2010年03期
中国重要会议论文全文数据库 前10条
1 朱慕华;朱靖波;陈文亮;;面向支持向量机的降维方法比较分析[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
2 卢卫雄;;一种基于支持向量机的多国语言文本分类平台[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
3 张瑞民;袁震东;;基于小波变换和支持向量机的心电图分类[A];2004中国控制与决策学术年会论文集[C];2004年
4 叶淳铮;常鲜戎;;基于小波变换和支持向量机的电力系统短期负荷预测[A];中国高等学校电力系统及其自动化专业第二十四届学术年会论文集(中册)[C];2008年
5 曹菲菲;朱慕华;朱靖波;;基于抽样的两阶段支持向量机训练算法[A];第三届学生计算语言学研讨会论文集[C];2006年
6 高荣;刘晓华;;基于小波变换的支持向量机短期负荷预测[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
7 徐科;邹科举;;基于小波变换和支持向量机的军事目标检测[A];第三届中国智能计算大会论文集[C];2009年
8 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
9 王志刚;赖丽娟;吴效明;熊冬生;;基于小波变换和支持向量机的急性低血压预测方法研究[A];中国生物医学工程学会成立30周年纪念大会暨2010中国生物医学工程学会学术大会壁报展示论文[C];2010年
10 龚妙昆;万福永;许建强;袁震东;;心电图小波压缩特征提取及SVM分类分析[A];2005中国控制与决策学术年会论文集(下)[C];2005年
中国博士学位论文全文数据库 前10条
1 秦玉平;基于支持向量机的文本分类算法研究[D];大连理工大学;2008年
2 王强;基于声信号检测的管道TPD预警系统研究[D];浙江大学;2005年
3 平源;基于支持向量机的聚类及文本分类研究[D];北京邮电大学;2012年
4 杜小芳;基于CPFR的农产品采购模型研究[D];华中科技大学;2005年
5 刘育明;动态过程数据的多变量统计监控方法研究[D];浙江大学;2006年
6 栾锋;支持向量机(SVM)和径向基神经网络(RBFNN)方法在化学、环境化学和药物化学中的应用研究[D];兰州大学;2006年
7 孙薇;市场条件下抽水蓄能电站效益综合评价及运营模式研究[D];华北电力大学(河北);2007年
8 常群;支持向量机的核方法及其模型选择[D];哈尔滨工业大学;2007年
9 朱燕飞;锌钡白回转窑煅烧过程智能建模研究[D];华南理工大学;2005年
10 田英杰;支持向量回归机及其应用研究[D];中国农业大学;2005年
中国硕士学位论文全文数据库 前10条
1 李强;基于支持向量机的文本分类方法研究[D];西安科技大学;2009年
2 张滨;中文文档分类技术研究[D];武汉大学;2004年
3 崔彩霞;基于支持向量机的文本分类方法研究[D];山西大学;2005年
4 牛肖潇;支持向量机及用于文本分类的研究[D];武汉理工大学;2006年
5 徐华;基于支持向量机的Web文本挖掘研究[D];哈尔滨工程大学;2004年
6 于海龙;面向PU问题的文本分类的研究与实现[D];吉林大学;2005年
7 马忠宝;基于支持向量机的中文文本分类系统研究[D];武汉理工大学;2006年
8 杨丽华;基于内容的垃圾邮件过滤技术研究[D];西南交通大学;2006年
9 邹丹;基于Web的中文文本分类的研究与实现[D];中国地质大学(北京);2006年
10 代亮;基于支持向量机的文本分类问题研究[D];大连海事大学;2007年
中国重要报纸全文数据库 前10条
1 吴玉田殷学平;中药质量控制又添新武器——小波变换近红外光谱分析系统[N];中国医药报;2004年
2 广西 陈华杰;EVD,一路走好[N];电子报;2002年
3 北京航空航天大学计算机系 李炜;探寻视频编码技术发展的足迹[N];中国计算机报;2000年
4 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
5 陈尔香;在烟草化学王国里驰骋[N];经理日报;2006年
6 课题主持人 李心丹 课题协调人 上海证券交易所 施东晖 傅浩 课题研究员 宋素荣 查晓磊 宾红辉 张许宏 郭静静 黄隽 南京大学工程管理学院;内幕交易与市场操纵的行为动机与判别监管研究[N];中国证券报;2007年
7 ;能否利用潮汐预测地震[N];科技日报;2008年
8 李水根;计算机详解配伍与药效关系[N];健康报;2005年
9 清华大学 苏光大;非接触式人脸识别技术[N];计算机世界;2006年
10 YMG记者 李仁 通讯员 曲华明 孙运智;我市九项目进入省“盘子”[N];烟台日报;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978