收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

支持向量机分类方法及其在文本分类中的应用研究

赵晖  
【摘要】:支持向量机作为一种基于统计学习理论的新型机器学习方法,较好地解决了非线性、高维数、局部极小点等实际问题,是机器学习领域新的研究热点。文本分类是基于内容的自动信息管理的核心技术。文本向量稀疏性大、维数高、特征之间具有较大的相关性,支持向量机对于特征相关性和稀疏性不敏感,处理高维数问题具有较大的优势,因此,支持向量机非常适用于文本分类问题,在文本分类中具有很大的应用潜力。但是,同时,文本分类也给支持向量机提出了许多富有挑战性的课题。例如,文本分类具有类别和样本数目多、噪音多等特点,支持向量机用于文本分类时存在训练和分类速度较慢等缺点。本文主要针对支持向量机在文本分类等实际应用中存在的问题进行深入研究,主要工作如下: 1、支持向量机是针对两类分类问题提出的,如何将其有效地推广到多类分类仍是一个尚未完全解决的问题。分析了现有支持向量机多类分类方法的特点,并给出了一种半模糊核聚类算法,在此基础上,根据树型支持向量机的特性,提出了一种基于半模糊核聚类的树型支持向量机多类分类方法。该方法基于半模糊核聚类算法挖掘不同类别之间的衔接和离散信息,设计树型支持向量机的树型结构,克服其差错积累问题。实验表明,与其它支持向量机多类分类方法相比,该方法具有较高的分类精度和训练速度,提高了支持向量机在多类分类问题中的应用效果。 2、针对标准支持向量机对噪音敏感,分类时倾向于样本数目较多的类别的问题,给出一种模糊支持向量机的推广模型,并在此基础上,结合近似支持向量机的优势,提出了一种支持向量机组合分类方法。该方法首先采用近似支持向量机快速地去除非支持向量、减少训练样本数目、确定样本权值和模型参数,然后在样本数目较少的训练集上,依据选择好的模型参数和样本权值训练模糊支持向量机的推广模型。实验表明,该方法能有效确定样本权值,减少训练时间,并克服野值点和类别训练样本数目不均衡对分类器的不利影响。 3、通常情况下,支持向量的数目越多,支持向量机的分类速度越慢,如何缩减支持向量集合、提高支持向量机的分类速度是支持向量机的重要研究内容之一。在分析了现有支持向量集合缩减方法的基础上,提出了一种基于虚样本与支持向量回归的支持向量集合缩减方法。该方法是根据支持向量集合和支持向量回归方法的特性,对


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 郝继升;;基于支持向量回归机和B样条网络回归曲线建模算法[J];江西科学;2007年01期
2 郝继升;;一种建立回归曲线模型的新算法[J];河南科学;2007年02期
3 谢波;刘连旺;;支持向量机在GPS高程异常中的应用[J];测绘科学;2011年01期
4 郭雪松;孙林岩;刘哲;;基于半模糊核聚类的模糊超球支持向量机多类分类方法[J];系统管理学报;2007年06期
5 崔彩霞;张朝霞;;文本分类方法对比研究[J];太原师范学院学报(自然科学版);2007年04期
6 赵培;牛纪桢;史金艳;;改进的SVM在语音识别文本分类中的应用[J];广西师范大学学报(自然科学版);2009年01期
7 郝继升;;基于LS-SVR的回归曲线建模[J];江西科学;2007年05期
8 耿姝;秦玉平;;结合SVM与Bayesian为不带类别标记的兼类文本分类[J];科技信息(科学教研);2008年21期
9 杨玫;赵秀丽;刘瑜;;时间序列预测问题中小波分解的应用研究[J];信息技术与信息化;2011年02期
10 匡琳;;支持向量机在文本分类中的应用的概述[J];科技资讯;2008年36期
11 张军峰;胡寿松;;基于聚类和支持向量机的非线性时间序列故障预报[J];控制理论与应用;2007年01期
12 袁玉萍;于晓秋;侯丽英;;支持向量机模型在区域经济预测中的应用及评价[J];黑龙江八一农垦大学学报;2009年01期
13 翟文华,陆文聪,刘旭,陈念贻,王国庆;(Zr_(0.7)Sn_(0.3))TiO_4陶瓷性能预报的支持向量回归模型[J];应用科学学报;2005年06期
14 崔彩霞;王素格;;基于粗集的支持向量机文本分类方法研究[J];科技广场;2006年08期
15 那健;丁大伟;丁俊松;;支持向量机的多类分类算法[J];科技咨询导报;2007年29期
16 袁玉萍;;基于线性规划的K-SVCR支持向量机[J];山西大学学报(自然科学版);2009年02期
17 阳庆;秦志远;周丽雅;杨安洪;;近似支持向量机高光谱图像分类方法研究[J];海洋测绘;2009年05期
18 孔波;郑喜英;;支持向量机多类分类方法研究[J];河南教育学院学报(自然科学版);2010年02期
19 赵有星;李琳;;基于支持向量机的多类分类算法研究[J];科技信息(科学教研);2007年29期
20 汪洋;陈友利;刘军;莫智文;王甲锋;;基于相似方向的二叉树支持向量机多类分类算法[J];四川师范大学学报(自然科学版);2008年06期
中国重要会议论文全文数据库 前10条
1 朱慕华;朱靖波;陈文亮;;面向支持向量机的降维方法比较分析[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
2 卢卫雄;;一种基于支持向量机的多国语言文本分类平台[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
3 曹菲菲;朱慕华;朱靖波;;基于抽样的两阶段支持向量机训练算法[A];第三届学生计算语言学研讨会论文集[C];2006年
4 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
5 刘晓勇;;基于GA与SVM融合的网页分类算法[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年
6 栾江;唐常杰;黄晓冬;阴小雄;廖勇;;一种增量式支持向量机文本分类模型[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
7 闫晓飞;陈良臣;孙功星;;支持向量机多类分类算法的研究[A];第13届全国计算机、网络在现代科学技术领域的应用学术会议论文集[C];2007年
8 荣海娜;张葛祥;张翠芳;;基于支持向量机的非线性系统辨识方法[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
9 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 曹巍;赵英凯;高世伟;;基于模糊核聚类的多类支持向量机[A];2009中国过程系统工程年会暨中国mes年会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 赵晖;支持向量机分类方法及其在文本分类中的应用研究[D];大连理工大学;2006年
2 田英杰;支持向量回归机及其应用研究[D];中国农业大学;2005年
3 秦玉平;基于支持向量机的文本分类算法研究[D];大连理工大学;2008年
4 邢永忠;最小二乘支持向量机的若干问题与应用研究[D];南京理工大学;2009年
5 武国正;支持向量机在湖泊富营养化评价及水质预测中的应用研究[D];内蒙古农业大学;2008年
6 檀敬东;文本挖掘的若干关键算法研究[D];中国科学技术大学;2010年
7 何广杰;克隆选择算法及其在地基工程若干问题中的应用[D];西南交通大学;2007年
8 舒云星;水泥烧成系统故障诊断与质量预测支持向量机方法的研究[D];武汉理工大学;2008年
9 谭显胜;支持向量回归解释性体系的建立及应用[D];湖南农业大学;2010年
10 余艳芳;改进型支持向量回归机及其在过程建模与控制中的应用[D];华东理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 许晓晴;基于SVM的文本分类算法研究[D];吉林大学;2008年
2 谭冠群;基于多类软间隔支持向量机的文本分类问题研究[D];哈尔滨理工大学;2008年
3 张滨;中文文档分类技术研究[D];武汉大学;2004年
4 杜圣东;基于多类支持向量机的文本分类研究[D];重庆大学;2007年
5 崔彩霞;基于支持向量机的文本分类方法研究[D];山西大学;2005年
6 牛肖潇;支持向量机及用于文本分类的研究[D];武汉理工大学;2006年
7 李强;基于支持向量机的文本分类方法研究[D];西安科技大学;2009年
8 徐华;基于支持向量机的Web文本挖掘研究[D];哈尔滨工程大学;2004年
9 于海龙;面向PU问题的文本分类的研究与实现[D];吉林大学;2005年
10 马忠宝;基于支持向量机的中文文本分类系统研究[D];武汉理工大学;2006年
中国重要报纸全文数据库 前10条
1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
2 李水根;计算机详解配伍与药效关系[N];健康报;2005年
3 课题主持人 李心丹 课题协调人 上海证券交易所 施东晖 傅浩 课题研究员 宋素荣 查晓磊 宾红辉 张许宏 郭静静 黄隽 南京大学工程管理学院;内幕交易与市场操纵的行为动机与判别监管研究[N];中国证券报;2007年
4 高利华;传承陆游风骨 推进国际交流[N];人民日报海外版;2005年
5 清华大学 苏光大;非接触式人脸识别技术[N];计算机世界;2006年
6 YMG记者 李仁 通讯员 曲华明 孙运智;我市九项目进入省“盘子”[N];烟台日报;2010年
7 上海大学理学院教授、副院长 陆文聪;酷爱化学 孜孜以求[N];中国化工报;2006年
8 ;选择合适的数据挖掘算法[N];计算机世界;2007年
9 周颖;王米渠与中医心理学[N];中国中医药报;2006年
10 记者 张云普通讯员 全攀峰 安强强;大庆物探深度域地震资料岩性解释技术获得五大突破[N];中国石油报;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978