收藏本站
《山东大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

多类文本分类的支持向量机网络

孟祥国  
【摘要】: 基于统计学习理论的支持向量机算法具有坚实的数学理论基础和严格的理论分析,具有理论完备、全局优化、适应性强、推广能力好等优点,是机器学习中的一种新方法和研究新热点。它使用结构风险最小化原则,综合了统计学习、机器学习和神经网络等方面技术,在最小化经验风险的同时,有效地提高了算法泛化能力。它与传统的机器学习方法相比,具有良好的潜在应用价值和发展前景。 本文通过分析和总结现有的几种典型支持向量机算法,提出了一种新的组合SVM新构架,对其算法的性能和应用作了深入研究。主要工作包括: (1)对文本分类的概念、分类技术进行系统地介绍。 (2)系统地研究了支持向量机的求解方法。主要有支持向量机的二次规划求解法、选块法、分解法、序列最小优化方法、基于Lagrange函数的迭代求解方法即Lagrange支持向量机、基于Smoothing处理的牛顿求解方法。这些方法是通过求解凸二次规划问题或将大规模问题转化成若干子问题再求解凸二次规划问题,或者是转化为无约束最优化问题再利用比较成熟的最优化方法求解。通过对它们的分析,为提出新的支持向量机算法提供了理论基础。 (3)支持向量机原本是为二类分类问题设计的,现在许多研究人员将其推广到多类分类问题上。本文全面总结了目前存在的基于支持向量机的多类别分类方法,包括“一对多”方法、“一对一”方法、一次性求解方法、决策有向无环图方法、基于二叉树的支持向量机多类分类方法,比较了它们的优缺点及性能,提出了一种新的组合SVM的构架。 (4)最后,结合文本分类过程和支持向量机方法,设计并实现了一个基于支持向量机新构架的中文文本分类系统。该系统分类效果的评价采用分类问题研究领域普遍采用的查准率、查全率和F测度值等指标。实验结果表明,该系统的这些评判指标总体上的平均值都很高,具有较好的分类效果。
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP18

【引证文献】
中国硕士学位论文全文数据库 前4条
1 荣建文;基于RS-SVM的Web中文文本自动分类研究[D];东北财经大学;2010年
2 叶琳;基于SVM的网络流量异常检测系统研究[D];云南大学;2010年
3 刘文;基于聚类算法和支持向量机算法的文本分类算法研究[D];江苏科技大学;2012年
4 谢林燕;话题检测与跟踪关键技术研究[D];华北电力大学;2012年
【参考文献】
中国期刊全文数据库 前6条
1 李静梅,孙丽华,张巧荣,张春生;一种文本处理中的朴素贝叶斯分类器[J];哈尔滨工程大学学报;2003年01期
2 李荣陆,胡运发;基于密度的kNN文本分类器训练样本裁剪方法[J];计算机研究与发展;2004年04期
3 余芳;一个基于朴素贝叶斯方法的web文本分类系统:WebCAT[J];计算机工程与应用;2004年13期
4 刘斌,黄铁军,程军,高文;一种新的基于统计的自动文本分类方法[J];中文信息学报;2002年06期
5 陈治纲,何丕廉,孙越恒,郑小慎;基于向量空间模型的文本分类系统的研究与实现[J];中文信息学报;2005年01期
6 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期
【共引文献】
中国期刊全文数据库 前10条
1 王东霞;张楠;路晓丽;;基于育种算法的SVM参数优化[J];安徽大学学报(自然科学版);2009年04期
2 杨绪兵,韩自存;ε不敏感的核Adaline算法及其在图像去噪中的应用[J];安徽工程科技学院学报(自然科学版);2003年04期
3 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
4 许高程;张文君;王卫红;;支持向量机技术在遥感影像滑坡体提取中的应用[J];安徽农业科学;2009年06期
5 程伟;张燕平;赵姝;;支持向量机在粮食产量预测中的应用[J];安徽农业科学;2009年08期
6 武素华;;基于最小二乘支持向量机的土壤含水量检测的研究与分析[J];安徽农业科学;2009年09期
7 陈念;沈佐民;;基于化学成分检测和SVM分类的茶叶品质鉴定[J];安徽农业科学;2010年15期
8 郭立萍;唐家奎;米素娟;张成雯;赵理君;;基于支持向量机遥感图像融合分类方法研究进展[J];安徽农业科学;2010年17期
9 管翠萍;;药物靶标G蛋白偶联受体的识别预测[J];安徽农业科学;2010年24期
10 刘婷婷;;基于支持向量机的水稻纹枯病识别研究[J];安徽农业科学;2011年28期
中国重要会议论文全文数据库 前10条
1 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
2 宋海鹰;桂卫华;阳春华;;基于核偏最小二乘的简约最小二乘支持向量机及其应用研究[A];第二十六届中国控制会议论文集[C];2007年
3 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
4 ;A Novel Proximal Support Vector Machine and Its Application in Radar Target Recognition[A];第二十六届中国控制会议论文集[C];2007年
5 顾小军;杨世锡;钱苏翔;;基于支持向量机的旋转机械多类故障识别研究[A];第二十六届中国控制会议论文集[C];2007年
6 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
7 姜明辉;袁绪川;;基于GA优化的个人信用评估SVM模型[A];第二十六届中国控制会议论文集[C];2007年
8 韩露;余正涛;邓锦辉;章程;毛存礼;郭剑毅;;领域知识关系对领域文本分类的影响[A];第二十七届中国控制会议论文集[C];2008年
9 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
10 蒋少华;桂卫华;阳春华;唐朝晖;蒋朝辉;;基于主元分析与支持向量机的方法及其在密闭鼓风炉过程监控诊断中的应用[A];第二十七届中国控制会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
2 母丽华;煤矿安全预警系统的方法研究[D];哈尔滨工程大学;2010年
3 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
4 朱广平;混响干扰中的信号检测技术研究[D];哈尔滨工程大学;2009年
5 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
6 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
7 柏坚;非线性数学地质模型研究及在滇东南金矿成矿预测中的应用[D];中国地质大学(北京);2010年
8 姚志明;基于步态触觉信息的身份识别研究[D];中国科学技术大学;2010年
9 张昌明;新疆汉族、维吾尔族及哈萨克族食管癌血清蛋白质指纹图谱研究[D];新疆医科大学;2010年
10 陈志国;基于群体智能的机器视觉的关键技术研究[D];江南大学;2010年
中国硕士学位论文全文数据库 前10条
1 展慧;基于多源信息融合技术的板栗分级检测方法研究[D];华中农业大学;2010年
2 杜二玲;拟概率空间上等均值噪声下统计学习理论的理论基础[D];河北大学;2007年
3 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
4 王丽敬;地理案例的空间相似性计算[D];山东科技大学;2010年
5 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
6 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
7 安文娟;Fisher和支持向量综合分类器[D];辽宁师范大学;2010年
8 姜成玉;基于支持向量机的时间序列预测[D];辽宁师范大学;2010年
9 江达秀;基于HMAX模型的人脸表情识别研究[D];浙江理工大学;2010年
10 姜念;区间自适应粒子群算法研究及其应用[D];郑州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 周宏宇;张政;;中文分词技术综述[J];安阳师范学院学报;2010年02期
2 杨晓懿,刘嘉勇,陈淑敏;SVM在文本自动分类中的应用[J];成都信息工程学院学报;2005年02期
3 刘祥楼;张淼;刘得军;姜继玉;;基于支持向量机的文本分类方法[J];大庆石油学院学报;2008年02期
4 卢辉斌;谭龙;王昱;;支持向量机在入侵检测中的应用[J];电子测量技术;2008年02期
5 唐祖贵;;基于多级支持向量机的网络入侵检测研究[J];计算机安全;2009年08期
6 姜园,张朝阳,仇佩亮,周东方;用于数据挖掘的聚类算法[J];电子与信息学报;2005年04期
7 刘海峰;王元元;刘守生;;一种组合型中文文本分类特征选择方法[J];广西师范大学学报(自然科学版);2007年04期
8 张家勇;刘建辉;;基于中文分词技术的信息智能过滤系统[J];信息技术;2006年12期
9 赵华;赵铁军;张姝;王浩畅;;基于内容分析的话题检测研究[J];哈尔滨工业大学学报;2006年10期
10 张红梅;高海华;王行愚;;构造稀疏最小二乘支持向量机的网络入侵检测模型[J];华东理工大学学报(自然科学版);2008年06期
中国博士学位论文全文数据库 前10条
1 张春华;支持向量机中最优化问题的研究[D];中国农业大学;2004年
2 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
3 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
4 贾银山;支持向量机算法及其在网络入侵检测中的应用[D];大连海事大学;2004年
5 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
6 李忠伟;支持向量机学习算法研究[D];哈尔滨工程大学;2006年
7 邹柏贤;网络流量异常检测与预测方法研究[D];中国科学院研究生院(计算技术研究所);2003年
8 杜卫锋;粗糙集理论在中文文本分类中的应用[D];西南交通大学;2006年
9 满江虹;基于粗糙集的分类知识发现方法及其应用研究[D];东南大学;2005年
10 陈贞翔;具有规模适应性的互联网流量识别方法研究[D];山东大学;2008年
中国硕士学位论文全文数据库 前10条
1 刘胜利;基于SVM的网络入侵检测研究[D];大连海事大学;2004年
2 虞玲玲;基于文本分类的话题跟踪及其一元语法模型的应用[D];南京理工大学;2005年
3 沈永坚;IP网络流量特征分析与测量方法研究[D];湖南大学;2005年
4 薛宇玲;支持向量机在煤矿地下水位预测中的应用[D];西安科技大学;2006年
5 甘立国;中文文本分类系统的研究与实现[D];北京化工大学;2006年
6 庞剑锋;基于向量空间模型的自反馈的文本分类系统的研究与实现[D];中国科学院研究生院(计算技术研究所);2001年
7 石佑红;基于支持向量机的文本分类的研究[D];北京交通大学;2007年
8 高洁;网络流量异常检测[D];电子科技大学;2007年
9 于瑞萍;中文文本分类相关算法的研究与实现[D];西北大学;2007年
10 阎丽红;基于粗糙集和粒度计算的数据库的分析研究[D];中北大学;2007年
【二级引证文献】
中国期刊全文数据库 前2条
1 张登银;廖建飞;;基于相对熵的网络流量异常检测方法[J];南京邮电大学学报(自然科学版);2012年05期
2 马卫;;神经网络在网络入侵检测中的应用[J];网友世界;2013年11期
中国硕士学位论文全文数据库 前3条
1 宋静;SVM与AdaBoost算法的应用研究[D];大连海事大学;2011年
2 廖建飞;网络流量的异常检测与业务类型识别方法的研究[D];南京邮电大学;2013年
3 祖丽湖玛尔·马木提江;维吾尔语区分性关键词提取算法研究及其性能分析[D];新疆大学;2013年
【二级参考文献】
中国期刊全文数据库 前8条
1 李晓黎,刘继敏,史忠植;概念推理网及其在文本分类中的应用[J];计算机研究与发展;2000年09期
2 秦进,陈笑蓉,汪维家,陆汝占;文本分类中的特征抽取[J];计算机应用;2003年02期
3 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
4 刘少辉,董明楷,张海俊,李蓉,史忠植;一种基于向量空间模型的多层次文本分类方法[J];中文信息学报;2002年03期
5 吴军,王作英,禹锋,王侠;汉语语料的自动分类[J];中文信息学报;1995年04期
6 邹涛,王继成,黄源,张福炎;中文文档自动分类系统的设计与实现[J];中文信息学报;1999年03期
7 黄萱菁;吴立德;;基于向量空间模型的文档分类系统[J];模式识别与人工智能;1998年02期
8 卢增祥,李衍达;交互支持向量机学习算法及其应用[J];清华大学学报(自然科学版);1999年07期
【相似文献】
中国期刊全文数据库 前10条
1 田盛丰,黄厚宽;基于支持向量机的数据库学习算法[J];计算机研究与发展;2000年01期
2 张铃;支持向量机理论与基于规划的神经网络学习算法[J];计算机学报;2001年02期
3 阎辉,张学工,李衍达;支持向量机与最小二乘法的关系研究[J];清华大学学报(自然科学版);2001年09期
4 朱国强,刘士荣,俞金寿;支持向量机及其在函数逼近中的应用[J];华东理工大学学报;2002年05期
5 侯风雷,王炳锡;基于支持向量机的说话人辨认研究[J];通信学报;2002年06期
6 马永军,方凯,刘暾东,方廷健;基于支持向量机和方差的管道内表面粗糙度等级识别[J];信息与控制;2002年05期
7 吴飞,庄越挺,潘云鹤;基于增量学习支持向量机的音频例子识别与检索[J];计算机研究与发展;2003年07期
8 孙延风,梁艳春;支持向量机的数据依赖型核函数改进算法[J];吉林大学学报(理学版);2003年03期
9 朱永生,张优云;支持向量机分类器中几个问题的研究[J];计算机工程与应用;2003年13期
10 朱家元,吴伟,张恒喜,董彦非;一种新型的多元分类支持向量机[J];计算机工程;2003年17期
中国重要会议论文全文数据库 前10条
1 林杰华;张斌;李冬森;宋华茂;余志强;王浩;;支持向量机在电力客户信用评级中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
2 蒋铁军;张怀强;李积源;;多变量系统预测的支持向量机方法研究[A];管理科学与系统科学研究新进展——第7届全国青年管理科学与系统科学学术会议论文集[C];2003年
3 黄淑云;孙兴玉;梁汝萍;邱建丁;;基于小波支持向量机预测蛋白质亚细胞定位研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
4 谢湘;匡镜明;;支持向量机在语音识别中的应用研究[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
5 涂冬成;薛龙;刘木华;赵进辉;沈杰;吁芳;;基于支持向量机的鹅肉肉色客观评定研究[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年
6 杨凌;刘玉树;;基于支持向量机的坦克识别算法[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
7 师旭超;巴松涛;;基于支持向量机方法的深基坑变形预测[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(上册)[C];2004年
8 张军;;支持向量机方法在地下水位干扰排除中的初步应用[A];2007年地震流体学术研讨会论文摘要集[C];2007年
9 许建生;盛立东;;基于改进的支持向量机和BP神经网络的识别算法[A];第八届全国汉字识别学术会议论文集[C];2002年
10 荣海娜;张葛祥;张翠芳;;基于支持向量机的非线性系统辨识方法[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 课题主持人 李心丹 课题协调人 上海证券交易所 施东晖 傅浩 课题研究员 宋素荣 查晓磊 宾红辉 张许宏 郭静静 黄隽 南京大学工程管理学院;内幕交易与市场操纵的行为动机与判别监管研究[N];中国证券报;2007年
2 李水根;计算机详解配伍与药效关系[N];健康报;2005年
3 清华大学 苏光大;非接触式人脸识别技术[N];计算机世界;2006年
4 YMG记者 李仁 通讯员 曲华明 孙运智;我市九项目进入省“盘子”[N];烟台日报;2010年
5 上海大学理学院教授、副院长 陆文聪;酷爱化学 孜孜以求[N];中国化工报;2006年
6 ;选择合适的数据挖掘算法[N];计算机世界;2007年
7 周颖;王米渠与中医心理学[N];中国中医药报;2006年
8 记者 张云普通讯员 全攀峰 安强强;大庆物探深度域地震资料岩性解释技术获得五大突破[N];中国石油报;2008年
9 本报记者 冯治恩;敢与“雷公”试比高[N];铜川日报;2008年
10 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年
中国博士学位论文全文数据库 前10条
1 刘叶青;原始空间中支持向量机若干问题的研究[D];西安电子科技大学;2009年
2 常甜甜;支持向量机学习算法若干问题的研究[D];西安电子科技大学;2010年
3 胡运红;支持向量机的若干算法研究[D];山东科技大学;2011年
4 周喜川;非可信环境下的支持向量机研究[D];浙江大学;2010年
5 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
6 王开义;基于支持向量机的农产品生产关键控制点发现研究[D];北京工业大学;2011年
7 王超;三类不确定支持向量机及其应用[D];河北大学;2013年
8 杜小芳;基于CPFR的农产品采购模型研究[D];华中科技大学;2005年
9 刘育明;动态过程数据的多变量统计监控方法研究[D];浙江大学;2006年
10 栾锋;支持向量机(SVM)和径向基神经网络(RBFNN)方法在化学、环境化学和药物化学中的应用研究[D];兰州大学;2006年
中国硕士学位论文全文数据库 前10条
1 刘艳伟;支持向量机方法在感潮河段洪峰水位预报中的应用[D];浙江大学;2010年
2 杨镭;支持向量机算法设计及在高分辨雷达目标识别中的应用[D];国防科学技术大学;2010年
3 童振;基于支持向量机的电解液成分预测[D];东北大学;2008年
4 聂小芳;模糊粗糙集与支持向量机在煤与瓦斯突出预测中的应用研究[D];辽宁工程技术大学;2009年
5 鄢常亮;基于支持向量机的高炉向凉向热炉况预测研究[D];内蒙古科技大学;2010年
6 韩叙东;基于支持向量机的水电故障分类器的设计与实现[D];东北大学;2008年
7 冯杰;慢时变对象的支持向量机建模与在线校正方法研究[D];东北大学;2009年
8 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
9 王奇安;基于广泛内核的CVM算法研究及参数C的选择[D];南京航空航天大学;2009年
10 张永新;基于支持向量机和遗传算法相结合的模拟电路故障诊断方法研究[D];东北大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026