收藏本站
《吉林大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于SVM的文本分类算法研究

许晓晴  
【摘要】: 文本分类是数据挖掘研究的一个热点,支持向量机分类方法在文本分类中表现出了良好的性能。 但是支持向量机是针对两类分类问题提出的,而在实际应用中多类分类问题更为普遍,如何将它推广到多类分类一直是重要研究内容之一。 本文对已有算法进行了深入研究,在传统算法的基础上,结合了本体知识,给出了一种新的基于概念向量的树型支持向量机多类分类方法,并加以实现,与其它方法作一比较。 与传统方法抽取关键词构成向量不同,该方法抽取的是概念向量。训练时,先对训练数据进行两类聚类,构造二值SVM分类器,层层进行下去,形成一棵二叉树的结构。对测试数据进行分类的时候,从树根开始调用二值分类器,直到到达叶结点。 实验表明,使用概念向量进行聚类和分类提高了准确率。在本实验中,分类正确率提高了2%左右。而且,由于维数的降低,聚类速度和训练速度都得到了提高。
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP18

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 周靖;;改进偏二叉树多类SVM的文本分类[J];广东石油化工学院学报;2011年04期
2 沈友文;赵新建;徐俊;;一种改进的集中度和分散度文本特征选择算法[J];计算机应用与软件;2011年09期
3 张玉峰;何超;;基于语义空间和SVM的竞争情报分类分析模型研究[J];情报杂志;2011年06期
4 黎超;吴义国;魏星;;基于主成分分析的SMO文本分类[J];现代计算机(专业版);2011年10期
5 贾世杰;孔祥维;;一种新的直方图核函数及在图像分类中的应用[J];电子与信息学报;2011年07期
6 李旻松;段琢华;;基于支持向量机的隐含语意特征选择方法[J];计算机应用;2011年09期
7 汪正中;张洪渊;;基于英文博客文本的情感分析研究[J];计算机技术与发展;2011年08期
8 孟佳娜;林鸿飞;李彦鹏;;基于特征贡献度的特征选择方法在文本分类中应用[J];大连理工大学学报;2011年04期
9 梁爽;张立坡;;熵权核函数支持向量机[J];科技致富向导;2011年20期
10 郭成芳;;支持向量机在网络异常入侵检测中的应用研究[J];计算机仿真;2011年07期
中国重要会议论文全文数据库 前10条
1 朱慕华;朱靖波;陈文亮;;面向支持向量机的降维方法比较分析[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
2 卢卫雄;;一种基于支持向量机的多国语言文本分类平台[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
3 曹菲菲;朱慕华;朱靖波;;基于抽样的两阶段支持向量机训练算法[A];第三届学生计算语言学研讨会论文集[C];2006年
4 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
5 刘晓勇;;基于GA与SVM融合的网页分类算法[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年
6 栾江;唐常杰;黄晓冬;阴小雄;廖勇;;一种增量式支持向量机文本分类模型[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
7 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 杜长海;吉根林;;模糊聚类的最大树法在文本分类中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
9 刘秉权;李博;孙林;王宝勋;刘远超;;标签特征和正文特征融合的SVM博客文本分类算法研究[A];第六届全国信息检索学术会议论文集[C];2010年
10 林杰华;张斌;李冬森;宋华茂;余志强;王浩;;支持向量机在电力客户信用评级中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
中国重要报纸全文数据库 前10条
1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
2 课题主持人 李心丹 课题协调人 上海证券交易所 施东晖 傅浩 课题研究员 宋素荣 查晓磊 宾红辉 张许宏 郭静静 黄隽 南京大学工程管理学院;内幕交易与市场操纵的行为动机与判别监管研究[N];中国证券报;2007年
3 李水根;计算机详解配伍与药效关系[N];健康报;2005年
4 清华大学 苏光大;非接触式人脸识别技术[N];计算机世界;2006年
5 YMG记者 李仁 通讯员 曲华明 孙运智;我市九项目进入省“盘子”[N];烟台日报;2010年
6 高利华;传承陆游风骨 推进国际交流[N];人民日报海外版;2005年
7 上海大学理学院教授、副院长 陆文聪;酷爱化学 孜孜以求[N];中国化工报;2006年
8 ;选择合适的数据挖掘算法[N];计算机世界;2007年
9 周颖;王米渠与中医心理学[N];中国中医药报;2006年
10 林木树;反垃圾邮件有待新突破[N];人民邮电;2004年
中国博士学位论文全文数据库 前10条
1 秦玉平;基于支持向量机的文本分类算法研究[D];大连理工大学;2008年
2 平源;基于支持向量机的聚类及文本分类研究[D];北京邮电大学;2012年
3 杜小芳;基于CPFR的农产品采购模型研究[D];华中科技大学;2005年
4 刘育明;动态过程数据的多变量统计监控方法研究[D];浙江大学;2006年
5 栾锋;支持向量机(SVM)和径向基神经网络(RBFNN)方法在化学、环境化学和药物化学中的应用研究[D];兰州大学;2006年
6 孙薇;市场条件下抽水蓄能电站效益综合评价及运营模式研究[D];华北电力大学(河北);2007年
7 常群;支持向量机的核方法及其模型选择[D];哈尔滨工业大学;2007年
8 朱燕飞;锌钡白回转窑煅烧过程智能建模研究[D];华南理工大学;2005年
9 田英杰;支持向量回归机及其应用研究[D];中国农业大学;2005年
10 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
中国硕士学位论文全文数据库 前10条
1 张滨;中文文档分类技术研究[D];武汉大学;2004年
2 崔彩霞;基于支持向量机的文本分类方法研究[D];山西大学;2005年
3 牛肖潇;支持向量机及用于文本分类的研究[D];武汉理工大学;2006年
4 李强;基于支持向量机的文本分类方法研究[D];西安科技大学;2009年
5 徐华;基于支持向量机的Web文本挖掘研究[D];哈尔滨工程大学;2004年
6 于海龙;面向PU问题的文本分类的研究与实现[D];吉林大学;2005年
7 马忠宝;基于支持向量机的中文文本分类系统研究[D];武汉理工大学;2006年
8 杨丽华;基于内容的垃圾邮件过滤技术研究[D];西南交通大学;2006年
9 邹丹;基于Web的中文文本分类的研究与实现[D];中国地质大学(北京);2006年
10 代亮;基于支持向量机的文本分类问题研究[D];大连海事大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026