收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于市长公开电话文本为背景的两种自动分类算法的比较

郭妍  
【摘要】:随着计算机技术的发展,大量的文档信息每天都在急剧增加。由于信息的快速膨胀,如何能够快速有效地利用这些信息已经成为一个面临的新问题。面对巨大的文本信息,采用传统的人工手段对这些信息进行分类由于效率太低而面临越来越多的困难,信息处理已经成为人们获取有用信息不可缺少的工具,所以基于机器学习人工智能技术的自动文本分类(Automated Text Categorization)已经成为一个重要的研究领域,其优势大大超过了传统的人工方法,不仅可以应用广泛,而且节省了人力还简化了工作程序。 本文基于解决长春市市长公开电话文本分类的实际问题介绍了自动文本分类的定义,文本分类系统组成,基于机器学习中的文本分类方法,主要介绍了朴素贝叶斯分类器(Naive Bayes classifier)和k-最近邻法(k-Nearest Neighbor method),并实现了两种算法的文本分类,解决了实际问题,对两种分类法方法进行评估,计算得到评估的各项指标,进行了比较讨论。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘斌,黄铁军,程军,高文;一种新的基于统计的自动文本分类方法[J];中文信息学报;2002年06期
2 杨昂;;K特征线法在文本分类上的应用[J];计算机科学;2002年01期
3 厉宇航,罗振声,程慕胜;基于概念层次的英文文本自动分类研究[J];计算机工程与应用;2004年11期
4 赵晖,荣莉莉;基于支持向量的文本特征评估和系统优化[J];计算机工程与应用;2005年10期
5 赵晖;荣莉莉;;支持向量机组合分类及其在文本分类中的应用[J];小型微型计算机系统;2005年10期
6 任美睿;郭龙江;李金宝;;基于改进的向量空间模型的自动文本分类[J];哈尔滨商业大学学报(自然科学版);2006年01期
7 赵敏涯;沈洁;陈志敏;林颖;;一种新的自动文本分类的算法[J];扬州大学学报(自然科学版);2006年01期
8 陶伟;;自动文本分类中朴素贝叶斯算法的改进[J];硅谷;2010年01期
9 倪洁琼;吴耿锋;郑宇;;基于关系权重的文本表示法[J];计算机应用与软件;2009年05期
10 王笑旻;基于Bigram的特征词抽取及自动分类方法研究[J];计算机工程与应用;2005年22期
11 杨为民;李龙澍;;基于Agent的文本分类系统[J];计算机技术与发展;2007年02期
12 白若鹞;董渊;张素琴;徐大伟;;研究中文文本分类技术的辅助平台[J];清华大学学报(自然科学版);2008年07期
13 白若鹞;董渊;张素琴;徐大伟;;研究中文文本分类技术的辅助平台[J];清华大学学报(自然科学版)网络.预览;2008年07期
14 苏金树;张博锋;徐昕;;基于机器学习的文本分类技术研究进展[J];软件学报;2006年09期
15 王树梅;戴保存;黄河燕;陈肇雄;;一种模仿人类的自动文本分类算法[J];计算机科学;2003年03期
16 孙晋文;肖建国;;自动文本分类中的智能处理技术[J];计算机科学;2003年08期
17 宋枫溪,郑如冰,王积忠;自动文本分类中两种文本表示方式的比较[J];计算机工程;2004年18期
18 丁磊,钱云涛;不同程度的监督机制在自动文本分类中的应用[J];计算机应用与软件;2004年06期
19 包学超 ,孙强 ,李生红;隐性语义的SVM文本分类模型[J];信息安全与通信保密;2005年05期
20 钱铁云;王元珍;冯小年;;利用prefix-hash-tree实现从中文文本到事务数据的转换[J];计算机科学;2005年05期
中国重要会议论文全文数据库 前8条
1 吴哲;袁媛;杜小勇;刘怡;;基于简单事件框架和关键字的自动文本分类[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
2 任美睿;李建中;杨艳;;基于朴素贝叶斯方法的自动文本分类系统的实现[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
3 贺瑞芳;钟绍春;程晓春;;教学资源的个性化搜索引擎研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 邹嘉彦;;评述新闻报道或文章色彩-正负两极性自动分类的研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 李立宇;唐世渭;杨冬青;叶恒强;王腾蛟;;COMMIX-Classifier—自动网页分类系统[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
6 朱慕华;陈文亮;朱靖波;;词聚类在文本分类中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 闫光辉;李战怀;吴海军;;基于Z-Ordering技术的分形属性选择方法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
8 岳昆;李劲;石磐;刘惟一;;基于语义的Web服务主题自动抽取[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
中国博士学位论文全文数据库 前1条
1 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
中国硕士学位论文全文数据库 前10条
1 张勇勇;基于Hadoop自动文本分类的研究与实现[D];哈尔滨工业大学;2013年
2 毛伟;基于统计语言模型的中文自动文本分类系统[D];北京邮电大学;2006年
3 丁宬杰;搜索引擎技术的研究与实现[D];上海交通大学;2007年
4 朱望斌;自动文本分类算法研究[D];湖南大学;2005年
5 旺建华;中文文本分类技术研究[D];吉林大学;2007年
6 杜英;基于人工免疫机制的Web文本分类研究[D];电子科技大学;2007年
7 马哲;垃圾邮件过滤系统的研究与实现[D];浙江大学;2005年
8 张若峰;基于实例的文本自动分类技术的研究与实现[D];吉林大学;2005年
9 刘斌;数字图书馆中基于统计的自动文本分类方法研究[D];中国科学院研究生院(计算技术研究所);2002年
10 吴鹏;支持向量机文本分类算法的研究及其应用[D];大连理工大学;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978