收藏本站
《北京工业大学》 2003年
收藏 | 手机打开
二维码
手机客户端打开本文

文本自动分类系统的研究与实现

姚松源  
【摘要】: 我的论文题目为“文本自动分类系统的研究与实现”,该项目得到了国家自然科学基金、北京市自然科学基金的资助。本文是对我研究生期间所作研究工作的总结。 Internet的快速发展使得信息资源得到了急剧增长。越来越多的信息通过互联网被传送到世界各地,互联网中也积聚了越来越多的信息。从发展的趋势来看,网络必将成为人们获取信息的主要来源。但互联网的组织杂乱,缺乏必要的条理,多且杂的信息使得人们从中获取自己感兴趣的内容变得越来越困难。 信息分类技术可以帮助人们准确高效的定位信息。文本是互联网上主要的信息载体,一个良好的文本自动分类系统能够有效地将信息组织管理起来,为信息获取提供有力的支持。 文本分类技术的研究是我的主要研究课题。在我的研究工作中,首先建立了一个文本自动分类系统,以此作为深入研究文本分类技术的试验平台。在“the 4 Universities Data Set”数据集上,我们测试了各种特征提取算法和分类算法,分析总结了它们的效果和特点。在对特征提取实验结果的分析基础上,我们提出了一个针对特征提取算法的量化评测标准,并使用该标准对现有的特征提取算法作了评测。在对评测结果的分析中总结了特征提取应有的原则,根据该原则提出一个新的特征提取算法,对该方法完成了评测,并讨论了它相比其他算法的特点。
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2003
【分类号】:TP391.1

【相似文献】
中国期刊全文数据库 前10条
1 吴春辉;陈洪生;;基于内容的音频检索技术研究[J];咸宁学院学报;2011年06期
2 张新淼;;基于Gabor滤波的指纹图像识别研究与实现[J];计算机与现代化;2011年07期
3 刘劲;陈瑛琦;扶晓;;虹膜特性提取阶段的小波多尺度特征量化算法[J];电脑编程技巧与维护;2011年14期
4 贾志先;;基于支持向量机的空白试卷识别方法[J];山西大学学报(自然科学版);2011年03期
5 胡进;胡桂明;毛世榕;;BP神经网络在说话者识别中的应用[J];装备制造技术;2011年09期
6 王瑞瑞;马建文;陈雪;;多源遥感影像自动配准技术的研究进展[J];遥感信息;2011年03期
7 刘劲;赵蕾;扶晓;;基于小波模极值的虹膜特征提取算法[J];电脑编程技巧与维护;2011年16期
8 蒋强荣;高远;张鸿宾;;基于直方图交核的人脸识别[J];北京工业大学学报;2011年08期
9 黑光月;;基于方向平面特征的脱机女书识别方法研究[J];电脑知识与技术;2011年25期
10 胡洋;吴黎慧;高磊;蒲南江;;基于SVM的语音情感识别研究[J];电子测试;2011年09期
中国重要会议论文全文数据库 前10条
1 林土胜;赖声礼;;视网膜血管特征提取的拆支跟踪法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
2 钱小聪;郑宝玉;穆明鑫;;神经网络联机手写签名验证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
3 张羽;汪源源;王威琪;余建国;林继耕;;狭窄血管多普勒信号特征提取的实验研究[A];21世纪医学工程学术研讨会论文摘要汇编[C];2001年
4 柳林霞;陈杰;窦丽华;;不变矩理论及其在目标识别中的应用[A];2002中国控制与决策学术年会论文集[C];2002年
5 杨日杰;施建礼;林洪文;;一种雷达视频回波特征提取方法研究[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年
6 代克杰;张红梅;盛赛斌;;基于BP网络的故障特征提取方法研究[A];2004中国控制与决策学术年会论文集[C];2004年
7 何新;史迎春;周献中;;一种基于独立分量分析的音频分类方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
8 朱晓霞;孙同景;陈桂友;;基于支持向量机理论的两级指纹分类实现方法[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
9 范海宁;郭英;吴剑锋;陈志武;;基于小波包分解的声信号特征提取方法[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
10 郗长青;郑建明;李言;罗杰;;基于小波包分解的钻头磨损特征提取[A];制造技术自动化学术会议论文集[C];2004年
中国重要报纸全文数据库 前10条
1 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
2 沈占锋;遥感影像信息提取与分析[N];计算机世界;2006年
3 张文;263:创新保障“绿色网络”[N];通信产业报;2006年
4 王竣;深入开发CAD系统对疾病诊断有重要意义[N];中国医药报;2007年
5 徐娅萍;反垃圾新系统不再误删邮件[N];民营经济报;2006年
6 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
7 罗鼎;263网络通信:甘当反垃圾邮件排头兵[N];通信产业报;2006年
8 孙哲南 谭铁牛;生物识别的十大关键技术[N];计算机世界;2007年
9 上海 高博;让电脑“听懂”人话[N];电脑报;2008年
10 记者 何腾江 通讯员 周汇成;验钞新技术通过鉴定[N];中山日报;2008年
中国博士学位论文全文数据库 前10条
1 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
2 张立福;通用光谱模式分解算法及植被指数的建立[D];武汉大学;2005年
3 苏彩红;墙地砖质量自动检测技术的研究[D];华南理工大学;2004年
4 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
5 宋晴;基于液滴分析技术和液滴指纹图的液体识别方法的研究[D];天津大学;2005年
6 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
7 孙真真;基于光学区雷达目标二维像的目标散射特征提取的理论及方法研究[D];中国人民解放军国防科学技术大学;2001年
8 武子玉;矿物近红外光谱信息提取及应用研究[D];吉林大学;2005年
9 王承;基于神经网络的模拟电路故障诊断方法研究[D];电子科技大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 姚松源;文本自动分类系统的研究与实现[D];北京工业大学;2003年
2 俞宏军;汽车车型与牌照识别系统的研究与实现[D];长安大学;2005年
3 李钢;基于神经网络的入侵检测研究与实现[D];华东师范大学;2008年
4 王欣;基于神经网络的模拟电路故障诊断方法研究与实现[D];西安电子科技大学;2007年
5 曾红梅;情绪图片视觉诱发EEG特征提取与分析[D];天津大学;2012年
6 杨锦涛;电力系统环境下的网络时间同步系统的研究与实现[D];湖南大学;2011年
7 张静伟;网络能耗监测系统管理端的研究与实现[D];北京邮电大学;2012年
8 陈明;指纹识别算法研究与实现[D];电子科技大学;2005年
9 孙启星;车牌识别系统的研究与实现[D];哈尔滨工程大学;2005年
10 杨星;机器人彩色目标识别与跟踪系统的研究与实现[D];南京航空航天大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026