收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

面向情报领域的文本自动分类系统的设计与实现

岑杰  
【摘要】: 随着信息技术的高速发展,以文本格式存储的信息大量出现在Internet、数字图书馆及各种电子刊物上。如何准确有效地查找我们所需要的信息,是近几年研究的热点。文本自动分类技术能够根据文本内容自动对文本进行分门别类,特别适合在海量的文本信息中高效地查找我们所需的信息,是解决上述问题的一种有效手段。 本文以军事情报的整编处理为应用背景,主要采用SVM分类算法和词典分词法,设计并实现了面向情报领域的文本自动分类系统。该系统可以实现对军事情报信息的自动分类,解决军事情报处理中的文本处理的关键技术,为军用情报系统的研制提供文本分类处理的算法和模型。 本文的主要研究成果有: 1)在已有文本分类系统模型的基础上,结合情报分类系统需要使用的技术,分析了文本分类系统中需要的关键技术。 2)在给出情报分类系统整体设计方案的基础上,通过比较各种分类算法以及中文分词技术,结合情报领域自身的特点,运用SVM分类算法和词典分词法实现了该情报分类系统。并针对TF/IDF词语权重计算的缺点,提出了运用文本的可分性判据和情报领域自身的特点来改进的词语权重计算方法。 3)通过大量的实验数据,验证了本系统在情报领域自动分类的可行性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘晓平;;利用MLC++实现数据挖掘[J];计算机仿真;2006年04期
2 张晓龙;江川;骆名剑;;ROC分析技术在机器学习中的应用[J];计算机工程与应用;2007年04期
3 王中锋;王志海;付彬;;一种局部打分搜索型限制性贝叶斯网络结构学习算法[J];南京大学学报(自然科学版);2009年05期
4 程险峰;李军;李雄飞;;一种基于欠采样的不平衡数据分类算法[J];计算机工程;2011年13期
5 牛延莉;张化;;文本自动分类研究进展[J];软件导刊;2008年04期
6 袁晓曦;;基于机器学习的Web文本自动分类[J];软件导刊;2011年01期
7 刘滔;陈治平;;基于贝叶斯理论的未知病毒检测算法的实现[J];湖南理工学院学报(自然科学版);2006年02期
8 田晓宇;梁静国;;支持向量机在文本自动分类中的应用研究[J];情报学报;2006年02期
9 孙海虹;丁华福;;基于模糊粗糙集的Web文本分类[J];计算机技术与发展;2010年07期
10 许璐蕾;;面向搜索引擎的文本自动分类系统实现[J];苏州市职业大学学报;2007年04期
11 何清;史忠植;;基于超曲面的分类算法研究进展[J];智能系统学报;2007年06期
12 杨峰;;文本局部特征的向量表示研究[J];情报理论与实践;2009年04期
13 许世明;武波;马翠;邸思;徐洪奎;杜如虚;;一种基于预分类的高效SVM中文网页分类器[J];计算机工程与应用;2010年01期
14 张高胤;谭成翔;汪海航;;基于K-近邻算法的网页自动分类系统的研究及实现[J];计算机技术与发展;2007年01期
15 台德艺;谢飞;胡学钢;;文本分类技术研究[J];合肥学院学报(自然科学版);2007年03期
16 金春霞;;Web文本挖掘相关技术研究及应用[J];现代计算机(专业版);2009年03期
17 金春霞;;Web文本挖掘相关技术研究及应用[J];微型电脑应用;2009年07期
18 黄君毅;吴静;张晖;;IP流量分类算法中特征选择作用分析[J];计算机工程;2010年16期
19 郭少友;;一种基于词上下文向量的文本自动分类方法[J];情报科学;2008年07期
20 郑东飞;石冰;;文本分类的归纳学习算法和描述[J];计算机工程与设计;2006年04期
中国重要会议论文全文数据库 前10条
1 马永立;寿国础;胡怡红;钱宗珏;区海平;;新型网络流量识别分析系统及其性能评估[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
2 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年
3 李月伦;常宝宝;;基于最大间隔马尔可夫网模型的汉语分词方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
4 谢世朋;胡茂林;;基于局部仿射区域对稀疏纹理分类的研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
5 夏诏杰;郭力;李晓霞;;化学主题网络爬虫的研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
6 刘艳民;;中文网页分类方法的研究[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年
7 张郴;;基于神经网络集成的旅游需求预测模型[A];中国地理学会百年庆典学术论文摘要集[C];2009年
8 吴宪祥;于培松;万旻;倪伟;郭宝龙;;RoboCup中智能体的参数优化和学习[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
9 杜晓凤;丁友东;;FloatBag选择性神经网络集成及其在人脸检测中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
10 杨磊;黎志成;胡斌;;基于人工神经网络的调度规则确定专家系统[A];第七届计算机模拟与信息技术学术会议论文集[C];1999年
中国博士学位论文全文数据库 前10条
1 赵玉鹏;机器学习的哲学探索[D];大连理工大学;2010年
2 刘长安;基于实例归纳的工艺规划方法及集成CAPP系统研究[D];山东大学;2003年
3 李忠伟;支持向量机学习算法研究[D];哈尔滨工程大学;2006年
4 何斌;基于可拓逻辑的机器学习理论与方法[D];华南理工大学;2005年
5 王国胜;支持向量机的理论与算法研究[D];北京邮电大学;2008年
6 胡崇海;基于图的半监督机器学习[D];浙江大学;2008年
7 钟志;基于异常行为辨识的智能监控技术研究[D];上海交通大学;2008年
8 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
9 徐海祥;基于支持向量机方法的图像分割与目标分类[D];华中科技大学;2005年
10 牛晓太;多模式智能谈判支持系统的理论与方法研究[D];武汉大学;2004年
中国硕士学位论文全文数据库 前10条
1 岑杰;面向情报领域的文本自动分类系统的设计与实现[D];西安电子科技大学;2008年
2 王小燕;文本分类相关技术与应用研究[D];西北大学;2007年
3 王磊;基于信息熵的中文文本分类算法研究[D];西北师范大学;2007年
4 刘依璐;基于机器学习的中文文本分类方法研究[D];西安电子科技大学;2009年
5 刘孟旭;基于EP的多分类器表决分类算法[D];郑州大学;2004年
6 蒋红;中文文本分类中文本表示及分类算法研究[D];浙江师范大学;2007年
7 亢华爱;入侵检测系统中基于代价敏感分类算法的研究[D];太原理工大学;2005年
8 张若峰;基于实例的文本自动分类技术的研究与实现[D];吉林大学;2005年
9 马慧敏;中文文本自动分类方法的研究和实现[D];华北电力大学(河北);2005年
10 李祥亮;一种基于张量场的数据约简方法及应用研究[D];苏州大学;2009年
中国重要报纸全文数据库 前10条
1 本报记者 余建斌;机器学习与互联网搜索[N];人民日报;2011年
2 黎骊/文 [美] Tom M.Mitchell 著;机器学习与智能化社会[N];中国邮政报;2003年
3 粤检;佛山局开发成功三种蟑螂自动分类系统[N];中国国门时报;2007年
4 李瀛寰;雅虎中文搜索从分词开始[N];中国计算机报;2006年
5 ;SecuiWALL独创分类算法[N];计算机世界;2002年
6 本报记者 张晔通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年
7 记者 何边;网络化激活人工智能[N];计算机世界;2001年
8 俞路石;中科大研究生解决网络数据包有效分类算法[N];中国教育报;2007年
9 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
10 记者 蒋隽;百度将推地图搜索抗衡google[N];民营经济报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978