收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于粒度计算的文本分类技术研究

张学谦  
【摘要】:随着网络信息的急剧膨胀和大量电子文本的不断出现,如何组织和管理好这些海量信息成为人们面临的一大挑战。自动文本分类技术就是研究如何让机器通过自主学来对未知文本进行分类,从而解决手工分类中遇到的困难。 特征降维和分类器的设计是当前文本分类研究的重点。由于粒度计算在解决复杂问题时能将知识进行降维,从而更方便归纳和获取知识,成为近些年来研究的热点,也为文本分类的研究提供了新的思路。与支持向量机和K最近邻等算法相比,粒度计算的粗糙集模型可以通过挖掘决策规则来获取知识,决策过程显得更加透明和容易理解,已在文本分类研究中得到重视和应用。本文在研究了现有成果的基础之上对粒度计算在文本分类中的应用做了进一步的研究,完成了以下工作: (1)在分析了现有特征选择方法后,根据特征词和类别之间的关系,提出了特征分布距离。通过计算任意两个特征词之间的分布距离,将分布距离相近的特征词进行聚合,有效降低了特征空间的维数,同时也避免了现有特征选择算法造成的个别样本由于不包含所选特征而被丢弃的现象。实验结果证明了该聚类方法在用SVM作为分类器时可以获得较其他特征选择方法高的分类精度。 (2)根据粒度计算的粒化原理,提出了通过将训练文本集划分为不同的信息粒度来降低分析问题的复杂度的方法。同时根据粗糙集的相关原理,对每个信息粒度进行特征选择,将所选特征作为条件属性并构建协同矩阵,通过启发式搜索最相似样本来获取属性约简集。 (3)通过分析信息粒度之间是否有相同的条件属性来计算信息粒度的纯度,为处理规则不一致时提供投票依据。 实验结果证明了本次研究工作在特征降维,以及将粒度计算的相关原理应用于文本分类中取得了一定的成效,通过属性约简获取的分类规则通俗易懂,在分类方面能获得较高的正确率。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陆观;梁大开;;基于粒度计算的光纤智能结构监测[J];传感器与微系统;2008年06期
2 庞继芳;梁吉业;;不完备决策表中的粒度思想[J];电脑开发与应用;2006年02期
3 龙炜哲;秦亮曦;朱杰;苏永秀;;基于分解云的分类器设计[J];计算机工程与应用;2008年36期
4 郑宇华,屠红蕾,谢立,孙钟秀;一个逻辑程序并行执行的粒度控制模型[J];软件学报;1995年11期
5 徐峰,张铃;基于商空间的非均匀粒度聚类分析[J];计算机工程;2005年03期
6 杨秋杰;;云计算的核心技术——粒度计算[J];信息安全与技术;2010年08期
7 蒙祖强;蔡自兴;;一种新的计算方法:粒度进化计算[J];计算机工程与应用;2006年01期
8 李道国;苗夺谦;杜伟林;;粒度计算在人工神经网络中的应用[J];同济大学学报(自然科学版);2006年07期
9 张铃,张钹;模糊商空间理论(模糊粒度计算方法)[J];软件学报;2003年04期
10 赵立权;;智能物流及其支撑技术[J];情报杂志;2005年12期
11 杜伟林;苗夺谦;李道国;张年琴;;概念格与粒度划分的相关性分析[J];计算机科学;2005年12期
12 李然;林和;李永礼;;高效的不完备信息系统知识约简算法研究[J];计算机工程与应用;2006年15期
13 汪小燕;王浩;;基于二进制可辨矩阵的知识粒度研究及应用[J];计算机技术与发展;2006年10期
14 王伦文;;信号处理的粒度分析法[J];信号处理;2007年04期
15 郑艺泉;谢维波;;商空间理论的Hough变换直线提取[J];华侨大学学报(自然科学版);2006年02期
16 蒙祖强;蔡自兴;;基于粒度计算的知识空间建模研究[J];小型微型计算机系统;2006年09期
17 胡彧;王少玄;;一种基于粒度计算的决策规则提取算法[J];电脑开发与应用;2007年04期
18 程伟;石扬;张燕平;;粒度计算的三种主要方法[J];计算机技术与发展;2007年03期
19 唐旭清;朱平;程家兴;;基于等腰归一化距离的模糊粒度空间研究[J];计算机科学;2008年04期
20 赵姝;张燕平;张铃;;基于粒度计算的覆盖算法[J];计算机科学;2008年03期
中国重要会议论文全文数据库 前10条
1 许相莉;张利彪;于哲舟;周春光;;基于商空间粒度计算的图像检索[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
2 李然;吕永江;林和;李永礼;;基于数据库系统的知识约简算法[A];2005全国自动化新技术学术交流会论文集(三)[C];2005年
3 方宏彬;;粒度分析在问题表示中的应用[A];2007年中国智能自动化会议论文集[C];2007年
4 黄春燕;蔡小舒;赵志军;苏明旭;沈嘉琪;黄有贵;;电站煤粉光脉动信号的小波分析及粒度计算[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
5 赵青;杨阳;孙永欣;王绍钢;刘力;常爱民;;低温微波水热法制备氧化钇稳定氧化锆[A];第十届全国敏感元件与传感器学术会议论文集[C];2007年
6 张兆田;;社会计算面临多层面的研究问题[A];新观点新学说学术沙龙文集20:社会能计算吗[C];2008年
7 张永娟;张雄;;煤矸石-水泥细度匹配与煤矸石水泥性能关系的研究[A];中国硅酸盐学会2003年学术年会论文摘要集[C];2003年
8 庞学诗;;实际分离粒度是评定旋流器分级效率的最佳粒度[A];第二届旋流分离理论与应用研讨会暨旋流器选择与应用学习班论文集[C];2006年
9 段震;赵姝;;基于商空间理论的车牌定位[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
10 毛军军;张铃;郑婷婷;吴涛;;基于商空间理论的商分形模型[A];第二十六届中国控制会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 张持健;商空间下模糊系统与模糊控制的问题求解[D];安徽大学;2005年
2 赵姝;计算智能及其在气象信息分析中的应用[D];安徽大学;2007年
3 耿志强;流程工业粒度数据挖掘技术研究与应用[D];北京化工大学;2005年
4 刘勇;基于粒度计算的知识发现研究及其应用[D];浙江大学;2006年
5 蒙祖强;基于分类模型的知识发现机理和方法研究[D];中南大学;2004年
6 方宏彬;粒度计算中的不确定性问题研究[D];安徽大学;2006年
7 李旸;基于粒度计算智能的计算机网络路由研究[D];安徽大学;2007年
8 赵立权;粒度计算的模型研究[D];安徽大学;2007年
9 修保新;C2组织结构设计方法及其鲁棒性、适应性分析[D];国防科学技术大学;2006年
10 陈波;计算Web智能粒度粗糙理论及关键技术研究[D];电子科技大学;2008年
中国硕士学位论文全文数据库 前10条
1 杨孝勇;基于熵的粒度计算及其应用研究[D];四川师范大学;2012年
2 张学谦;基于粒度计算的文本分类技术研究[D];河南工业大学;2011年
3 刘士虎;基于二元关系信息系统的粒空间及其粒度计算[D];重庆理工大学;2011年
4 周军;基于粒度计算模型的数据挖掘方法研究[D];江苏大学;2010年
5 董红妮;基于粒度的文本案例检索算法及应用研究[D];西北大学;2012年
6 谢俊;基于粒度计算的神经模糊系统建模方法用于操作员功能状态预测[D];华东理工大学;2012年
7 廖立君;基于EGSA的ADL研究及其开发工具的设计[D];中南大学;2004年
8 申情;基于粒度计算的分类方法研究[D];中北大学;2007年
9 叶峰;基于模糊集的粒度计算在分层模糊控制中的应用和研究[D];广东工业大学;2008年
10 阎丽红;基于粗糙集和粒度计算的数据库的分析研究[D];中北大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978