收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

中国科技论文在线文献的数据预处理研究

马燕燕  
【摘要】: 本文主要是针对中国科技论文在线文献的数据预处理工作,中国科技论文在线首发论文库存在将近4万条数据,面对海量的文献数据,对其进行数据挖掘,理解背后隐藏的关于所发表的论文文献以及作者的本质特征,发掘有价值的知识是必要的。然而对这些数据进行预处理,提高数据的质量,是这一目标实现的前提。论文通过对中国科技论文在线首发论文库的数据进行预处理可以为以后的数据挖掘提供高质量的数据。 本文主要是对属性和属性取值的预处理,对属性的预处理主要是指属性的删除和属性的构造,对属性取值预处理主要是进行数据清理、变换、归约和离散化。数据清理是指对空缺值、不一致数据等进行处理,把原始数据变换成适合数据挖掘的形式,对数据进行数据归约从而减少数据挖掘时的数据量。文中还运用了聚类分析和主成分分析的方法,目的都是为其后的数据挖掘提供高质量的数据。 本文通过对中国科技论文在线的原始数据进行预处理得到了适用于数据挖掘的数据,所得到的数据可以直接用于进行中国科技论文在线文献的数据挖掘。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张沫;陈基漓;阮百尧;;Web日志挖掘中数据预处理技术的研究[J];计算机与数字工程;2007年09期
2 张增敏;谢嘉;李长河;;数据挖掘在变电站设备缺陷预测管理中的应用[J];哈尔滨工业大学学报;2009年01期
3 蔚赵春,吴绍春,王炜;一种改进的序贯模式算法在地震学中的应用[J];计算机应用研究;2005年08期
4 陈霞;邱桃荣;魏玲玲;蔡洪;;基于数据挖掘的病历数据预处理[J];计算机与现代化;2007年05期
5 向浩求;危韧勇;;基于数据挖掘的信用卡数据预处理研究[J];现代商业;2007年13期
6 鲍静;范生万;;基于数据挖掘的图书数据预处理[J];大学图书情报学刊;2008年02期
7 袁溪;王晅;;基于遗传算法的数据预处理组合方法[J];西安文理学院学报(自然科学版);2009年04期
8 王东升;李垒;;Web日志挖掘数据预处理综述[J];广西轻工业;2008年05期
9 宓为建;徐子奇;刘园;;大型港机结构安全控制中数据挖掘的预处理[J];计算机辅助工程;2006年01期
10 张友志;钱萌;程玉胜;;基于MFP算法的Web日志挖掘技术的研究[J];电脑与信息技术;2006年02期
11 余瑞康;施润身;;聚类思想在贝叶斯算法中的应用[J];计算机工程与应用;2006年28期
12 朱志国;;Web使用模式挖掘系统的框架设计[J];情报理论与实践;2010年04期
13 钟足峰;刘伟铭;叶长征;;高速公路挖掘数据预处理的研究[J];微计算机信息;2007年09期
14 钱增瑾;辛燕;鞠时光;;基于中药专利数据集的关联规则发现算法[J];计算机应用研究;2007年07期
15 刘越江,黄今慧;数据挖掘中的数据预处理技术[J];科技情报开发与经济;2003年05期
16 葛育祥;熊励;;整合文本挖掘的商务智能系统结构研究[J];计算机技术与发展;2009年04期
17 邱长波,李瑞录,黄薇;人口信息系统数据挖掘的数据预处理研究[J];情报科学;2004年12期
18 李明;卢煜;苏振中;;数据预处理中填补空缺值的方法技术[J];电脑知识与技术;2009年07期
19 闭英权;秦亮曦;;基于两种方式的股票时间序列关联的研究[J];微计算机信息;2008年36期
20 苏成;;数据挖掘中不可忽视的环节——数据预处理[J];华南金融电脑;2006年01期
中国重要会议论文全文数据库 前10条
1 谭立云;凯丽比努尔;塔西甫拉提;高学东;热合木江;;数据挖掘中的数据预处理方法研究[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
2 吕琳;朱东华;刘玉琴;;面向数据仓库的数据预处理研究综述[A];2007年中国智能自动化会议论文集[C];2007年
3 张荣祖;朱扬勇;;一个可视化数据挖掘系统中的数据预处理技术[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
4 许小林;唐文忠;;基于贝叶斯算法的垃圾邮件检测中数据预处理技术的研究[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
5 胡钛;李英玉;孟新;王春梅;李秀冰;;双星计划地面应用数据预处理的设计与实现[A];中国空间科学学会空间探测专业委员会第十七次学术会议论文集[C];2004年
6 王桂芹;黄道;;数据预处理技术研究[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
7 张国卿;马亚龙;同兰娟;孙明;;一种数字信号处理方法在数据预处理中的应用研究[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
8 周炳玉;卢野;刘珍阳;;多传感器数据融合中的数据预处理技术研究[A];2007年光电探测与制导技术的发展与应用研讨会论文集[C];2007年
9 傅琪琦;乐嘉锦;;CRM数据仓库中的数据预处理研究[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
10 肖英治;刘中蔚;姚佳丽;陈红;王珊;;PW-ETL:一种利用知识库进行数据预处理的ETL构架[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
中国博士学位论文全文数据库 前10条
1 马昕;粗糙集理论在数据挖掘领域中的应用[D];浙江大学;2003年
2 李超锋;Web使用挖掘关键技术研究[D];华中科技大学;2007年
3 李力;数据挖掘方法研究及其在中药复方配伍分析中的应用[D];西南交通大学;2003年
4 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
5 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
6 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
7 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
8 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
9 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
10 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年
中国硕士学位论文全文数据库 前10条
1 严峰;银行房贷信用评估的联机分析与挖掘算法实现[D];大连理工大学;2006年
2 杜曙光;电信网络告警相关性分析方法研究[D];华侨大学;2005年
3 金松河;Web日志挖掘系统中相关算法的研究[D];西南交通大学;2005年
4 陈鑫;化工工艺数据挖掘中数据预处理技术的研究与应用[D];上海交通大学;2010年
5 赵飞国;面向数据挖掘的数据预处理系统设计与实现[D];北京交通大学;2011年
6 李萌;基于粗集理论的数据挖掘的数据预处理研究[D];华中师范大学;2004年
7 马燕燕;中国科技论文在线文献的数据预处理研究[D];吉林大学;2010年
8 朱红;基于人才认知的数据挖掘研究[D];昆明理工大学;2002年
9 魏霞;智能化数据预处理系统的研究与实现[D];华南理工大学;2010年
10 李晓菲;数据预处理算法的研究与应用[D];西南交通大学;2006年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 裴维玲;呼叫中心与数据挖掘,谁先上?[N];网络世界;2001年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978