收藏本站
《中国农业科学院》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于国家作物种质资源数据库的知识发现研究

唐合文  
【摘要】: 国家作物种质资源数据库拥有180种作物、39万份种质信息、135万条记录,数据量达40GB,是世界上最大的植物种质资源数据库之一。利用知识发现(KDD)的原理、方法和技术发掘这些海量数据中蕴藏的信息,已成为当前作物信息科学研究的重要内容,对于充分发挥国家作物种质资源数据库的作用,更好地保护和利用我国丰富的作物种质资源具有十分重要的意义。本研究主要进行了以下两方面的研究。 在分析国家作物种质资源数据库数据特点的基础上,提出了基于正态模拟的连续型数据缺失值处理方法以及基于随机数的离散型数据缺失值处理方法,并结合基于语义的离散化方法对国家作物种质资源数据进行了缺失值处理和离散化处理。研究分析了统计分析、决策树、关联规则、神经网络、遗传算法、模糊集、粗糙集等知识发现方法,结合国家作物种质资源数据库的特点,提出了基于关联规则的国家作物种质资源数据库知识发现方法。在此基础上,综合分析了现有的关联规则挖掘算法,重点分析了事务数据库中关联规则挖掘的经典算法—Apriori及其改进算法的特点,根据国家作物种质资源数据库中的关联规则具有多维性的特征,改进了Apriori算法,使其适用于多维关联规则挖掘,并提出了基于SQL的国家作物种质资源数据库Apriori关联规则挖掘方法。 研究分析了国内外典型的知识发现系统,完成了国家作物种质资源数据库知识发现系统的总体设计,研制了国家作物种质资源数据库知识发现系统的原型。该系统接口简洁直观、易操作、挖掘结果易懂。在系统中设计了支持度过滤、置信度过滤、规则前件过滤及规则后件过滤等四种方法来精减规则数量。利用该系统,开展了大豆种质资源数据库的知识发现,初步获得了有关大豆种质资源农艺性状、品质、抗逆、抗病虫等特征特性的关联知识。
【学位授予单位】:中国农业科学院
【学位级别】:博士
【学位授予年份】:2007
【分类号】:S326

【引证文献】
中国博士学位论文全文数据库 前1条
1 张臻;西南季节性干旱区农业资源与环境要素数据库设计与应用[D];西南大学;2011年
中国硕士学位论文全文数据库 前2条
1 严兆斌;序列模式挖掘在公路隧道交通中的应用研究[D];西安电子科技大学;2009年
2 汪志贞;数据挖掘技术在短时交通流预测上的应用研究[D];西安电子科技大学;2010年
【参考文献】
中国期刊全文数据库 前10条
1 李新延,李德仁;DBSCAN空间聚类算法及其在城市规划中的应用[J];测绘科学;2005年03期
2 费贤举,王文琴,庄燕滨;基于关联规则的数据挖掘技术在CRM中的应用研究[J];常州工学院学报;2005年04期
3 刘汉起,商绍刚,霍虹,吴和礼;大豆品种对大豆孢囊线虫1、3、4号小种的抗性[J];大豆科学;1989年01期
4 蒋志全,陈燕;基于遗传算法的关联规则挖掘模型[J];大连海事大学学报;2003年03期
5 付忠广,田志友,靳涛,戈志华,卞双;关联规则数据挖掘及其在电厂DCS数据分析中的应用[J];发电设备;2004年S1期
6 刘澍才,吴燕;国内外作物种质资源研究进展[J];杂粮作物;2001年03期
7 雷于生,任恕,粟载福;KDD技术及其在基因表达微阵列数据中的应用[J];国外医学(分子生物学分册);2000年06期
8 卢景丽,徐章艳,刘美玲,区玉明;一种改进的负关联规则挖掘算法[J];广西师范大学学报(自然科学版);2004年02期
9 谢友辉,蒋新华;数据挖掘技术及在保险领域中的应用[J];信息技术;2003年08期
10 邓又华;数据挖掘及其在运输系统中的应用[J];华南师范大学学报(社会科学版);2004年03期
中国硕士学位论文全文数据库 前4条
1 胡锟;数据挖掘技术在银行信用卡业务中的应用研究[D];浙江大学;2002年
2 黄添强;基于空间数据挖掘的环境调控空间决策支持系统研究[D];福州大学;2003年
3 郭道荣;基于数据挖掘的电信网络故障诊断技术的研究[D];重庆大学;2003年
4 王平;利用数据挖掘实现电信业的客户流失预测分析[D];西南交通大学;2003年
【共引文献】
中国期刊全文数据库 前10条
1 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期
2 田飞;;用马蒙模型解决社会调查研究中数据缺损问题[J];安徽大学学报;2006年04期
3 潘洁珠;半结构化数据及其数据模型[J];安徽教育学院学报;2003年06期
4 赵鹏,倪志伟,贾瑞玉;基于数据挖掘技术的范例库维护[J];安徽大学学报(自然科学版);2003年02期
5 赵鹏;倪志伟;;地理信息系统中SDM和CBR的应用研究[J];安徽大学学报(自然科学版);2005年06期
6 孟庆全;徐文龙;;粗糙集合在中医诊断中的应用研究[J];安徽大学学报(自然科学版);2006年04期
7 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
8 梁佩佩,杨丽萍;基于模糊关系数据库的聚类算法研究[J];安徽职业技术学院学报;2004年01期
9 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
10 章曙光;耿焕同;;一种改进的基于聚类的范例添加删除维护模型[J];安徽建筑工业学院学报(自然科学版);2006年01期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 章曙光;;基于CBR的电力负荷预测系统的研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
4 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
5 查星云;;一种钢铁企业金属损耗平衡分析方法[A];全国冶金自动化信息网2012年年会论文集[C];2012年
6 吴立旗;童文新;徐凤芹;;数据挖掘技术在中医药现代化研究中的应用[A];2011·中国医师协会中西医结合医师大会论文集[C];2011年
7 鲁松;;英文介词短语归并歧义的RMBL分类器消解[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
8 汤广富;马春实;刘欢;付强;;模糊聚类快速实用方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
9 季晓林;石慧;刘海砚;;地理实体多态特征及适用模型研究[A];第二届“测绘科学前沿技术论坛”论文精选[C];2010年
10 贾泽露;刘耀林;;可视化空间数据挖掘研究综述[A];《测绘通报》测绘科学前沿技术论坛摘要集[C];2008年
中国博士学位论文全文数据库 前10条
1 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年
2 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
3 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
4 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
5 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年
6 杨波;植物类中药寒热药性与化学成分相关性的文献研究[D];山东中医药大学;2010年
7 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
8 张开广;郑州地区仰韶文化遗址空间模式研究[D];解放军信息工程大学;2010年
9 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
10 戴小鹏;知识网格及其在农业生物灾害预警中关键技术研究[D];湖南农业大学;2010年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
3 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
4 梁大圣;空间数据仓库的设计与构建[D];山东农业大学;2010年
5 卫泽;棉花分子图谱构建、偏分离位点的比较作图和棉花品种遗传多样性分析[D];山东农业大学;2010年
6 杨海陆;公路收费系统数据分析与挖掘[D];哈尔滨工程大学;2010年
7 冯为军;基于粗糙集理论的数据挖掘算法的研究[D];哈尔滨工程大学;2010年
8 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
9 王宏磊;SNMP安全态势信息获取及分析技术[D];哈尔滨工程大学;2010年
10 曹振兴;适应概念漂移的数据流分类算法研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 李翠霞,尹宁园;浅论农业专题数据库的建设[J];安徽农业科学;2003年04期
2 沙宗尧,边馥苓;“3S”技术的农业应用与精细农业工程[J];测绘通报;2003年06期
3 刘云华;唐兰兰;;面向对象思想的GIS地理数据库设计初探[J];测绘与空间地理信息;2006年02期
4 黄昌;董浙云;吴健平;杨同辉;;基于GIS的宁波市农业资源管理信息系统构建[J];测绘与空间地理信息;2009年06期
5 唐嫦燕;关于我国数据库建设与发展问题的思考[J];广东工业大学学报(社会科学版);2002年03期
6 徐勇;农业资源高效利用评价指标体系初步研究[J];地理科学进展;2001年03期
7 韦钢,王飞,张永健,符杨;负荷预测中历史数据缺损处理[J];电力科学与工程;2004年01期
8 张佐帮,尚颖娟;基于Geodatabase的面向对象空间数据库设计[J];地理空间信息;2005年02期
9 余瑞林;王新生;朱超平;;湖北省农业资源数据库系统体系架构[J];地理空间信息;2008年01期
10 王龙昌,马林,赵惠青,万素梅;国内外旱区农作制度研究进展与趋势[J];干旱地区农业研究;2004年02期
中国博士学位论文全文数据库 前10条
1 潘淑春;国家农业文献信息资源系统分析与设计[D];中国农业科学院;2001年
2 孟宪学;中国农业科技数据库系统建设研究[D];中国农业科学院;2002年
3 王海燕;农业资源可持续利用研究[D];中国农业大学;2002年
4 吴明先;高速公路隧道集成化智能化监控技术与系统开发研究[D];长安大学;2004年
5 杨博辉;西部野生偶奇蹄目动物遗传资源及Web数据库研究[D];甘肃农业大学;2006年
6 张茂震;森林资源数据库查询优化策略与技术研究[D];北京林业大学;2006年
7 曲吉林;时间序列挖掘中索引与查询技术的研究[D];天津大学;2006年
8 刘惠;蛋白质序列数据的分类预测研究[D];上海交通大学;2007年
9 李晓东;城市污水处理厂数据挖掘及相关技术研究[D];湖南大学;2007年
10 徐玉生;频繁模式挖掘算法与剪枝策略研究[D];兰州大学;2008年
中国硕士学位论文全文数据库 前10条
1 辛欣;多尺度农业资源空间数据库的建设[D];华中农业大学;2010年
2 马永杰;公路隧道纵向通风神经模糊控制系统应用研究[D];西南交通大学;2003年
3 樊小红;基于遗传算法的交通事件检测研究[D];长安大学;2002年
4 张允刚;甘薯种质资源数据库管理系统的设计[D];南京农业大学;2004年
5 唐惠燕;网络化农业信息管理系统的构建与实现[D];南京农业大学;2003年
6 彭立芹;潋水河流域水土资源数据库的建设及其应用[D];南京师范大学;2004年
7 郭磐石;基于Geodatabase的空间数据库技术在农业资源管理方面的应用研究[D];太原理工大学;2005年
8 谢文兵;广西大厂中央资源数据库管理应用系统与空间信息统计学应用研究[D];中南大学;2002年
9 李振刚;基于.NET的三层架构教学平台的设计与实现[D];天津大学;2005年
10 王琪;基于神经网络和支持向量机的高速公路交通事件检测[D];西南交通大学;2006年
【二级引证文献】
中国博士学位论文全文数据库 前1条
1 王建平;内蒙古自治区农业水价研究[D];中国农业科学院;2012年
中国硕士学位论文全文数据库 前1条
1 李波;基于小波分析和遗传神经网络的短时城市交通流量预测研究[D];北京交通大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 欧阳为民,郑诚;KDD研究中的若干问题与方法[J];安徽大学学报(自然科学版);1999年01期
2 乔颖,须德;多重粒度数据仓库的存储新策略[J];北方交通大学学报;1997年06期
3 冯建生;KDD及其应用[J];宝钢技术;1999年03期
4 王冰清,怀进鹏;IDSS 中数据仓库和数据挖掘的研究与实现[J];北京航空航天大学学报;1998年04期
5 李德仁,程涛;从GIS数据库中发现知识[J];测绘学报;1995年01期
6 王桥,吴纪桃;空间决策支持系统中的模型标准化问题研究[J];测绘学报;1999年02期
7 谢成山,牛纪海,徐济仁;DM技术及其在数据处理中的应用[J];电讯技术;2003年02期
8 庄无忌,韩华琼,谢发明,张乔,李福山,舒世珍,常汝镇;栽培、野生、半野生大豆脂肪酸组成的初步分析研究[J];大豆科学;1984年03期
9 李永忠;大豆脂肪酸及其组成成分的相关和通径分析[J];大豆科学;1987年03期
10 赵宏波 ,孟雅玲;数据挖掘在电信客户关系管理中的应用[J];电信技术;2001年12期
中国硕士学位论文全文数据库 前2条
1 邹东升;数据挖掘在电信告警中的应用研究[D];重庆大学;2002年
2 田志友;基于电厂数据的机组性能关联规则分析[D];华北电力大学(北京);2004年
【相似文献】
中国期刊全文数据库 前10条
1 朱彦廷;;基于遗传算法的关联规则挖掘[J];西昌学院学报(自然科学版);2010年03期
2 窦祥国,胡学钢;关联规则的评价方法研究[J];安徽技术师范学院学报;2005年04期
3 黄勇;刘锋;;关系数据库中关联规则挖掘实现研究[J];农业网络信息;2006年12期
4 ;学者风采——揭雨成[J];湖南农业大学学报(自然科学版);2008年02期
5 黄光明;;Apriori算法在农业病虫害分析中的应用[J];安徽农业科学;2009年13期
6 李忠哗;王凤利;何丕廉;;关联规则挖掘在课程相关分析中的应用[J];河北农业大学学报;2010年03期
7 李阳;;我国对种质资源保护加大执法力度[J];农业知识;2011年08期
8 马文生;;图像挖掘技术在林火影像中的应用[J];林业劳动安全;2009年02期
9 ;作物种质资源国家库(圃)暨国家重点实验室宣传年邀请函[J];植物遗传资源学报;2010年03期
10 ;全国作物种质资源学术研讨会预备通知[J];中国种业;2011年08期
中国重要会议论文全文数据库 前10条
1 刘晓燕;单晓红;;遗传算法在关联规则挖掘中的应用[A];第六届中国青年运筹与管理学者大会论文集[C];2004年
2 温磊;李敏强;;基于有向项集图的频繁项集增量更新挖掘算法[A];2004中国控制与决策学术年会论文集[C];2004年
3 贺庆;冯海旗;;基于关联规则挖掘的隐私保护方法研究[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年
4 温磊;牛东晓;何永贵;;基于权重约束的频繁项集挖掘算法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
5 刘扬;曹惠玲;梁大敏;;关联规则挖掘在航空发动机QAR数据中的应用[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
6 李锦泽;叶晓俊;;关联规则挖掘算法研究现状[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
7 陈波;董鹏;邵勇;;基于Apriori算法及其改进算法综述[A];中国通信学会第五届学术年会论文集[C];2008年
8 郭云峰;张集祥;;一种基于位向量的关联规则挖掘算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
9 方炜炜;杨炳儒;唐志刚;杨君;;基于客观兴趣度的关联规则优化算法研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
10 谷姗姗;秦首科;胡大斌;周傲英;;面向关联规则挖掘的敏感规则隐藏技术[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
中国博士学位论文全文数据库 前10条
1 唐合文;基于国家作物种质资源数据库的知识发现研究[D];中国农业科学院;2007年
2 王德兴;基于概念格模型关联规则挖掘的关键问题研究[D];合肥工业大学;2007年
3 林晓勇;频繁模式挖掘和动态维护的理论与方法研究[D];北京化工大学;2008年
4 韩颖;新型农村合作医疗数据挖掘研究[D];山西医科大学;2009年
5 封毅;中医药知识发现可靠性研究[D];浙江大学;2008年
6 齐建东;基于数据挖掘的入侵检测方法及系统研究[D];中国农业大学;2003年
7 张晓辉;云理论和数据挖掘在水上安全分析中的应用[D];大连海事大学;2011年
8 何月顺;关联规则挖掘技术的研究及应用[D];南京航空航天大学;2010年
9 刘智;关联规则挖掘方法及其在冠心病中医诊疗中的应用研究[D];大连海事大学;2012年
10 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
中国硕士学位论文全文数据库 前10条
1 曾海颖;客户关系管理中的数据挖掘[D];南京航空航天大学;2003年
2 邹丽;分布式系统下关联规则挖掘的研究与实现[D];大连交通大学;2005年
3 徐勇;基于概念格模型的分布式关联规则挖掘研究[D];合肥工业大学;2006年
4 唐文志;蚁群算法在关联规则学习中的研究与应用[D];北京工业大学;2009年
5 黄鹏鹤;关联规则挖掘及其在教务管理中的应用[D];大连交通大学;2005年
6 梁碧珍;目标频繁项集挖掘算法与应用研究[D];广西大学;2007年
7 陈华胜;基于数据挖掘的入侵检测系统的研究[D];武汉理工大学;2004年
8 武建虎;关联规则及其在肝癌病人资料分析中的应用研究[D];第二军医大学;2005年
9 姜晗;关联规则的精简方法研究[D];浙江师范大学;2007年
10 张声雷;基于量化关联规则挖掘的就业分析系统[D];上海海事大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026