收藏本站
《南京大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

学科交叉知识发现及其可视化研究

魏建香  
【摘要】:科学技术的发展为每个学科带来新的机遇的同时,也带来严峻挑战。学科通过引入、吸收、整合其它学科的理论、方法和技术来促进自身的发展是学科创新最常见的途径。学科交叉研究已成为学术界乃至整个社会关注的焦点。但从国内外研究现状分析,学科交叉还只是停留在表象和经验的层面,缺乏基于科技文献聚类分析的深层次挖掘的研究。 本文要解决的问题是“如何利用聚类分析的技术手段来有效地发现和展示学科之间的交叉知识”。研究的目标是在海量科技文献数据的基础上,通过聚类分析技术与手段,深度挖掘潜在的学科交叉知识,为学科交叉研究提供一种科学的、客观的、先进的方法。以“学科交叉知识”为研究对象,从文本挖掘的理论与关键技术分析入手,在文档聚类算法的研究与改进、学科交叉知识发现与可视化等方面展开研究工作,包括以下6个方面:(1)对国内外学科交叉研究进展进行了评述,指出了研究中存在的不足,提出利用文档聚类进行学科交叉研究的可行性;(2)对文本挖掘、智能优化算法及信息可视化研究进展进行综述;(3)对文档聚类中的关键技术研究,分析了文档聚类在“相似性的精度”、“高维度的约简”和“聚类数目模糊性”中面临的问题,提出了解决问题的方案。(4)文档聚类算法研究。从基本的FCM算法研究入手,将遗传算法、粒子群算法等优化算法应用于文档聚类中,重点对粒子群优化算法的不足进行了改进,提出了基于免疫粒子群与FCM相融合的文档聚类算法。(5)学科交叉知识发现与可视化模型研究。提出了学科交叉文献的发现模型、学科交叉知识挖掘模型和学科交叉知识可视化模型,并设计出用于学科交叉知识可视化的视图模板。(6)实证研究。利用情报学与计算机两个学科近十年(2000年—2009年)的中文核心期刊文献数据来研究两个学科交叉知识。利用改进的文档聚类算法对文献进行聚类分析,并利用自主开发的基于学科交叉知识可视化软件VIK及其它可视化软件CiteSpace与UCINET进行可视化研究与分析。在具体的研究过程中,主要采用了文献研究法、调查研究与专家咨询法、统计分析法、实验仿真法与Meta分析法等。 本文研究的主要成果(结论)为:(1)通过海量文献聚类分析可以有效地识别学科之间的交叉关系;(2)基于关键词与摘要词加权的文档相似度计算模型与基于字符串部分相似的关键词匹配模型可以有效地改善文档相似度;(3)基于免疫粒子群与模糊C均值相融合的文档聚类算法可以有效地应用于海量文档数据聚类;(4)基于共词的学科交叉文献发现模型能较准确地发现学科交义文献;(5)基于共词聚类分析的学科交义知识发现模型能挖掘有关学科交叉的交叉度、融合度、交叉方向、新的生长点等知识;(6)基于学科交叉知识的可视化模型使得学科交叉知识的可视化成为可能;(7)通过对情报学与计算机科学两个学科交叉知识实证研究发现,在近10年的发展过程中,两个学科共形成了“数据挖掘”、“信息安全”、“搜索引擎”、“本体技术”、“信息检索”与“软件工程与图像处理”等交叉研究方向,在未来的发展中,“图像检索”、“领域本体”、“个性化”等将成为两个学科交叉方向中新的生长点;(8)自主开发的学科交叉知识可视化软件VIK可以直观地展示学科交叉知识。 纵观全文,主要有如下的创新点:(1)将聚类分析技术应用于学科交叉研究,为学科交叉研究提供一种可行的方法;(2)基于免疫粒子群和模糊C均值融合的文档聚类算法;(3)学科交叉知识发现和可视化模型;(4)学科交叉知识可视化平台VIK。
【学位授予单位】:南京大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:G301

【引证文献】
中国期刊全文数据库 前4条
1 李长玲;刘非凡;郭凤娇;;运用重叠社群可视化软件CFinder分析学科交叉研究主题——以情报学和计算机科学为例[J];图书情报工作;2013年07期
2 闵超;孙建军;;学科交叉研究热点聚类分析——以国内图书情报学和新闻传播学为例[J];图书情报工作;2014年01期
3 郭凤娇;李长玲;王晓笛;魏绪秋;;基于向量空间模型的学科交叉文献发现研究——以情报学与计算机学科为例[J];情报杂志;2014年03期
4 闵超;孙建军;;基于关键词交集的学科交叉研究热点分析——以图书情报学和新闻传播学为例[J];情报杂志;2014年05期
【参考文献】
中国期刊全文数据库 前10条
1 刘宇,刘德钦,马维军;城市化研究的GIS方法[J];测绘科学;2004年05期
2 胡宁静,王靖;基于模糊c均值算法文档聚类问题的研究[J];长沙电力学院学报(自然科学版);2004年04期
3 林鸿飞,马雅彬;基于聚类的文本过滤模型[J];大连理工大学学报;2002年02期
4 王磊,潘进,焦李成;免疫算法[J];电子学报;2000年07期
5 张脂平,林世平;Web文本挖掘中特征提取算法的分析及改进[J];福州大学学报(自然科学版);2004年S1期
6 王庚华;邱岩;谢寅波;;大学学科交叉的路径[J];中国冶金教育;2008年04期
7 孟海涛;陈笑蓉;;基于模糊相似度的科技文献软聚类算法[J];贵州大学学报(自然科学版);2007年02期
8 吴宏元,郑晓齐;日本九州大学新型的教育和研究组织结构及其启示[J];高等教育研究;2005年01期
9 张军,刘克胜,王煦法;一种基于免疫调节和共生进化的神经网络优化设计方法[J];计算机研究与发展;2000年08期
10 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
中国博士学位论文全文数据库 前2条
1 赵晓春;跨学科研究与科研创新能力建设[D];中国科学技术大学;2007年
2 马卫东;信息共享动力学及主动服务关键技术研究[D];电子科技大学;2007年
中国硕士学位论文全文数据库 前6条
1 金薇吟;学科交叉理论与高校交叉学科建设研究[D];苏州大学;2005年
2 史册;基于Ontology领域知识模型的高校研究生个性化信息服务研究[D];同济大学;2007年
3 王立强;基于多元统计图的高维数据降维方法及应用研究[D];燕山大学;2006年
4 魏海燕;基于引文分析的情报学与相关学科的研究[D];中南大学;2008年
5 汪浩平;基于K-均值的文本聚类分析[D];贵州大学;2008年
6 袁浩;主题爬虫搜索Web页面策略的研究[D];中南大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 张晓杰,王巍巍;基于C—均值模糊聚类的工程结构构件自动归并方法研究[J];四川建筑科学研究;2005年04期
2 尹峰,邓小鹏,许四毛;生物免疫机理在计算机安全领域的应用与发展[J];安徽电子信息职业技术学院学报;2004年Z1期
3 李晓红;田军委;;面向FCM聚类阈值分割的聚类有效性判别函数[J];安徽大学学报(自然科学版);2007年05期
4 曹安照,张斌,张永荣,庆先好;模糊聚类在电力负荷预测中的应用[J];安徽工程科技学院学报(自然科学版);2005年01期
5 叶良艳;;基于改进后的K-means聚类算法的网吧用户行为聚类[J];安徽科技学院学报;2009年04期
6 贾丙静;葛华;王传安;赵海燕;;Web日志挖掘在校园网建设中的应用研究[J];安徽科技学院学报;2010年03期
7 陶玉敏;基于免疫算法的无向排列的反转排序问题[J];鞍山科技大学学报;2005年02期
8 孙雪;李昆仑;胡夕坤;赵瑞;;基于半监督K-means的K值全局寻优算法[J];北京交通大学学报;2009年06期
9 田卉;;用数据挖掘技术构建政府智能化网络投诉平台[J];办公自动化;2009年18期
10 孟飞;王仕成;杨小冈;张合新;;基于Hausdorff距离和免疫遗传算法在图像匹配的应用研究[J];兵工自动化;2008年02期
中国重要会议论文全文数据库 前10条
1 韩露;余正涛;邓锦辉;章程;毛存礼;郭剑毅;;领域知识关系对领域文本分类的影响[A];第二十七届中国控制会议论文集[C];2008年
2 ;A Hybrid Clustering Algorithm Based on Grid Density and Rough Sets[A];第二十七届中国控制会议论文集[C];2008年
3 龚涛;杜常兴;;免疫计算研究的进展[A];中国自动化学会控制理论专业委员会A卷[C];2011年
4 王茜;雷鸣;酆小凯;;一种人工免疫入侵检测中基于人工神经网络的自体更新方法[A];2008年计算机应用技术交流会论文集[C];2008年
5 马晓琨;;战争史上最大的合作研究开发机构——美国MIT辐射实验室案例研究[A];全球化视阈中的科技与社会——全国科技与社会(STS)学术年会(2007)论文集[C];2007年
6 陶迎春;;浅析量子阶梯与学科交叉方法[A];第二届中国科技哲学及交叉学科研究生论坛论文集(硕士卷)[C];2008年
7 过伟敏;张凌浩;;整合型设计教学模式的研究与饮食文化课程项目实践[A];节能环保 和谐发展——2007中国科协年会论文集(二)[C];2007年
8 赵文平;吴敏;王安民;;我国大学跨学科研究的障碍与对策研究[A];电子高等教育学会2007年学术年会论文集[C];2007年
9 于健;陈子军;李霞;李炜;;一种新的多密度聚类算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
10 薛征;廖闻剑;;基于位置权重和实体识别的关键词提取[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 王大伟;基于免疫的入侵检测系统中检测器性能研究[D];哈尔滨理工大学;2010年
2 岑健;基于人工免疫系统的机组复合故障诊断技术研究[D];华南理工大学;2010年
3 赖芨宇;基于知识挖掘的企业管理集成系统研究[D];东华大学;2011年
4 张淑平;基于视觉的并联机器人位姿检测方法研究[D];东华大学;2010年
5 吕青;思维进化和支持向量机理论及其在炼焦配煤优化中的应用研究[D];太原理工大学;2011年
6 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
7 田廓;不确定条件下输电投资经济学分析及决策规划方法研究[D];华北电力大学(北京);2011年
8 王茜;风电场与输电网协调规划的模型和方法研究[D];华北电力大学(北京);2011年
9 文少保;美国大学跨学科研究组织变迁与运行治理研究[D];大连理工大学;2011年
10 管晓霞;我国高校多学科交叉项目组织与管理方法研究[D];华中科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 蒋慧;改进的遗传算法在电力系统无功优化中的应用[D];安徽工程大学;2010年
2 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
3 高兆梓;基于专利分析的竞争对手分类系统研究[D];山东科技大学;2010年
4 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
5 赵金华;俄罗斯2004-2008年体育科研动态的研究[D];上海体育学院;2010年
6 李振;网络舆情预测关键技术研究[D];郑州大学;2010年
7 孟庆海;基于社会书签的个性化查询词扩展技术研究[D];哈尔滨工程大学;2010年
8 张帅;拉曼光谱预处理及多组分分析方法研究[D];哈尔滨工程大学;2010年
9 秦璇;协同知识结构序化测度模型及演化规律研究[D];大连理工大学;2010年
10 魏卓群;GPU并行免疫算法在冷轧生产调度中的应用[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 杨冬梅;;科技期刊插图的改进[J];编辑学报;2006年01期
2 郭建顺;张学东;沈晓峰;冯立文;李文红;陈傲第;;科技期刊论文基金项目表达形式的规范化[J];编辑学报;2006年06期
3 王雅丽;;试论三网融合背景下的数字图书馆发展[J];图书与情报;2011年04期
4 丁子涵;王芹;蒋卫荣;;从引文分析看档案学与图书馆学、情报学的学科融合[J];档案学通讯;2012年02期
5 金眉;出版群体市场意识和能力培养的误区[J];编辑学刊;2001年05期
6 安秀芬;黄晓鹂;张霞;林朝英;;期刊工作文献计量学学术论文的关键词分析[J];中国科技期刊研究;2002年06期
7 刘兆娟;;科技期刊总目次的编排须规范化[J];中国科技期刊研究;2006年01期
8 任辉;刘冬梅;;学术期刊中“注释”编排格式的规范化[J];中国科技期刊研究;2006年02期
9 李建;邬亚文;夏小东;职桂叶;;通过编辑分析促进学术性期刊质量的提高[J];中国科技期刊研究;2006年05期
10 吴兆荣;文玉;;科技期刊中的省略号用法探讨[J];中国科技期刊研究;2006年05期
中国硕士学位论文全文数据库 前1条
1 王熙;复杂网络中的层次重叠社区发现及可视化[D];北京交通大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 胡艳,王惠文;一种海量数据的分析技术——符号数据分析及应用[J];北京航空航天大学学报(社会科学版);2004年02期
2 黄俊钦;图形化测量提高测量的性能和品位[J];北京航空航天大学学报;2001年03期
3 张炜;德国柏林工业大学的跨学科学术组织[J];比较教育研究;2003年09期
4 毛群燕;1987年情报学期刊的引文分析[J];图书与情报;1989年02期
5 ;建交叉学科新机制 创科学研究新成果——北京大学成立前沿交叉学科研究院 韩启德院士出任院长[J];北京大学学报(医学版);2006年02期
6 李业丽;秦臻;;一种改进的k-means算法[J];北京印刷学院学报;2007年02期
7 张丽英;理、工科教学相互渗透、交叉与综合的探讨[J];长春大学学报;2000年03期
8 赵菊扬;戴志敏;;高校科研管理创新的思考[J];成都中医药大学学报(教育科学版);2005年01期
9 祝小诗;;情报学与计算机科学在同一信息技术领域的研究比较[J];重庆图情研究;2007年02期
10 周一星;关于明确我国城镇概念和城镇人口统计口径的建议[J];城市规划;1986年03期
中国博士学位论文全文数据库 前2条
1 张连蓬;基于投影寻踪和非线性主曲线的高光谱遥感图像特征提取及分类研究[D];山东科技大学;2003年
2 陈悦;管理学学科演进的科学计量研究[D];大连理工大学;2006年
中国硕士学位论文全文数据库 前4条
1 刘卓;高维数据分析中的降维方法研究[D];中国人民解放军国防科学技术大学;2002年
2 唐小荃;利用引文分析图书馆学的相关学科[D];武汉大学;2005年
3 庞龙;科学引文分析的科学评价功能和意义[D];山西大学;2006年
4 徐金雷;专业搜索引擎的排序算法研究[D];南京师范大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 吴志丹;;基于知识发现和知识管理的决策支持系统研究[J];科技管理研究;2010年05期
2 方凌云;网络环境下企业客户关系管理的应用研究[J];软科学;2004年01期
3 钱榕,李欣,杨炳儒;经济全球化背景下竞争情报系统的研究[J];重庆工学院学报;2005年02期
4 万星火,檀亦丽;数据挖掘的聚类方法[J];统计与决策;2005年18期
5 刘明;;数据挖掘在社区户型决策的应用[J];甘肃农业;2006年01期
6 阮忠;吴启明;;数据挖掘和数据仓库在网络营销中的应用[J];农业网络信息;2008年05期
7 张丽杰;付宏波;郭建伟;;基于知识发现的数据挖掘技术分析与研究[J];知识经济;2010年23期
8 朱紫茂;;论知识经济时代企业物流信息化建设的发展方向[J];价值工程;2010年36期
9 刘胜华;;利用数据挖掘技术增强企业竞争优势[J];湖北经济学院学报(人文社会科学版);2005年02期
10 李晓辉;景妮;李广莉;;电子商务中的数据挖掘技术[J];商场现代化;2006年19期
中国重要会议论文全文数据库 前10条
1 杨光飞;党延忠;;不完美数据中的知识发现研究综述[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
2 董伯儒;林少培;王永文;;工程建设MIS中的知识发现和深化[A];中国土木工程学会计算机应用分会第七届年会论文集[C];1999年
3 张世海;刘晓燕;涂庆;欧进萍;王光远;;知识发现及其在高层结构智能选型中应用[A];计算机技术在工程建设中的应用——第十二届全国工程建设计算机应用学术会议论文集[C];2004年
4 万家华;刘冰;江早;;知识发现中的可视化技术[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
5 赵荣珍;杨娟;黄显华;;粗糙集理论的故障知识发现及其工程应用模式研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
6 董伯儒;林少培;王永文;;工程建设MIS中的知识发现和深化[A];中国土木工程学会计算机应用分会第七届年会土木工程计算机应用文集[C];1999年
7 段培俊;周东岱;;数据挖掘研究综述[A];2003年中国智能自动化会议论文集(下册)[C];2003年
8 张文修;徐萍;米据生;吴伟志;;知识系统与知识发现[A];中国系统工程学会模糊数学与模糊系统委员会第十一届年会论文选集[C];2002年
9 阮鸣梁;陈维默;;数据挖掘技术的发展与应用[A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集[C];2005年
10 杜培军;方涛;林卉;;遥感影像库中数据挖掘与知识发现的研究[A];第十四届全国遥感技术学术交流会论文摘要集[C];2003年
中国重要报纸全文数据库 前10条
1 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
2 中国科学院计算技术研究所 刘毅勇 何雄 李金山 廖浩均 孟亮 邓柱中;空间数据挖掘:变数据为知识[N];计算机世界;2005年
3 胡虎;突出信息化贡献水平 处理好三个关系[N];人民邮电;2007年
4 陈志楠;挖掘“不为人知的艺术”[N];科技日报;2009年
5 尤红梅;蔡雪晴:优势在于执行[N];中国企业报;2004年
6 汤天浩;人工智能技术:未来船舶系统的灵魂[N];中国船舶报;2005年
7 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
8 马炳厚;知识开发的创新成果[N];科技日报;2005年
9 本报记者  胡其峰;科技信息资源如何助力自主创新[N];光明日报;2006年
10 王广宇;如何游出“数据海洋”?[N];计算机世界;2003年
中国博士学位论文全文数据库 前10条
1 谢宗霞;太阳宁静区磁场流场特性知识发现的方法研究[D];哈尔滨工业大学;2010年
2 张云中;基于形式概念分析的Folksonomy知识发现研究[D];吉林大学;2012年
3 杨立;基于领域知识的知识发现研究[D];中国科学院研究生院(软件研究所);2005年
4 陈元;基于分类模型的知识发现过程研究[D];国防科学技术大学;2002年
5 李初民;基于网络管理数据库中性能数据的知识发现(KDD)研究[D];重庆大学;2001年
6 李刚;知识发现的图模型方法[D];中国科学院软件研究所;2001年
7 谢志鹏;基于概念格模型的知识发现研究[D];合肥工业大学;2001年
8 吴涛;构造性知识发现方法研究[D];安徽大学;2003年
9 刘刚;数据挖掘技术与分类算法研究[D];中国人民解放军信息工程大学;2004年
10 汤永川;关于不确定性推理理论与知识发现的研究[D];西南交通大学;2002年
中国硕士学位论文全文数据库 前10条
1 薛静;专家信息管理系统在CRM中的研究与应用——基于java技术的构架[D];西北工业大学;2001年
2 陈红叶;Web信息提取及知识发现方法研究[D];合肥工业大学;2002年
3 迟庆云;基于决策树的分类算法研究和应用[D];山东师范大学;2005年
4 王益玲;基于DCS实时信息的智能故障诊断系统的研究与设计[D];南京工业大学;2003年
5 李长源;关联规则挖掘算法研究[D];哈尔滨工程大学;2005年
6 郭国印;数据挖掘技术的研究及其在PLM中的应用[D];西北工业大学;2005年
7 谷宏群;数据挖掘中可视化方法研究[D];武汉大学;2005年
8 梁利莉;数据挖掘技术在CRM中的应用研究[D];首都经济贸易大学;2005年
9 刘娟;中药药对的量化分析与知识发现[D];成都中医药大学;2005年
10 黄律;基于粗糙集的多分类器组合及其在知识发现中的应用研究[D];长沙理工大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026