收藏本站
收藏 | 论文排版

虚拟筛选海量并行任务管理系统中数据流的管理

张华剑  
【摘要】: 虚拟筛选是在计算机上针对特定靶标蛋白筛选出最合适的候选药物的过程。随着网格计算技术的发展,科学家越来越倾向于利用网格环境进行药物的大规模虚拟筛选以减少新药研制的成本和时间。大规模虚拟筛选涉及海量数据,待筛选的小分子化合物通常数以百万计。 在网格环境下进行基于分子对接的大规模虚拟筛选应用,通常的做法是科学家手动查询小分子化合物并分组,在网格平台上编辑多个对接作业依次对分组进行计算,手动下载所有对接结果。虽然利用了网格强大的计算能力,但是科学家的工作非常复杂和繁琐,并且需要学习大量计算机领域知识。以CSGrid网格平台为基础设计的海量并行任务管理系统,目的是实现大规模虚拟筛选应用在网格平台上的自动执行,从而将科学家从繁琐的工作中解脱出来。海量并行任务管理系统将虚拟筛选应用分成多个并行作业在网格平台上计算,作业流和数据流的管理非常重要。本文的研究重点,就是如何设计系统中的数据流管理功能,制定合理的数据流配置策略,使海量数据流配合并行作业调度策略,实现网格环境下大规模虚拟筛选应用的高效自动运行,提高网格资源的利用率。 本文设计的数据流管理功能由三个模块实现。第一个模块是查询条件定制接口,该模块为用户提供了一个定制数据查询条件的图形编辑器:第二个模块是数据查询、分组及传输Web Service,该模块从分布式小分子化合物数据库中查询出符合条件的小分子化合物,按可旋转键数排序并分组,再将分组上传至需要数据的网格节点。第三个模块是统一数据管理空间,该模块提供了所有网格节点数据的全局视图,可以实现虚拟筛选结果的并行下载。本文重点从用户体验和实现技术方面对各个模块进行了深入的探讨。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 杨旭波,蔡文立,石教英;通用的交互式可视化环境[J];软件学报;1996年09期
2 林永宁;计算机在电视片生产管理中的应用[J];影视技术;1996年03期
3 詹承华;杨志义;杨柳;;异质多处理器芯片中的数据流核心设计[J];电子技术应用;2006年03期
4 王金栋;周良;张磊;丁秋林;;面向分布式数据流系统的可扩展负载平衡算法[J];应用科学学报;2006年03期
5 刁树民;王永利;张晓勇;;一种数据流中奇异数据的自适应恢复方法[J];计算机工程;2007年15期
6 刘学军;胡平;徐宏炳;董逸生;;基于滑动窗口的在线数据流增量聚集查询[J];计算机工程;2007年21期
7 李国徽;陈辉;杨兵;向军;陈刚;;基于概率模型的数据流预测查询算法[J];计算机科学;2008年04期
8 王磊;黄志球;朱小栋;沈国华;程亮;;数据流中基于事务链表组的频繁闭项集挖掘[J];计算机工程与设计;2008年08期
9 邝祝芳;阳国贵;辛动军;;SWFPM:一种有效的数据流频繁项挖掘算法[J];计算机应用研究;2009年02期
10 张宁;;离群点检测算法研究[J];桂林电子科技大学学报;2009年01期
11 曼苏尔;于晋龙;马书惠;;一种基于数据流跟踪的无线传感网能量模型及网络优化[J];传感技术学报;2009年04期
12 张忠平;梁永欣;;基于反k近邻的流数据离群点挖掘算法[J];计算机工程;2009年12期
13 ;关于多载波调制技术[J];电子质量;2010年02期
14 陈刚;顾进广;李思川;;基于统计的无阻塞连接算法[J];计算机科学;2010年12期
15 王海波;王宪鹏;王芳;陈志国;;一种基于网格和最小生成树的数据流聚类算法[J];计算机系统应用;2011年02期
16 史长捷;;Teledyne RMPS遥测地面站简介及述评[J];遥测遥控;1990年03期
17 杨则正;大数据流的处理[J];管理科学文摘;1994年10期
18 谭文恕;对变电站自动化系统通信网络的要求及通信网络标准化的动态[J];电网技术;1998年12期
19 马宪军,徐永忠;Internet服务质量相关技术的发展[J];电信技术;1998年12期
20 徐天伟,夏幼明,李凯佳;数据流图描述语言的研究与设计[J];云南师范大学学报(自然科学版);2003年03期
中国重要会议论文全文数据库 前10条
1 蔡致远;魏藜;钱卫宁;周傲英;;DEODS:快速准确的数据流密度估计[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 丁健;李建中;李金宝;高宏;;数据流上的并行决策树构成算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
3 李康宁;樊小泊;陈红;;一种数据流滑动窗口范围连接上基于局部特征的查询索引[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
4 谭建龙;郭丽;刘萍;沈星星;;建立数据流管理系统GodRiver[A];全国网络与信息安全技术研讨会’2004论文集[C];2004年
5 后小亮;刘奇志;高先锋;檀宝权;;大量多态数据流的综合压缩算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
6 李爱平;杨庆民;甘亮;;基于Dwarf的数据流立方体的研究与实现[A];第15届全国信息存储技术学术会议论文集[C];2008年
7 林子雨;林琛;冯少荣;张东站;;MESHJOIN~*:实时数据仓库环境下的数据流更新算法[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
8 李国徽;黄蕾;;数据流环境下的基于加权网格的聚类算法研究[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
9 赵哲;孙婷;陈立军;崔斌;;一种数据流上的快速分段算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
10 王潇;卢阳;陈立军;;网内查询处理中的一种基于数据流共享的过滤查询算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 陈刚;数据流的无阻塞连接算法研究[D];华中科技大学;2010年
2 蒋纲;数据包在无线网络中调度策略的研究[D];华中科技大学;2004年
3 曹锋;数据流聚类分析算法[D];复旦大学;2006年
4 陈辉;数据流频繁模式挖掘及数据预测算法研究[D];华中科技大学;2008年
5 孙玉芬;基于网格方法的聚类算法研究[D];华中科技大学;2006年
6 刘青宝;模糊、动态多维数据建模理论与方法研究[D];国防科学技术大学;2006年
7 王鹏;数据流上的分类算法的研究[D];复旦大学;2007年
8 黄芹华;隐私保持数据挖掘与知识发现研究[D];上海大学;2007年
9 邓娜;基于最优Hankel范数近似的线性相位IIR滤波器设计及其应用研究[D];东华大学;2008年
10 郭建奎;数据流相似性查询及模式挖掘研究[D];复旦大学;2008年
中国硕士学位论文全文数据库 前10条
1 张华剑;虚拟筛选海量并行任务管理系统中数据流的管理[D];兰州大学;2010年
2 杜安明;模具企业管理模式及管理信息系统设计[D];重庆大学;2004年
3 张庆;一种基于UML状态图的类级测试技术的研究与实现[D];电子科技大学;2005年
4 赵国斌;铁路试点数据中心设计及实现[D];北京交通大学;2007年
5 宫剑飞;客户区域化归属问题的研究[D];哈尔滨工程大学;2009年
6 贺春亮;基于数据流滑动窗口的降载技术研究[D];燕山大学;2009年
7 牟柳晨;基于ASP技术的远程机械设计系统的实施方法研究[D];四川大学;2004年
8 郭秀荣;RBF神经网络在电喷发动机故障诊断中的应用研究[D];东北林业大学;2005年
9 张继超;数据流的变化检测算法及其在实时汇率数据流异常检测中的应用[D];郑州大学;2005年
10 刘波;基于安全分区和IEC61970的调度数据共享平台中若干问题研究[D];浙江大学;2006年
中国重要报纸全文数据库 前10条
1 本报记者 朱杰;优化数据流构建移动未来网络[N];中国计算机报;2010年
2 记者 崔凌云;任务全覆盖 过程全控制 信息全公开 考核更科学[N];兰州日报;2011年
3 谭啸;打通企业数据流[N];计算机世界;2005年
4 深圳市物业发展(集团)股份有限公司 程贵平;以理顺数据流为出发点[N];网络世界;2002年
5 本报记者 卢子月;WIPS捕捉空中数据流[N];通信产业报;2010年
6 李;金山毒霸力推数据流杀毒技术[N];计算机世界;2007年
7 杨春光 张钝;数据流托起信息化训练方舟[N];解放军报;2003年
8 IBM大中华区董事长及首席执行总裁 钱大群;用领导者价值观改善思维[N];中国经营报;2011年
9 特约撰稿人 奇琳;B3G的多天线技术[N];通信产业报;2006年
10 记者 杨晓丹通讯员 朱莹;天津石化建起全过程闭环数据流[N];中国石化报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978