云计算中MapReduce分布式并行处理框架的研究
【摘要】:大数据是互联网时代产生的格式各异、结构各不相同的数据的统称,具有数据量极大的特点。随着互联网在各个领域的深入普及,大数据产生的速度越来越快,呈现指数增长。近年来,人们将目光投放到云计算技术上,通过将计算机技术和互联网技术结合,引入新的云计算技术,解决大数据的处理问题。分布式计算(Distributed Computing)是将数量级大的工程数据划分成若干个小分块,由多个计算机即计算节点分别来计算后将运算结果进行上传,最终把结果进行合并从而得出统一的数据结论的计算过程。并行计算(Parallel Computing)指的是将一个总的计算任务划分成多个子分块,在具备了并行处理能力的计算节点上,分配给不同的处理器,各处理器之间遵循调配机制并行地执行子分块任务,最终达到提升计算规模或者提高计算速度的目的。在本设计中利用的是Hadoop分布式架构,其主要由3个子项目组成:MapReduce(编程模型和软件框架,用于在大规模计算机集群上编写对大数据进行快速处理的并行化程序)、HDFS(构建于廉价计算机集群之上的分布式文件系统)和Hadoop Common(为整体架构提供基础支撑功能)。着重研究了MapReduce处理框架并建立了一个能够对数据进行可靠处理的分布式系统平台,使其以分布式并行工作方式加快处理速度,从而体现出其在云计算应用中处理大量数据时的优势。最终通过程序测试来了分析MapReduce框架在数据处理中的流程及特点。
|
|
|
|
1 |
钱少先;关于并行计算的若干问题[J];安庆师范学院学报(自然科学版);2001年02期 |
2 |
孙广中;陈国良;徐云;郑启龙;吴俊敏;;并行计算系列课程教学团队建设[J];中国大学教学;2008年02期 |
3 |
孙广中;徐云;郑启龙;吴俊敏;陈国良;;并行计算系列课程教学团队建设[J];计算机教育;2008年15期 |
4 |
陆克中;孙宏元;;同构集群中并行计算熵研究[J];深圳大学学报(理工版);2009年01期 |
5 |
胡霞;;并行计算如何用于科学问题研究[J];科技资讯;2009年27期 |
6 |
颜宝勇;快速富里叶变换的并行计算[J];计算机工程与科学;1984年03期 |
7 |
吴靖;;一种用于基因序列比较的并行计算方法[J];国外医学.生物医学工程分册;1992年01期 |
8 |
李斌;并行计算用的计算机和模型[J];管理科学文摘;1996年04期 |
9 |
魏臻;;高性能计算,高兴能计算[J];中国教育网络;2010年06期 |
10 |
刘杰,迟利华,胡庆丰;优化并行计算的性能评价[J];计算机工程与设计;2000年06期 |
11 |
刘赫男,罗霄,高晓东;并行计算的现状与发展[J];煤;2001年01期 |
12 |
孙安香,张理论,宋君强;并行计算的数据重分配[J];国防科技大学学报;2002年04期 |
13 |
沈韫,冉蜀阳;网络并行计算在核物理计算中的应用研究[J];计算机工程;2003年01期 |
14 |
宋安军,彭勤科,胡保生;并行计算模型在集群环境下的适应性[J];计算机工程;2003年18期 |
15 |
张信一,李代平,章文;网络并行计算在物探数据处理中的应用[J];计算机工程;2004年05期 |
16 |
李代平,罗寿文,张信一,方海翔;网络并行计算平台新架构[J];计算机应用研究;2004年10期 |
17 |
曹卫;并行计算——计算科学与工程的核心[J];上海城市管理职业技术学院学报;2004年S1期 |
18 |
王庆先;孙世新;尚明生;刘宴兵;;并行计算模型研究[J];计算机科学;2004年09期 |
19 |
王琥,李光耀,钟志华;有限元并行计算中网格自动分区的优化[J];工程力学;2005年S1期 |
20 |
王欢;都志辉;;并行计算模型对比分析[J];计算机科学;2005年12期 |
|