收藏本站
《北京工业大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

面向片上异构多核系统的机器学习算法并行化技术研究

高放  
【摘要】:随着物联网的兴起,大数据理论的诞生,以及移动互联网的深度应用,当今社会已经进入信息化、数字化、智能化全面发展的时代。大量信息的处理以及各种智能化应用需要依托于智能化设备来实现,也就是各种嵌入式设备。这种趋势一方面使机器学习算法起着越来越重要的作用,另一方面也令传统嵌入式设备难以满足大量增长的复杂算法及海量数据对计算能力的需求。高性能嵌入式计算是解决嵌入式设备计算能力不足的有效手段。本论文针对基于机器学习技术的新型智能化嵌入式应用计算量原来越高,传统嵌入式系统计算能力难以满足其需求的问题,从理论、技术、实现三个层面探索使用多核高性能嵌入式计算手段提高嵌入式系统对于复杂机器学习算法的处理性能。首先从嵌入式多核系统体系结构研究入手,确定CPU与各种加速器相结合的异构多核结构是最有效、适应能力最广的的高性能嵌入式计算体系结构,并提出异构多核高性能计算系统的通用体系结构以及基于任务集合的高性能计算程序执行模型;在多核体系结构与执行模型基础上,研究典型机器学习算法机理及算法特性(如Boosting、SVM、MLP及CNN等),进而提出针对性的并行化策略,并针对一个适合嵌入式应用的高性能计算平台Parallella研究其并行算法及软件设计;之后进一步进行可扩展性研究,提出其扩展性度量指标并实现一种Parallella集群式两级并行计算系统,使计算性能得到进一步提升;最后建立一种面向Parallella平台的机器学习应用快速开发框架PML-RADF,显著降低机器学习类嵌入式应用的开发难度。通过一系列实验证明本论文提出的并行化算法及快速开发框架能够显著提高机器学习算法在多核嵌入式系统中的执行效率并降低开发难度。通过对片上异构多核系统机器学习相关技术的研究,本论文主要创新性研究工作如下:(1)提出一种针对异构多核高性能计算系统的通用体系结构模型及模块化程序执行模型。通过研究高性能计算系统体系结构,首先确定通用CPU与专用加速器协作进行高性能计算是未来高性能嵌入式计算的主流结构,进而提出基于CPU与多核加速器形式的异构多核体系结构模型,之后将嵌入式应用程序划分划分为多层任务结构,形成一系列控制单元与计算单元组合的任务集合,提出异构多核体系结构下的程序执行模型。该执行模型通过任务拆分机制及多核映射方法有效指导嵌入式高性能计算应用的设计工作。(2)提出针对异构多核体系结构的常见机器学习算法并行优化策略及应用算法。从数据并行和模型并行两方面研究图像识别领域常用机器学习算法的并行化策略,提出适合多核平台的机器学习并行化方法,主要包括基于数据并行的AdaBoost并行分类方法、基于稀疏理论与数据并行的SVM训练并行化方法、基于模型并行的多层感知机并行分类方法以及基于混合并行理论的卷积神经网络并行分类方法。进而从事基于Parallella高性能嵌入式计算平台上实际机器学习应用的实现算法研究,提出一系列针对Parallella平台的机器学习并行化关键算法及实现技术,提出基于任务拆分和动态分配的并行AdaBoost实现算法、基于数据镜像的多层感知机并行实现算法以及基于全局内存的卷积神经网络实现算法等,提出一系列存储分配机制、任务调度策略以及数据通信方式等,并在此基础上进行可扩展性研究。通过实验证明比传统并行方法显著提高机器学习任务的执行效率,进而实现多种机器学习应用实例。(3)针对异构多核体系结构,提出一套可扩展的机器学习应用快速开发框架PML-RADF。通过研究机器学习并行加速算法库,数据维护机制及多层通信机制,设计开发框架的软件架构并进行实现技术研究,最终实现具有通用性、规模可扩展以及算法可扩展能力快速开发框架。并由此框架为依托引申出一种完整的机器学习应用快速开发流程,可以降低机器学习应用在嵌入式异构多核系统中的开发难度,提高开发速度,便于进行实际应用。
【学位授予单位】:北京工业大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:TP181

【相似文献】
中国期刊全文数据库 前10条
1 张伟;姜恺;刘洪;;直接模拟Monte Carlo方法并行化研究[J];计算机应用与软件;2009年09期
2 吴正娟;职为梅;杨勇;范明;;并行化的粒子群技术[J];微计算机信息;2009年36期
3 齐书阳;;迎接并行化的明天[J];软件世界;2009年06期
4 曹琳,杨学军,金国华;两种并行化机制的分析[J];计算机研究与发展;1993年09期
5 金国华,陈福接;并行化技术与工具[J];计算机研究与发展;1996年07期
6 蔡立志,童维勤,廖文昭;序列拼装程序的并行化研究与实现[J];计算机工程与应用;2003年14期
7 王伟;潘建伟;;有限差分法的并行化计算实现[J];电脑知识与技术;2008年07期
8 程锦松;;迭代法的并行化[J];安徽大学学报(自然科学版);1997年03期
9 陈再高;王玥;王建国;张殿辉;付梅艳;乔海亮;袁媛;;三维粒子模拟并行化技术研究[J];计算机工程与科学;2009年11期
10 赵凤治;地震作业数据处理并行化的几个问题[J];计算机系统应用;1994年10期
中国重要会议论文全文数据库 前10条
1 兰彤;冯玉才;肖伟器;;空间连接处理的并行化研究[A];数据库研究进展97——第十四届全国数据库学术会议论文集(上)[C];1997年
2 张雯;骆志刚;赵翔;王金华;靳新;;剪接比对软件sim4的并行化研究与实现[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
3 王本龙;龚凯;刘桦;;自由表面流动问题的并行化SPH方法求解[A];中国力学学会学术大会'2009论文摘要集[C];2009年
4 王峰;杨建俊;张天爵;许淑艳;;不同操作平台上的MCNP并行化计算[A];中国原子能科学研究院年报 2009[C];2010年
5 徐金秀;张天刚;;NCC区域气候模式算法分析及并行化实现[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
6 陈皓;罗月童;刘晓平;;基于MPI的光子映射算法并行化[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
7 曹琰;王清贤;魏强;尹中旭;;基于相容和搜索结合的并行约束求解方法[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年
8 蔡德霞;钟诚;韦兴柳;林孔升;;多核系统上任意两序列公共元素的并行查找[A];全国第22届计算机技术与应用学术会议(CACIS·2011)暨全国第3届安全关键技术与应用(SCA·2011)学术会议论文摘要集[C];2011年
9 王珏;;归纳机器学习[A];2001年中国智能自动化会议论文集(上册)[C];2001年
10 黄宇光;;整体同步并行计算方法的现状与发展[A];信息科学与微电子技术:中国科协第三届青年学术年会论文集[C];1998年
中国重要报纸全文数据库 前3条
1 ;服务器软件的并行化革命[N];网络世界;2006年
2 谢涛;英特尔:忽视并行化软件后果很危险[N];电脑商报;2008年
3 记者 鲁媛媛;英特尔软件进入并行时代[N];网络世界;2009年
中国博士学位论文全文数据库 前10条
1 高放;面向片上异构多核系统的机器学习算法并行化技术研究[D];北京工业大学;2017年
2 郭琦;异构多核可重构平台指令并行化关键问题研究[D];中国科学技术大学;2015年
3 程兴国;仿生算法的动态反馈机制及其并行化实现方法研究[D];华南理工大学;2013年
4 丁晓宁;面向CFD的交互式并行化技术研究[D];西北工业大学;2002年
5 张平;并行化编译器中并行程序自动生成和性能优化技术研究[D];解放军信息工程大学;2006年
6 傅游;稀薄气体Monte Carlo数值仿真并行化技术研究与实现[D];西北工业大学;2002年
7 董春丽;并行化编译中数据和计算的自动划分及优化技术研究[D];解放军信息工程大学;2007年
8 黄乐天;片上多核系统能效及可靠性优化方法研究[D];电子科技大学;2016年
9 于绩洋;适用于高性能计算节点的多核系统协同优化设计[D];浙江大学;2015年
10 张琦;多核系统中的程序性能优化研究[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 荣卓波;基于Hadoop的并行化算法实现及GPS数据实例分析[D];西南大学;2015年
2 赖梓昌;基于MPCore多核并行化的宽景视觉研究与实现[D];西南交通大学;2015年
3 杨睿;基于并行计算的基因序列快速比对方法研究[D];浙江大学;2015年
4 王心阳;一种基于MapReduce模型的并行化TSP算法研究[D];电子科技大学;2015年
5 赵正委;基于BSP模型的网络最大流算法的并行化研究与实现[D];电子科技大学;2014年
6 康少华;空间碎片探测软件的并行化及WCRT分析[D];北京理工大学;2015年
7 王向辉;嵌入式浏览器并行化的研究与设计[D];电子科技大学;2014年
8 孙洁;用于超电大散射计算MLFMA并行化及其关键问题的研究[D];电子科技大学;2014年
9 刘毅;LTE系统中关键算法的研究[D];电子科技大学;2014年
10 李京竹;基于云计算的智能交通系统数据预处理与并行化技术研究[D];国防科学技术大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026