线性链条件随机场训练算法优化的研究
【摘要】:
由John Lafferty等人在2001年提出的条件随机域(conditional random fields,CRF)模型是机器学习领域的一个重要里程碑,它综合了以往机器学习中几种模型的优点,包括隐马尔可夫模型,最大熵隐马模型,同时也避免了MEMM中标记偏见的问题。因为它的这些优点,CRF被广泛应用于机器学习领域,特别是自然语言处理中,包括命名实体提取、词性标注等。
在有着广泛的应用和众多的优点的同时,CRF也存在着不足之处。其中一个显著的不足就是训练一个CRF模型需要耗费大量的计算资源。首先,CRF的训练需要耗费大量的内存资源,在进行大数据量的训练的时候,所使用的内存常常会超出微机的物理内存,使得操作系统使用磁盘作为交换空间,大量的I/O操作会严重影响训练效率;其次,CRF训练的计算本身也需要耗费大量的计算时间,数据量大的训练通常需要耗费数天甚至数周才能完成。这不仅仅是因为算法本身的复杂度,还跟目前的算法没能有效利用现代计算机硬件特性有关。
本研究的目的是,通过优化CRF的训练算法,使得算法可以有效利用现代CPU的特性,并使内存-磁盘间的数据交换操作得到优化,从而提高CRF模型的训练效率。同以往的CRF相关研究不同,本研究从一个计算机架构的角度研究了提高CRF训练效率的方法。就我们所知,目前通过优化算法来有效利用现代计算机特性来的研究也较多,但针对CRF算法的目前还尚未出现。由于CRF被广泛使用在机器学习领域,本研究可以让使用CRF的研究者和开发人员在测试、应用算法模型时节省大量的时间和精力。
本文从以下三个方面解决CRF训练效率低下的问题:
1.通过优化算法,降低CPU Cache失效率。设计一个适合Cache预取的算法,可以通过使用现代CPU的软件预取(software prefetching)指令,降低CPU Cache的失效率,从而减少cache失效带来的性能损失;
2.通过优化算法,使得算法中计算的并行性得到提高。设计算法充分利用CPU特性,可以提高CRF训练时计算的并行性;
3.设计基于外存的CRF训练算法。当内存使用很大时,可以让训练程序自主管理磁盘操作,避免让操作系统来管理,从而减少了大量的数据交换操作,大幅提高了效率。
本文实验结果显示,改进的CRF训练算法确实有效提高了训练效率,特别是对于规模越大的任务,效果的提升就越明显。表明本文的算法确实适合大规模的训练任务。
|
|
|
|
1 |
程兵,王莹,郑南宁,贾新春,袁泽剑,李青,卞正中;基于Markov随机场和FRAME模型的无监督图像分割[J];中国科学E辑;2004年04期 |
2 |
王建栋,冯前进,陈武凡;基于模糊增强的医学超声图像分割[J];中国医学物理学杂志;2005年02期 |
3 |
王荣霞,刘春原,杨小明;城市三维地基信息咨询系统的设计与开发[J];河北工业大学学报;2002年01期 |
4 |
胡净;胡洁;叶盛;;基于Markov随机场和Bayesian理论的脑内磁源重建[J];计算机科学;2003年09期 |
5 |
匡锦瑜,刘来福,朱俊秀,郭宇春;马尔可夫随机场与离散多值玻尔兹曼机[J];电子学报;1994年10期 |
6 |
李华北,赵杰文;基于Markov随机场的猪肉糜微结构图像模拟[J];农业机械学报;2001年02期 |
7 |
冯志林,尹建伟,陈刚,董金祥;彩色图像的马尔可夫随机场恢复算法[J];浙江大学学报(工学版);2004年09期 |
8 |
黄英,丁晓青,王生进;基于Markov随机场的三维物体识别算法[J];清华大学学报(自然科学版);2005年01期 |
9 |
曹永锋,孙洪,杨文,徐新;基于MPM准则的无监督SAR图像分割[J];武汉大学学报(信息科学版);2004年09期 |
10 |
汪涛,庄新华,邢小良;线元马尔可夫随机场模型和重建[J];电子学报;1992年07期 |
11 |
匡锦瑜,姚小燕;一种低信噪比图像的模拟退火恢复算法[J];计算机学报;1991年07期 |
12 |
汪涛,邢小良,庄新华;一种新的边缘检测算法[J];电子学报;1992年01期 |
13 |
匡锦瑜,王颖;多尺度边缘检测与图像分割的马尔可夫随机场模型[J];北京师范大学学报(自然科学版);1996年03期 |
14 |
刘一舟,罗斌,罗宏建;基于Matlab平台的含噪图像恢复[J];现代电子技术;2004年21期 |
15 |
;图象的随机场模拟、估计和分形的研究[J];北京理工大学学报;1990年02期 |
16 |
徐全智;关于平面Clipping随机场的若干性质[J];电子科技大学学报;1990年02期 |
17 |
邱振戈,钱曾波,马东洋,黄野;基于Markov随机场的彩色图像区域分析方法[J];测绘学院学报;1999年02期 |
18 |
王书舟;伞冶;;支持向量机的训练算法综述[J];智能系统学报;2008年06期 |
19 |
刘建昌;基于神经网络的自适应厚度控制[J];钢铁;1999年11期 |
20 |
王晓哲,顾树生,吴成东,高明;一种新的加权目标函数下的神经网络训练方法[J];东北大学学报(自然科学版);2001年06期 |
|