基于i-vector的语种识别系统设计与实现
【摘要】:近年来,随着信息技术的快速发展和国际化交流的不断深入,多语言交流需求在不断增大,语种识别技术在智能语音领域中的重要性也在不断提高。然而,当前的语种识别技术主要停留在算法研究阶段,已有的语种识别系统也主要依赖用户上传的语音文件进行识别,交互方式单一且繁琐。若能实现一个方便高效的语种识别系统,能使语种识别技术向应用化更近一步。本文针对目前语种识别系统级实现较少且已有系统交互方式单一且繁琐的问题,设计并实现了一个基于i-vector的语种识别系统,具体研究内容如下:本文完成了基于i-vector的语种识别系统设计。采用了高内聚、低耦合的分层设计方案,从系统需求出发,完成了语种识别系统的总体设计和分层设计。系统设计包括数据采集层、数据传输层、算法分析层、系统管理层以及系统可视化层这五个层次的设计。其中数据采集层由实时数据采集模块和离线文件采集模块组成,数据传输层由语音数据传输模块和系统信令传输模块组成,算法分析层包括语音预处理、特征提取与融合、i-vector提取以及语种判别这四个部分,系统管理层包括用户管理、设备管理以及数据管理这三个模块,系统可视化层包括前端交互页面展示和图表可视化这两个部分。本文完成了基于i-vector的语种识别系统实现。在完成语种识别系统设计的条件下,先后完成了系统中数据采集层、数据传输层、算法分析层、系统管理层以及系统可视化层的实现。其中数据采集层支持麦克风模组拾音和离线文件两种语音数据采集方式。数据传输层负责将语音数据和系统信令传输到业务后台,然后由业务后台调用算法分析层的语种识别算法对语音数据进行分类识别。系统管理层和系统可视化层支持用户和设备更为友好的接入系统并对语种识别数据进行管理。最后进行了详尽的测试和分析,结果表明本系统可以在14s内完成整个语种识别任务,且识别准确率在87%以上。