收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

面向汉语语音的敏感信息检测与加密语音检索方法研究

何少芳  
【摘要】:面向汉语语音的敏感信息检测是语音信息检索的一个应用方向。在基于查询样例的语音关键词检测中,检索速度与精度一直是制约这类检测技术发展的重要因素,因此有必要对现有的算法进一步改进,使它们在检索速度和精度方面都能大幅度提升。与英语相比,汉语拼音具有其自身的结构特性,而目前对基于查询样例的汉语语音关键词检测方面的研究不多,如何提高汉语语音的敏感信息检测性能是需要研究的重要问题。另一方面,在即时语音通信中,语音将在不可信的信道中传输以及在半可信状态下的云服务器中存储,如何保障语音信息的安全以及实现海量加密语音数据的快速准确检索也是语音信息检索领域急需解决的问题。语音信号特征的提取是语音信号处理的基础环节,而语音特征的优劣将会影响语音信息检索系统的性能。本文从提取更优的语音特征入手,在探索汉语音节分割新方法的基础上,提出了融合上下界信息的汉语语音样例关键词快速检测算法、基于盲源分离的双密钥语音加密算法以及基于音节级感知哈希的加密语音检索方法。具体说来,本文的贡献主要体现在五个方面。第一,在语音特征提取方面,针对多重分形去趋势波动分析语音特征的缺陷,提出了改进的多重分形去趋势波动分析方法,得到鲁棒性和区分性更好的语音特征。以该语音特征为基础,本文展开了对汉语音节分割、敏感语音信息检测以及加密语音检索等问题的研究。第二,在提出的汉语音节分割新方法中,以改进的多重分形语音特征为基础,结合汉语拼音特有的声韵母结构,利用二级判别法提取浊音并进行声韵母结构判断,最后通过搜索一阶差分的极值点实现汉语拼音的音节分割。该音节分割方法在很大程度上有效解决了过检和漏检问题。此外,综合利用多重分形特征和汉语音节分割,引入了基于声韵母片段模型的后验概率特征。这种后验概率特征与改进的多重分形特征相比,具有更好的鲁棒性和区分性。第三,在语音数据的敏感信息检测中,提出了融合分段累积近似的上、下界估计及分段动态时间规整的快速语音样例检测方法,在保持检索精度不变的条件下实现了速度更快的语音样例关键词检测;另外,还对虚拟反馈技术加以改进,提出了基于相似度的相关区域重排序方法。改进后的重排序方法在相关区域个数设置合理时,修正后得到的检索结果能在检索速度和精度方面都得到很大提高。第四,针对即时语音的安全问题,利用未定盲源分离的难解性、一次密垫的安全性以及混沌信号的初值敏感性,提出计算复杂度低但安全性高的语音加密算法,为保障手持智能设备中的语音安全提供技术支持。第五,对于加密语音数据的检索,先利用基于声韵母片段模型的后验概率特征生成音节级感知哈希,再由音节感知哈希构建语音段的感知哈希序列;然后,在无须下载和解密的情况下,通过在系统哈希表中搜索与查询语音的感知哈希序列等长且首部相匹配的感知哈希实现加密语音数据库的快速检索。相比其它利用时频语音特征生成的感知哈希序列,利用基于声韵母片段模型的后验概率特征生成的音节级感知哈希序列具有更好的鲁棒性和区分性;更重要的是,只搜索等长且首部相匹配的感知哈希序列的检索策略使海量数据中的检索速度得到很大程度上的提升;此外,在不同的语音信号处理操作下,提出的检索算法取得了很高的查全率和查准率。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 杨明,刘嵊超,阙沛文;基于混沌的信息检测技术[J];机械工艺师;2000年10期
2 朱涛;常国岑;郭戎潇;李项军;;基于局部信息检测的多粒度社团挖掘方法[J];计算机科学;2009年08期
3 凌肇元;;弱电信息检测[J];电气时代;1984年01期
4 欧阳荣彪;;电视特征信息检测的若干方法[J];光学工程;1980年05期
5 欧阳荣彪;;电视特征信息检测的若干方法[J];电视技术;1982年01期
6 冯占岭;试论电子信息检测技术[J];电子产品世界;1997年02期
7 张国伟,施文康,卢秋红,吉小军;基于混沌的信息检测技术[J];计算机自动测量与控制;2002年10期
8 邰海军;杨超;孙志刚;;病态信息检测中检测强度的研究[J];兵工自动化;2008年07期
9 邵忻;徐倩漪;;网络伪装不良信息检测方法的研究与仿真[J];计算机仿真;2012年02期
10 庞海杰;;面向文本情感分析的商品评价信息检测[J];计算机应用;2012年07期
11 董文军;;超声波在道路车辆信息检测中的应用[J];机械工程师;2007年03期
12 刘莺迎;;主机敏感信息检测系统设计与实现[J];信息与电脑(理论版);2012年11期
13 赵秀英,杨永正,杨敏;707生物表面信息检测方法研究[J];激光杂志;1995年05期
14 刘志强;汪澎;秦洪懋;仲晶晶;宋世亮;;基于多信息检测的车辆智能防撞预警技术研究[J];中国安全科学学报;2010年01期
15 田亮,徐孟春,朱卫东,王立彬;基于特征值的网络信息检测与审计[J];计算机与现代化;2004年06期
16 黄领;吴援明;;一种多任务信息检测与通信系统设计[J];计算机应用;2006年04期
17 李娜;粟梅;;基于视频的交通信息检测算法研究[J];电脑知识与技术;2010年29期
18 陈华城;杜学绘;陈性元;夏春涛;;基于兴趣本体的文档敏感信息检测方法[J];计算机应用;2012年11期
19 曹瑞昌,吴建明;多序列迭加生成值的合理性判定——病态信息检测案例[J];计算机工程与应用;2003年26期
20 马之力;刘浩;刘淳;李雪红;;基于移动Agent的重要信息保护系统设计与实现[J];电力信息与通信技术;2013年10期
中国重要会议论文全文数据库 前10条
1 徐德;常发亮;孙同景;;低成本集散信息检测管理系统[A];1996中国控制与决策学术年会论文集[C];1996年
2 胡翊;高隽;范之国;张翼;;基于AT91RM9200的大气偏振信息检测系统设计[A];中国仪器仪表学会第十一届青年学术会议论文集[C];2009年
3 马宏伟;聂珍;尚长春;;煤矿救援机器人环境信息检测与处理系统研究[A];第七届全国信息获取与处理学术会议论文集[C];2009年
4 曾莱蓓;孙星明;向凌云;罗纲;;基于虚词变换的文本隐藏信息检测方法研究[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
5 张宣;赵军平;郑兵;宋浩;宋伟;;基于双模卫星定位、生命信息检测和无线传输终端的设计[A];第一届中国卫星导航学术年会论文集(下)[C];2010年
6 刘子豪;庄毅;;一种电子邮件敏感信息检测算法[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
7 罗骏;欧智坚;;一种高效的语音关键词检索系统[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
8 王美春;马维海;盖如栋;;基于Δ调制动力系统在语音加密方面的研究[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
9 万新;赵良;何瑜;;医药食品领域发明关键词检索要素的划分[A];2014年中华全国专利代理人协会年会第五届知识产权论坛论文(第三部分)[C];2014年
10 刘勘;刘萍;;一种对学术论文关键词权值的动态调整方法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
中国博士学位论文全文数据库 前6条
1 何少芳;面向汉语语音的敏感信息检测与加密语音检索方法研究[D];湖南大学;2017年
2 李璐旸;基于表示学习的虚假信息检测研究[D];哈尔滨工业大学;2017年
3 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
4 向凌云;文本信息隐藏和隐藏信息检测研究[D];湖南大学;2011年
5 伍浩铖;社区问答搜索中排序方法的研究[D];中国科学技术大学;2017年
6 张希翔;面向语音环境的情感补偿推荐模型及方法研究[D];湖南大学;2017年
中国硕士学位论文全文数据库 前10条
1 李阳;基于AMR的交通信息检测算法研究[D];长安大学;2015年
2 杨正云;道路车辆车标信息检测研究[D];贵州民族大学;2016年
3 郭婷;负性情绪对隐蔽信息检测(CIT)效果的影响[D];东北师范大学;2016年
4 张强;面向移动端的停车位信息检测及发布系统设计与开发[D];浙江工业大学;2016年
5 张严;跨领域模糊限制信息检测研究[D];大连理工大学;2014年
6 张希;神经肌肉电刺激诱发的双相运动疲劳信息检测与处理技术研究[D];天津大学;2010年
7 陈华城;基于本体的文档敏感信息检测关键技术研究[D];解放军信息工程大学;2013年
8 杨凯帆;微博垃圾信息检测[D];中国科学技术大学;2015年
9 杨秀峰;基于神经网络的语音转换算法研究[D];西安建筑科技大学;2017年
10 段雨宁;MELP算法的研究及其嵌入式平台的实现[D];北京邮电大学;2017年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978