收藏本站
《中国科学技术大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于多特征的说话人分割与聚类的研究

凌锦雯  
【摘要】:说话人分割与聚类(Speaker diarization)主要任务是在没有任何的先验知识的情况下,从一段录音资料中区分不同话者的说话区段,并且一一标注出来。说话人分割与聚类有很多广泛的应用,如说话人的自适应、话者追踪、说话人检索等领域。它主要涉及两大语音处理课题:说话人分割和说话人聚类。 目前分割与聚类主要基于统计的方法,由于没有先验知识,话者的数目和信息未知,导致样本信息过少,最终影响该方法的准确性。本文在现有的分割与聚类研究成果基础上,针对上述说话人可用信息过少的问题,提出了一种基于多特征的,多层次的话者切分的框架,并对其中涉及到的相关算法进行了下述的研究: 首先,对分割与聚类系统中关键技术进行了阐述和分析,重点研究了特征分析与抽取、说话人模型的构建、话者分割、话者聚类算法。 第二,为了充分利用话者的信息,提出了一种声道参数和音源参数组合的多特征方法,并对参数进行特征选择,从而充分利用有限的参数信息,进一步提升了系统性能。 第三,考察了不同距离测度的选择对语音分割的影响,减少了因分割错误而导致的错误累积,并深入研究了基于单类SVM的新的分割算法,实验验证了该算法有效性。 第四,针对传统的话者分割聚类算法中切分准确度受到话者信息制约的问题等问题,引入了重分割和重聚类的机制,采用基于进化隐马尔科夫模型(EHMM)的维特比译码重分割方法以及基于距离测度和贝叶斯信息准则的分层聚类算法,实验结果验证了该系统的具有良好性能。
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TN912.34

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 吕声,尹俊勋;同语种说话人转换的实现[J];移动通信;2004年S3期
2 田松乾;语用学在英语语法教学中的作用[J];现代情报;2000年05期
3 夏菁,尹俊勋,黄建成,黄锋;基于正弦加噪声模型的说话人转换方法[J];电声技术;2005年02期
4 勾轶,刘晓丽,陈长征;基于小波与神经网络的说话人身份识别[J];沈阳工业大学学报;2005年01期
5 黄金明;说话人身份识别系统的设计与实现[J];计算机工程;2004年S1期
6 俞振利,张礼和;从任意连续语音中实时提取说话人特征及三维显示[J];浙江大学学报(理学版);1992年04期
7 岳喜才,伍晓宇,郑崇勋;用神经阵列网络进行文本无关的说话人识别[J];声学学报(中文版);2000年03期
8 高敬惠;李玉海;刘国丽;;基于期望最大理论的无监督图像分割[J];微计算机信息;2007年24期
9 谭立球;夏利民;谷士文;;基于信息瓶颈算法的图像分割[J];计算机工程;2008年18期
10 赵凯;史长琼;张理阳;;基于聚类分析的P2P流量识别[J];长沙理工大学学报(自然科学版);2010年03期
中国重要会议论文全文数据库 前10条
1 林会杰;贾珈;王晓慧;蔡莲红;;基于B/S模式的3D双语虚拟说话人的研究与实现[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
2 吴敏玲;;くゐ·いく’‘~てくゐ·ていく’表动作空间范畴移动语言形式的日语语言特点——和汉语“来、去”、“~来、~去”比较[A];福建省外国语文学会2002年会论文集[C];2002年
3 刘大力;赵力;;与文本无关说话人识别系统的性能比较[A];2004年全国物理声学会议论文集[C];2004年
4 尹巧萍;赵力;;利用语音基音统计特征的说话人性别判识的研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年
5 邓英;;基于说话人的对话语音分割[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
6 蒋冬梅;赵荣椿;;基于尺度描述的说话人归一化语音特征[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
7 周绍良;;修绠山房梓《宣和遗事》跋[A];水浒争鸣(第一辑)[C];1982年
8 李斌;陈小荷;;汉语褒贬词语的褒贬指向问题初探[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
9 王洪海;刘刚;郭军;;基于二次弯折函数的频率弯折方法[A];第二十六届中国控制会议论文集[C];2007年
10 艾妮;;谏劝中委婉格运用的“源”与“流”初探[A];江西省语言学会第五届会员大会暨2002年学术年会论文集[C];2002年
中国重要报纸全文数据库 前10条
1 ;美科学家要研制无声感应“手机”[N];新华每日电讯;2005年
2 张申 蔡莲红;富于表情的虚拟人脸合成[N];计算机世界;2007年
3 中国科学院自动化研究所模式识别国家重点实验室 于剑陶建华;个性化语音生成技术面面观[N];计算机世界;2007年
4 中国科学院自动化研究所模式识别国家重点实验室 辛乐陶建华;说话人头像技术:让语音可视[N];计算机世界;2007年
5 曹文彪;生气与高致[N];文学报;2006年
6 中国科学院自动化研究所模式识别国家重点实验室 周密陶建华;与电脑面谈[N];计算机世界;2007年
7 北京大学信息科学中心视觉与听觉信息处理国家重点实验室 吴玺宏;声纹识别听声辨人[N];计算机世界;2001年
8 刘喜喜;让视频会议多一些人工智能[N];中国计算机报;2008年
9 唐志强;不听别人说话,也能模仿其口音[N];新华每日电讯;2010年
10 秋水;挑吃“绿色” 敲响食品安全警钟[N];中国改革报;2006年
中国博士学位论文全文数据库 前10条
1 杨继臣;说话人信息分析及其在多媒体检索中的应用研究[D];华南理工大学;2010年
2 何俊;声纹身份识别中非常态语音应对方法研究[D];华南理工大学;2012年
3 潘逸倩;声纹密码技术研究[D];中国科学技术大学;2012年
4 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
5 冯哲;基于内容的视频检索中的音频处理[D];复旦大学;2004年
6 金乃高;音视频联合说话人定位与跟踪方法研究[D];大连理工大学;2008年
7 闵星雅;助动词“能”和“会”的认知研究[D];上海师范大学;2007年
8 李海辉;电视访谈中话语缓和的语用研究[D];广东外语外贸大学;2008年
9 祝东平;汉语时间感知模式与相关汉语因素研究[D];吉林大学;2009年
10 席留生;“把”字句的认知研究[D];河南大学;2008年
中国硕士学位论文全文数据库 前10条
1 凌锦雯;基于多特征的说话人分割与聚类的研究[D];中国科学技术大学;2011年
2 张力;说话人分段与聚类技术研究[D];解放军信息工程大学;2012年
3 赵洪刚;基于对话型语音的说话人在线识别技术研究[D];黑龙江大学;2010年
4 陆亮;多信道条件下的说话人认证[D];北京邮电大学;2010年
5 默盼;论宋代说话人[D];渤海大学;2012年
6 高娅;说话人转变检测的研究与实现[D];南京邮电大学;2013年
7 李向格;关于“レてもぃぃ”与“レてぃぃ”的意义分析[D];吉林大学;2012年
8 黄雪莲;韩国语‘(?)’的话语功能分析[D];延边大学;2012年
9 毛永刚;基于相关向量机的说话人判别研究[D];电子科技大学;2012年
10 陈芝;基于人工神经网络模型的说话人转换算法研究[D];南京邮电大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026