收藏本站
《南京理工大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于哼唱的音乐检索技术研究

曹建红  
【摘要】: 随着音乐数字化、网络和手机技术的不断发展,将三者互联满足人们日常生活、学习和娱乐成为大势所趋。传统的音乐检索方式必须通过文本标注,它要求用户给出乐曲名、演唱者、词曲作者、歌词等关键字,给用户的使用带来了种种限制。随着生活节奏的不断加快,人们已经不满足于这种基于文本的音乐检索,希望通过哼唱出自己脑海中残留的一个旋律片段作为检索输入,检索出包含该旋律片段的目标乐曲。这种基于哼唱的音乐检索技术的提出给用户带来了极大的便利,同时也是人工智能领域一个极大的挑战,在网络、手机和卡拉OK等市场都极具商业空间。 传统的音乐检索需要对文本进行标注,耗时长,并且用户使用的时候还会受限。本课题是一种基于内容的音乐检索方式,它无需进行文本标注,通过用户哼唱一段旋律,提取旋律中的音高、音长等音乐特征来检索。基于哼唱的音乐检索技术需要解决两个方面的问题:特征提取和旋律匹配。针对这两个方面,本文做了如下工作: (1)简单介绍了哼唱检索的研究现状,与本文相关的乐理知识,对音乐的四要素进行了重点阐述,分别描述了音乐物理级、声学级和语义级的特征,还对信号处理的基本方法做了介绍,为后续的特征表达和特征提取做了充足的前期准备。 (2)在特征提取之前确定旋律表达方式,本文采用音高差和音长比作为特征向量,避免哼唱中出现的起调不一致和节奏快慢不均的问题。特征提取阶段计算时域信号互相关来估算基音周期,通过计算短时能量的平均值和标准差,设定动态阈值来切分哼唱输入音符,获得音符的音高差和音长比信息。 (3)旋律匹配提出了一种基于N-Gram的改进式DTW算法。该算法采用动态时间规整(Dynamic Time Warping,DTW)为算法原型,在此基础上采用音高差作为特征,并且对边界条件进行了限制,同时加入了音长相似度,将获得的DTW距离与音长相似度加权求和求得最终相似度得分。考虑到算法计算过程的效率问题,本文采用基于N-Gram的方法对乐曲库设定了索引,有效改善了系统的检索效率。
【学位授予单位】:南京理工大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP391.3

手机知网App
【引证文献】
中国期刊全文数据库 前2条
1 王民;曹绘;要趁红;;一种改进的小波变换基音检测算法[J];重庆邮电大学学报(自然科学版);2012年03期
2 罗凯;魏维;胡新;;一种哼唱检索中的音符分割算法[J];计算机工程;2011年S1期
中国硕士学位论文全文数据库 前2条
1 杨波;基于内容的多音音乐检索系统设计[D];武汉理工大学;2012年
2 李扬;基于哼唱的音乐检索系统的研究与实现[D];电子科技大学;2012年
【参考文献】
中国期刊全文数据库 前5条
1 李扬,吴亚栋,刘宝龙;一种新的近似旋律匹配方法及其在哼唱检索系统中的应用[J];计算机研究与发展;2003年11期
2 赵芳;吴亚栋;宿继奎;;基于音轨特征量的多音轨MIDI主旋律抽取方法[J];计算机工程;2007年02期
3 罗德勇,明海;数字图书馆中基于内容的多媒体检索研究[J];情报探索;2003年01期
4 金毅,黄敏;基于旋律的音乐检索研究——旋律特征的表达和提取[J];现代图书情报技术;2003年04期
5 刘怡;郝云飞;;一种新的高效大型音乐数据库查询算法[J];湖南科技大学学报(自然科学版);2006年01期
【共引文献】
中国期刊全文数据库 前10条
1 罗云贵;张友纯;;嵌入式语音门禁系统的设计与实现[J];安防科技;2010年02期
2 张道信,周爱毓;语音信号实时降噪软件的设计[J];安徽大学学报(自然科学版);2004年04期
3 林小兰;王晓光;王晖;;基于内容的音乐检索关键技术研究[J];中国传媒大学学报(自然科学版);2010年04期
4 孔令志;罗森林;张冰;王耀威;;纯音乐与语音-音乐混合片段的高准确识别方法[J];北京理工大学学报;2009年01期
5 吕伟军;何为;;一种基于径向基函数神经网络的语音降噪方法[J];北京工商大学学报(自然科学版);2008年04期
6 夏小亮;周明全;王学松;李鹏;李娟;;基于分句匹配的哼唱音乐检索系统的算法研究与实现[J];北京师范大学学报(自然科学版);2011年04期
7 高伟;;基于说话人识别的门禁系统的设计[J];才智;2012年12期
8 金旭东;;浅析多媒体技术教学在高职环境艺术设计专业教育中的运用[J];长春理工大学学报;2010年09期
9 张丽丽;杜鹃;贾亮;;改进的支持向量机SMO算法说话人识别系统研究[J];长春理工大学学报(自然科学版);2009年02期
10 张常年;夏日升;姜岩峰;;一种基于低比特率语音算法的芯片设计与分析[J];电讯技术;2007年05期
中国重要会议论文全文数据库 前10条
1 闵刚;蒋永生;杨吉斌;张雄伟;;分段声码器中的语音分段算法研究[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
2 张骞;徐俊佳;;基于SPCE061A的声控车库门的设计[A];河南省土木建筑学会2010年学术大会论文集[C];2010年
3 王浩;宋巍;岳振军;;语音信号的傅立叶-贝赛尔展开及其特性初探[A];全国第一届嵌入式技术联合学术会议论文集[C];2006年
4 闫佩君;陈亮;;基于小波高频分形维数的语音隐藏方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
5 陈知困;徐明;黄云森;;一种高效的基于CHMM的哼唱式旋律检索方法[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
6 刘怡;郝云飞;;一种有效的复调音乐查询算法[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
7 王小凤;耿国华;孙霞;张翔;;一个以句为单位的音乐哼唱检索算法[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
8 王磊;黄申;胡晟;姜洪臣;徐波;;基于动态规划的清唱评分与纠错系统设计与实现[A];第九届全国人机语音通讯学术会议论文集[C];2007年
9 龙宇;王忠;;基于神经网络的语音去噪方法研究[A];四川省通信学会二零零四年学术年会论文集(二)[C];2004年
10 王建波;林本浩;田春明;刘睿;;语音增强及其相关技术研究[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
2 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
3 刘柏森;基于HHT复杂环境下低信噪比语音检测及增强方法研究[D];哈尔滨工程大学;2011年
4 韩志艳;语音信号鲁棒特征提取及可视化技术研究[D];东北大学;2009年
5 丁琦;数字音频篡改检测与隐写分析技术研究[D];解放军信息工程大学;2011年
6 郑建明;基于HMM的多特征融合钻头磨损监测技术的研究[D];西安理工大学;2004年
7 李波;语音转换的关键技术研究[D];国防科学技术大学;2005年
8 马跃洲;基于电弧声信号的CO_2焊质量监控方法研究[D];兰州理工大学;2005年
9 田立斌;语音通信质量客观评价、有效接收及错误恢复算法研究[D];华南理工大学;2004年
10 郑贵滨;基于内容的音频信息检索技术研究[D];哈尔滨工业大学;2006年
中国硕士学位论文全文数据库 前10条
1 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
2 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
3 曹唯伟;基于拼音编码的水下语音通信发射端的设计与实现[D];哈尔滨工程大学;2010年
4 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
5 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年
6 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
7 陈晶;基于词片网格的语音文档主题分类[D];哈尔滨工程大学;2010年
8 杨文强;基于AMBE-2000的OFDM水声语音通信平台研究[D];哈尔滨工程大学;2010年
9 陈伟伟;基于鼾声检测的睡眠呼吸暂停低通气综合症诊断[D];大连理工大学;2010年
10 刘伯权;欠定卷积混合语音信号盲分离研究[D];湘潭大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 王绪振;贺志强;牛凯;于光炜;吴伟陵;;鲁棒线性预测编码器设计[J];北京邮电大学学报;2009年04期
2 宋子容,袁春,温启荣;小波分析法对多带激励声码器基音提取的改进[J];重庆邮电学院学报;1997年02期
3 柏静,韦岗;一种基于线性预测与自相关函数法的语音基音周期检测新算法[J];电声技术;2005年08期
4 李扬,吴亚栋,刘宝龙;一种新的近似旋律匹配方法及其在哼唱检索系统中的应用[J];计算机研究与发展;2003年11期
5 雷建军;杨震;刘刚;郭军;;基于短时谱估计的语音增强研究[J];计算机工程与应用;2008年32期
6 李鹏;周明全;夏小亮;黎南杉;;改进的基音检测方法及在音乐检索中的应用[J];计算机工程与应用;2011年06期
7 马志欣;周利华;;哼唱检索中一种新颖有效的哼唱信息处理方法[J];计算机科学;2006年05期
8 罗凯;魏维;谢青松;;哼唱检索中改进的动态时间规整算法[J];计算机工程;2008年20期
9 李坤;刘加;;基于小波变换和线性预测的基音提取[J];计算机工程;2010年10期
10 关欣;李锵;田洪伟;;基于差分全相位MFCC的音符起点自动检测[J];计算机工程;2010年11期
中国博士学位论文全文数据库 前2条
1 王小凤;基于内容的音乐检索关键技术研究[D];西北大学;2008年
2 陈刚;基于内容的相关反馈式音乐检索方法研究[D];华中科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 吴长君;基于旋律的音乐检索系统设计与实现[D];北京邮电大学;2011年
2 张俊杰;基于和谐泛音检测的主旋律提取技术[D];上海交通大学;2007年
3 郭丽惠;基于内容的哼唱式音乐检索研究[D];华东师范大学;2008年
4 陈旭;基于内容的音频哼唱识别及检索系统[D];上海交通大学;2008年
5 黄磊;基于内容的MP3音乐检索研究和实现[D];厦门大学;2008年
6 段志尧;多音音乐音高估计研究[D];清华大学;2008年
7 张新彩;基于内容的音乐检索技术研究与实现[D];西北大学;2009年
8 张璠;哼唱检索处理技术的研究[D];河北农业大学;2009年
9 孔旭;基于声谱图的音乐检索[D];复旦大学;2009年
10 孙国成;基于内容的音频检索研究[D];华中科技大学;2008年
【二级参考文献】
中国期刊全文数据库 前5条
1 李扬,吴亚栋,刘宝龙;一种新的近似旋律匹配方法及其在哼唱检索系统中的应用[J];计算机研究与发展;2003年11期
2 刘伟成,孙吉红;基于内容的图像信息检索综述[J];情报科学;2002年04期
3 赵一丹;数字图书馆中基于内容的多媒体数据查询和检索技术[J];图书馆学刊;2001年04期
4 姜筑;准确的乐句划分是音乐表达的基础[J];音乐探索.四川音乐学院学报;1997年01期
5 蔡巍,刘玉照;基于内容检索多媒体数据库的构建[J];中国图书馆学报;2000年03期
【相似文献】
中国期刊全文数据库 前10条
1 罗凯;魏维;谢青松;;哼唱检索中改进的动态时间规整算法[J];计算机工程;2008年20期
2 魏栋;田联房;郑则广;陈荣昌;毛宗源;;基于动态时间规整的孤立咳嗽声识别[J];计算机与信息技术;2008年04期
3 张浩;刘志镜;;加权DTW距离的自动步态识别[J];中国图象图形学报;2010年05期
4 檀蕊莲;;基于DTW的说话人识别技术研究[J];黑龙江科技信息;2010年13期
5 李文娟;张文俊;张莹;潘晋;;基于特征比较的声乐评价方法[J];计算机工程;2009年17期
6 徐陶祎;郑建彬;;基于跳变点能量的DTW匹配在线手写签名验证算法[J];计算机应用研究;2007年08期
7 高清伦;谭月辉;王嘉祯;;基于离散隐马尔科夫模型的语音识别技术[J];河北省科学院学报;2007年02期
8 胡金平;陈若珠;李战明;;语音识别中DTW改进算法的研究[J];微型机与应用;2011年03期
9 林遂芳,张海英,潘永湘;基于DTW和LVQ网络混合模型的语音识别方法[J];系统仿真学报;2005年08期
10 钱盛友;许慧燕;;基于动态时间规整和神经网络的方言辨识研究[J];计算机工程与应用;2008年10期
中国重要会议论文全文数据库 前10条
1 张浩;刘志镜;;基于动态时间规整的步态自动识别[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
2 王晔;黄上腾;;基于n-gram相邻字的中文文本特征提取算法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
3 李明;颜永红;;一种基于哼唱的音乐检索方法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
4 林土胜;赖声礼;;视网膜血管特征提取的拆支跟踪法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
5 钱小聪;郑宝玉;穆明鑫;;神经网络联机手写签名验证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
6 张羽;汪源源;王威琪;余建国;林继耕;;狭窄血管多普勒信号特征提取的实验研究[A];21世纪医学工程学术研讨会论文摘要汇编[C];2001年
7 柳林霞;陈杰;窦丽华;;不变矩理论及其在目标识别中的应用[A];2002中国控制与决策学术年会论文集[C];2002年
8 范海宁;郭英;吴剑锋;陈志武;;基于小波包分解的声信号特征提取方法[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
9 杨日杰;施建礼;林洪文;;一种雷达视频回波特征提取方法研究[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年
10 代克杰;张红梅;盛赛斌;;基于BP网络的故障特征提取方法研究[A];2004中国控制与决策学术年会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 本报记者 汪建根;想不起歌名,你就哼一声[N];中国文化报;2011年
2 四川 王宽林;调整演出带的音高和时间[N];电脑报;2003年
3 陈学伟;巧学“音高”[N];音乐周报;2003年
4 杨晓亮 石伟红;气息与音高的关系[N];音乐周报;2002年
5 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
6 邹继纯;《黄帝内经》与音高、色彩的对应关系[N];光明日报;2006年
7 张戎;浅谈舞台语言与技巧的练习[N];伊犁日报(汉);2008年
8 案例 张菊/评析 金亚文;小鸟的歌[N];音乐周报;2003年
9 杜亚雄;优美抒情 摇声丰富[N];音乐周报;2004年
10 梁雨霞;绩效考核:以透明赢得公平[N];第一财经日报;2006年
中国博士学位论文全文数据库 前10条
1 孙真真;基于光学区雷达目标二维像的目标散射特征提取的理论及方法研究[D];中国人民解放军国防科学技术大学;2001年
2 武子玉;矿物近红外光谱信息提取及应用研究[D];吉林大学;2005年
3 王承;基于神经网络的模拟电路故障诊断方法研究[D];电子科技大学;2005年
4 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
5 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
6 张立福;通用光谱模式分解算法及植被指数的建立[D];武汉大学;2005年
7 陈晓娟;模拟电路神经网络故障诊断方法的研究[D];吉林大学;2006年
8 苏彩红;墙地砖质量自动检测技术的研究[D];华南理工大学;2004年
9 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
10 宋晴;基于液滴分析技术和液滴指纹图的液体识别方法的研究[D];天津大学;2005年
中国硕士学位论文全文数据库 前10条
1 曹建红;基于哼唱的音乐检索技术研究[D];南京理工大学;2009年
2 陈卫;基于支持向量机的说话人识别系统研究[D];华北电力大学(河北);2005年
3 张忠海;语音控制在全方位运动轮椅上的应用研究[D];沈阳工业大学;2006年
4 苏腾芳;音频指纹识别系统的设计[D];北方工业大学;2012年
5 江官星;非特定人孤立词语音识别系统的研究[D];西南交通大学;2006年
6 张志霞;语音识别中个人特征参数提取研究[D];中北大学;2009年
7 孙丽;哼唱检索中特征提取研究[D];北京邮电大学;2012年
8 李进;基于曲段旋律特征的哼唱检索[D];哈尔滨工业大学;2010年
9 张新彩;基于内容的音乐检索技术研究与实现[D];西北大学;2009年
10 鲁佳;基于哼唱的音乐检索技术研究与实现[D];上海海事大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026