收藏本站
《浙江大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

WebSonar:基于关键信息的语音搜索引擎

周森  
【摘要】:随着互联网的发展,世界已走向信息经济时代;信息资源并不稀缺,稀缺的 是发现信息资源的手段。而搜索引擎正是因此应运而生,但是现在流行的搜索引 擎一般只基于文本信息的搜索,即便针对于语音信息,比如新闻记录,谈话记录 等等,它仅仅只能检索一些元信息:作者,标题,描述,文件大小等等,而不能 提供基于语音内容的检索。随着互联网上的语音资源越来越多,人们会越来越希 望能够搜索语音的内容。针对于这个需求,本论文提出基于关键信息的语音搜索 引擎,所谓关键信息就是指语音资源中的说话人或特殊关键词。比如:我们想在 互联网上搜索包含“比尔盖茨”这个词的内容的语音资源;或者“比尔盖茨”说 的话的录音。本论文利用说话人识别技术搜索关键人物的谈话、演讲等录音;利 用关键词识别技术搜索包含关键词的语音资源。 本论文的主要内容: 第一、提出了一个语音搜索引擎的框架。 第二、关键词识别技术、说话人识别技术与搜索引擎技术的融合。 第三、搜索引擎在搜索关键人物语音资源的应用。 第四、设计了搜索引擎的局部优化技术 本文得到以下资助:国家发展改革委员会“CNGI示范工程2005年研究开发、 产业化及应用试验项目”(CNGI-04-12-2A)、国家自然科学基金(60273059)、 国家杰出青年科学基金(60525202)、教育部“跨世纪优秀人才培养计划”专项 基金(NCET-04-0545)、国家自然科学基金重点项目(60533040)。
【学位授予单位】:

知网文化
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978