面向语音环境的情感补偿推荐模型及方法研究
【摘要】:推荐系统可以使人们能够快速准确地发现他们感兴趣的物品或信息。随着多媒体大数据时代的到来,网络语音沟通、在线流媒体等语音应用得到广泛普及,但现阶段的推荐系统多关注于文本内容的挖掘及知识抽取,缺乏面向语音聊天、影视剧台词等语音内容及情感环境的推荐系统。实际上这些语音信息与用户的当前兴趣和需求是密切相关的,面向这类语音领域的推荐系统具有重要的研究价值和推广应用前景。同时相较于传统推荐系统处理的文本数据,语音数据具有更丰富的能反映用户行为习惯及意愿的情感信息,恰当利用这些语音情感信息可以有效改善推荐模型的现有问题及推荐性能。本文以面向语音环境的推荐模型及方法为主要目标,分析及解决推荐环境下语音检测存在的关键问题,深入探讨和研究语音信号情感和语音表述内容情感的识别方法及推荐补偿策略,旨在利用语音情感信息改善语音推荐系统负面情感退避、新用户冷启动及用户相似度优化等问题,论文在以下几个方面开展研究工作:(1)情感补偿推荐模型检测处理语音时会面临两方面问题,其一,语音信号情感识别要求每个语音段只包含唯一说话人,而推荐环境检测的语音存在多个说话人难以准确划分的问题,本文提出一种基于启发式长时特征选择的说话人分类方法,结合Fisher判别分析方法和启发式算法求取具有显著说话人区分度的语音长时特征集,仿真实验表明本文提出的方法具有良好的说话人分类效果。其二,语音关键词检测的多阶语言模型需要适应各类推荐场景的领域知识才能达到良好的检测效果,本文提出一种基于改进两步法的语音关键词检测,在语言模型构造时利用推荐领域知识口语词扩展Lattice包含的多词短语,提升了各类推荐领域中语音关键词检测的覆盖率。(2)语音人格特征能反映说话人相对稳定的思维方式和行为风格,准确评估用户的语音人格信息对推荐系统有着重要意义。针对近年才得到重视的语音人格研究存在预测性能偏低、缺乏对汉语语音人格研究等问题,本文提出一种基于多层感知器的语音人格评估模型,结合多隐含层的高层映射能力和候选韵律特征在人格评估上的显著区分度对大五人格评估进行建模,通过梯度下降方法求解模型。然后,通过提出的音节检测算法引入语音段音节数和说话人累积平均音节数特征,并利用基于互信息的语音韵律特征评级方法找出最佳特征子集,进一步优化了语音人格预测性能。针对汉语语音人格评估语料库的匮乏,本文录制、标注并开源发布一个基于大五人格的汉语语音人格识别语料库,同时分析了汉语语音人格评估在特征选择上的差异性。实验结果证明本文提出的模型性能优于现阶段先进的语音人格评估方法。(3)语音表述内容的情感倾向同样为推荐系统的推荐决策提供关键信息,在通过语音关键词检测的语音文字转换处理得到语音表述内容文本的基础上,本文提出两种改进文本情感分析性能的方法,以保障推荐决策的效用性:第一,针对目前监督情感分类方法对用户表述内容着重词句适应性的不足,提出一种基于自适应表述权重的情感分析方法,根据用户情感观点的分布情况调整情感词项权重系数,进而改进情感分类的准确度。第二,根据本文统计分析得知用户表述内容中词句复杂度、词汇丰富度、功能性代词使用频率等表述风格特征直接用于情感褒义和贬义的区分判别作用非常有限,提出一种基于表述风格群组特性的情感分类模型,根据特定表述风格群组独立分类器性能优于全局分类器的发现,利用分类器极性偏好判别算法分析得出各个表述风格群组分类器的倾向性,通过为每个样本抉择辅助分类器或全局分类器,实验和评估结果表明提出的模型情感分类性能高于现阶段最新的情感分类方法。(4)研究基于语音情感补偿的推荐方法,首先,针对现阶段推荐系统均是面向文本内容检测,提出基于语音内容的推荐类别检测模型,利用语音关键词检测结果建立用户偏好类别的即时兴趣权重和历史兴趣权重向量,进而使用带权向量空间描述模型的余弦距离分析得出语音关联的主题类别。然后,从语音信号人格情感和语音内容情感两方面补偿推荐模型:一方面,为避免在用户对特定主题类别的情感为负面时进行推荐,提出一种基于语音内容情感补偿的推荐退避策略,退避函数综合了褒义语义好感度和主题类别侧重度,检测结果低于推荐阈值时进行推荐类别退避,提升用户对推荐内容的好感度。另一方面,针对协同过滤推荐方法普遍存在的冷启动问题,在语音环境的推荐系统中引入语音人格特征,提出一种基于用户语音人格的推荐方法,相较于其他采用人格问卷、用户行为统计等方式获取人格的推荐系统,语音人格识别具有天然的优势,可以避免繁琐的人格问卷答题过程,同时不需要漫长的用户行为采集的时间周期,较好的解决了新用户的冷启动问题及推荐模型的用户偏好相似度问题。实验表明本文提出的方法不仅能从语音中检测推荐主题类别,还能通过两种语音情感侧面提升推荐性能,具有重要的指导意义和应用前景。