基于双曲空间的自然语言评价模型研究
【摘要】:语言评价是自然语言处理领域中备受关注的一个问题,机器翻译、文本摘要、文本复述、图像标注等领域的研究者都依赖于语言评价模型展开研究工作。语言评价模型能通过参考文本等资料,利用计算机自动化、低成本、快速地对文本生成模型的质量进行评估。研究者可以利用语言评价模型开展模型评价、模型选择工作,或是利用语言评价模型进行消融实验,对文本生成模型的细节进行深入分析。然而,目前常用的语言评价模型都存在着一定的问题,要么无法很好地从语义角度衡量参考文本与生成文本之间的相关性,评价准确率远远不及人类,要么将消耗较大的计算资源。现有语言评价模型所存在的问题给相关领域的研究工作带来了障碍。针对现有研究工作的不足,本文提出了一种新的语言评价方法Hy LEU,它能利用双曲空间强大的表征能力,使用双曲测地线距离更好地度量n-gram短语之间的语义相关性,进而更好地度量参考文本与生成文本之间的语义关系,更好地完成语言评价任务。本文具体所做的工作如下:(1)本文提出了双曲词嵌入对齐正则化,它能利用Word Net知识库所建立的高度结构化的语义树,对双曲词嵌入模型Poincare Glo Ve进行调整。实验证明,经过双曲词嵌入对齐正则化项优化后,双曲词向量具有高内聚和低耦合的特性,同义词对和不相关词对的词向量在双曲空间中的测地线距离有着显著的区分性。(2)通过分析双曲空间词嵌入模型的结构,本文发现余弦相似度并不能很好地度量双曲词向量的相似度。为此,本文提出了双曲空间中的词汇相似度计算方法:距离映射函数。距离映射函数可以将词向量在双曲空间中的测地线距离转换为词汇的相似性度量。在多个数据集上进行的词汇相似度评价实验证明了该方法的优越性能。(3)本文建立了基于双曲空间的自然语言评价模型Hy LEU。Hy LEU能结合了前两个工作,能更好地判断参考文本与机器生成的文本之间的语义相关性,进而更好地完成语言评价任务。在多个机器翻译评价任务上的实验证明,Hy LEU拥有较低的计算消耗和较高的评价质量,达到了预期设计要求。