基于马尔可夫随机场的蒙古文信息检索模型研究
【摘要】:随着计算机与网络技术的发展,Web已经成为人类知识的存储库,用户可以方便快捷地接触到丰富的信息。因而在如此浩瀚的信息中找到对自己真正有用的信息成为人们关注的焦点。在这个背景下信息检索技术得到了迅速的发展。
目前,信息检索技术应用在汉语、英语、日语等语言时取得了很好的成果。但是由于语言的独特性,信息检索技术还很少应用在少数民族语言上,这严重阻碍了少数民族文化的推广。蒙古文在我国少数民族语言中占有很重要的地位,同时也是世界上非常有影响的语言。蒙古文信息的日益丰富,极大的促进了蒙古文信息检索的发展,蒙古文信息检索系统因此受到了人们越来越多的关注。
本文研究蒙古文信息检索模型时采用了马尔可夫随机场的一些理论和方法。马尔可夫随机场是一种较好表示知识关联的图形表示方法,它的无向性能更好的解释信息检索中知识之间的关系,具有强大的学习功能和推理能力。本文将基于马尔可夫随机场的词关联模型与蒙古文语言结构相结合,根据蒙古文语言特性设计了完全独立(FI)、词组关联(PD)、修饰关联(MD)三种检索模型。大量的蒙古文语料实验表明:我们的模型显著提高了检索性能。