构建面向知识服务的医学文献相关性数据库方法研究
【摘要】:
为了进一步提高现有文献数据库的知识服务水平,中国医学科学院医学信息研究所近年来对构建面向知识服务的医学文献相关性数据库进行了大量的研究,已经探索出一套较为成熟且实用的基于词表分词的文献相关性判定算法,并基于此算法成功构建了中国生物医学工程文献相关性数据库。该数据库的文献相关性判定结果已具备较高的准确率,但在应用上受制于基础词表。因此,本论文在深入探讨基于词表分词算法的中国生物医学工程文献相关性数据库的基础上,采用不基于词表分词的后缀树算法,初步构建了医学文献相关性数据库,并将此方法与基于词表分词的构建方法进行了全方位的比较。
本论文共分七个章节。第一章分别介绍了知识服务的内涵、特点,以及文献相关性数据库建设研究涉及的概念,并简单论述了二者之间的关系;第二章概述了文献相关性数据库的国内外研究进展,其中重点介绍了中国医学科学院医学信息研究所近年来有关文献相关性数据库的建设研究概况;第三章详细介绍了基于词表分词算法的医学文献相关性数据库的构建概况;第四章重点论述了基于后缀树算法的医学文献相关性数据库的建设过程;第五章通过数据测试、分析,评价了基于后缀树算法的医学文献相关性数据库的相关性判定效果;第六章比较了词表分词算法与后缀树算法在构建医学文献相关性数据库时的优缺点;第七章就面向知识服务的医学文献相关性数据库的进一步研究提出了几点建议。