学术期刊电子稿件参考文献自动校验的XML解决方案
【摘要】:近年来,随着web网络信息技术的不断发展,信息的获取变得越来越简单,为学术研究提供了便利的条件,同时由于科技水平的不断进步和学者科研能力的不断提升,科技论文数量急速膨胀。然而,提升学术期刊学术价值不能只靠论文产出量,如何在大量的投稿论文中挑选出有学术价值且规范化的学术论文,给编辑提出了严峻的考验。其中参考文献作为引文分析的基础,是学术论文规范化非常重要的一部分,参考文献的正确引用直接影响到文献计量学研究的可靠性和期刊评价体系的科学性,因此学术期刊编辑必须重视对论文文后参考文献的审阅。对着学术期刊投稿方式的不断创新,电子稿件开始逐步代替传统印刷体稿件成为学术期刊的主导投稿形式,这位计算机技术应用于稿件审阅提供了基础。基于此,本文通过对参考文献著录规则分析,对当前学术期刊电子文献参考文献规范化情况调查以及期刊编辑审阅参考文献的过程分析的基础上,旨在为学术期刊电子稿件文后参考文献自动校验提出一种解决方案,即基于XML技术的参考文献自动校验系统。
论文主要研究内容有一下几点:
首先,《文后参考文献著录规则》GB/T7714-2005是为著者和编辑编撰文后参考文献提供了一种国家标准,是学术期刊著录参考文献应该遵循的标准。文章通过对《规则》的分析,具体介绍了参考文献的著录格式以及著录过程中应该著录的问题,并在此基础上形成对参考文献著录格式正则表达式匹配模式的设计。以《规则》为标准,通过对图情类核心期刊参考文献的著录情况的抽样调查,统计了期刊论文中出现的参考文献著录不规范现象,认为参考文献的规范化还有待于进一步加强,提出设计实现参考文献自动校验系统作为一种解决期刊编辑审阅参考文献的方案。
其次,本文对基于XML的参考文献自动校验系统的目标、架构、层次结构和处理流程进行了详细设计,并针对参考文献文献自动校验逻辑给于具体阐述。参考文献校验包括对文献在正文中标注的校验,校验其格式以及序号标注顺序是否正确,是否重复标注以及重复著录文献;参考文献著录格式的校验,校验参考文献格式是否规范;参考文献著录信息的统计,包括引用的参考文献的出版时间,参考文献数量以及参考文献种类等信息。由于著者对计算机掌握的程度不同,因此对word文档的操作能力不同,根据一般情况统计参考文献著录可能出现的格式并就此格式设计校验逻辑。
最后,通过对XML核心技术XSLT、XPath和XML schema的具体应用解决系统实现过程中的关键性问题,即word文档向XML结构化文档的转化,wordML文档中参考文献信息的提取和整合以及对参考文献信息正则表达式匹配等系统实现过程中的关键性问题。完成参考文献检验系统的整体实现。