数字图书馆中数据预处理子系统的设计与实现
【摘要】:
计算机网络的飞速发展为信息的传播与检索提供了技术基础。但是,由于当前需要存储和传播的信息量越来越大,信息的种类和形式越来越丰富,信息更新的速度也越来越快,现有的资源管理和应用模式已经远远不能满足用户的要求了。而数字图书馆作为新一代因特网上信息资源的管理模式,已成为高性能网络信息技术的研究热点之一。
由于现有的数字图书馆软件平台不能很好的完成数据入库以前的一些基本工作,所以,本文对数据的预处理工作,作了详细的设计和实现。首先介绍了数字图书馆的研究背景,数字图书馆的整体结构和数据预处理子系统的结构;然后详细阐述了数据预处理子系统中各个模块使用的技术,以及它们的实现。其中关键的技术是:分类标准的确定;智能分类技术的研究和实现;元数据的确定;文本、图像和元数据的提取;XML技术在数字图书馆中的应用;自动入库功能的实现。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|