收藏本站
《华中科技大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

档案数字化中两项关键技术的研究

张帆  
【摘要】: 近年来,档案处理技术已经朝着数字化、信息化、网络化的方向飞速发展。传统的纸质档案处理方法在一定程度上限制了档案信息的共享与查询,浩淼如烟的档案给“三化”提出了新的挑战。针对档案信息化中的两项关键技术:件符识别技术与检索映像技术,本文从理论基础、应用方式、仿真分析三个步骤展开了全面和深入的论述。 件符识别技术是整个流程的基础和核心。在传统以条形码作为信息标识的应用中,海量的档案文件使得档案工作者的工作量急剧增加,贴条形码的过程也极易出错。同时,条形码信息破坏了档案的原貌,对档案原件造成损害。件符识别技术以模式分类和神经网络技术为核心;以档案扫描图像处理技术为基本工作原理;以件符作为标识档案文件之间的分隔符;以人工预处理技术预先将档案和指定文件对应好为保障,成功的实现了取代原始条形码信息;降低了档案数据库的高度冗余,提高了查询效率;给后期的检索映像带来了相当的便利。 检索映像技术是整个流程的目的和归宿。传统的纸质档案检索方式无疑是低效率的,并且面对大量的无关数据时,档案信息检索已经和互联网WEB信息检索一样,面对越来越多的挑战。此次成功的将现代互联网检索技术应用于档案信息检索中,以文本数据挖掘技术为基础,提出了档案间的相关度的概念,使得不同档案之间的自动聚类成为可能。同时,借鉴搜索引擎的PageRank算法,以不同优先级的形式,呈现在用户面前不同级别的搜索结果,从而更加便利的实现了查全、查准、查快的检索目标,是网络搜索技术在档案信息检索中的一次成功的应用。 通过对相关的实现技术进行建模与仿真,采用真实的档案数据作为测试训练样本,导出测试结果,建立本档案管理系统的综合评价指标,有利于更进一步优化此系统的处理过程。最后,将所提出的关键技术进行总结和归纳,提出需要改进的地方,为下一步建立分布式共享档案信息平台做好铺垫。
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:G270.7

【参考文献】
中国期刊全文数据库 前10条
1 孔娟;马亨冰;;PageRank算法的原理与解析[J];福建电脑;2007年01期
2 方世强,李远清,胡刚;文本压缩技术综述[J];工业工程;2002年02期
3 徐成俊;舒毅;柴蓉;张其斌;田全红;郝涛;;文本压缩算法的比较研究[J];甘肃科技;2006年12期
4 谢春发;中文智能搜索引擎的研究与探讨[J];河北广播电视大学学报;2005年04期
5 赵鹏,李建中;基于压缩的全文本数据库信息检索技术的研究[J];哈尔滨商业大学学报(自然科学版);2003年06期
6 游荣彦,李吉桂;通用简易中文文本压缩方法研究[J];华南师范大学学报(自然科学版);2001年02期
7 周雪忠;吴朝晖;;文本知识发现:基于信息抽取的文本挖掘[J];计算机科学;2003年01期
8 宋江春,沈钧毅,宋擒豹;一个基于关联规则的多层文档聚类算法[J];计算机应用;2005年07期
9 牟荣;刘希玉;;基于ANN技术的挖掘关联规则在电子商务中的应用[J];科技信息(学术研究);2007年06期
10 窦玉萌;王孟龙;;面向语义Web的搜索引擎构想[J];情报探索;2006年07期
中国硕士学位论文全文数据库 前3条
1 毕建华;电子文件档案管理系统设计与实现[D];华中科技大学;2004年
2 于进川;档案信息系统建设的效益管理研究[D];四川大学;2005年
3 蒋冠;网络环境下档案信息资源整合研究[D];湘潭大学;2005年
【共引文献】
中国期刊全文数据库 前10条
1 王全凤;郑浩;;基于径向基函数神经网络的高层建筑结构选型[J];四川建筑科学研究;2010年05期
2 赵彦辉;张乐文;邱道宏;仲晓杰;;基于粗糙集理论的隧道围岩模糊综合评判[J];四川建筑科学研究;2011年02期
3 吕俊;任雪萍;;一种基于粗糙集理论的变压器故障多变量决策树诊断方法[J];安徽电气工程职业技术学院学报;2011年01期
4 张根耀,李竹林,赵宗涛;遮挡情况下运动目标的跟踪[J];安徽大学学报(自然科学版);2003年03期
5 刘金红;陆余良;施凡;宋舜宏;;基于语义上下文分析的因特网人物信息挖掘[J];安徽大学学报(自然科学版);2009年04期
6 张艳;张海军;;基于DSP的多通道超声波连续测厚系统的研究[J];安徽工程科技学院学报(自然科学版);2008年03期
7 陈弋兰;王鸣;孙书诚;;朴素贝叶斯分类器的误差估计[J];安徽工程科技学院学报(自然科学版);2008年04期
8 孙虹;方敏;;基于Rough集和RBF网络的车牌字符识别方法[J];安徽建筑工业学院学报(自然科学版);2006年04期
9 孙虹;;粗糙集神经网络系统在车牌字符识别中的研究[J];安徽建筑工业学院学报(自然科学版);2007年04期
10 张继宝;汪明武;谢慧敏;;基于粗糙集理论的围岩稳定性模糊综合评价[J];安徽建筑工业学院学报(自然科学版);2008年02期
中国重要会议论文全文数据库 前10条
1 尹宗成;;粗糙集理论在我国粮食产量预测中的应用[A];现代农业理论与实践——安徽现代农业博士科技论坛论文集[C];2007年
2 危前进;董荣胜;孟瑜;崔更申;;基于粗糙集的机械装配知识发现方法[A];广西计算机学会25周年纪念会暨2011年学术年会论文集[C];2011年
3 周绮凤;林成德;罗林开;彭洪;;一种基于黎曼度量的训练样本类不平衡SVM分类方法研究[A];第二十六届中国控制会议论文集[C];2007年
4 刘志斌;金连文;;候选字静态生成技术及其在两级LDA汉字识别中的应用[A];第二十六届中国控制会议论文集[C];2007年
5 张彬;金连文;;基于AdaBoost的手写体汉字相似字符识别[A];第二十六届中国控制会议论文集[C];2007年
6 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
7 梁禹;王义刚;王娜;;基于支持向量机的电力电子电路故障诊断[A];第二十六届中国控制会议论文集[C];2007年
8 何鹏;王雅琳;桂卫华;孔玲爽;;氧化铝硅渣成分的混沌时间序列分析与SVM预测[A];第二十九届中国控制会议论文集[C];2010年
9 田艳兵;;BP算法和PSO算法在神经网络中的研究[A];第二十九届中国控制会议论文集[C];2010年
10 王新宇;孙冠;韩冬;张婷;;基于一种改进神经网络的数据手套手势识别[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
2 母丽华;煤矿安全预警系统的方法研究[D];哈尔滨工程大学;2010年
3 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
4 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年
5 冷欣;船用增压锅炉汽包水位预测控制方法研究[D];哈尔滨工程大学;2009年
6 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
7 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
8 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
9 乔小燕;基于生物形态学的赤潮藻显微图像分割与特征提取研究[D];中国海洋大学;2010年
10 杨宁;计算机辅助卷烟配方设计关键技术研究[D];中国海洋大学;2010年
中国硕士学位论文全文数据库 前10条
1 杜二玲;拟概率空间上等均值噪声下统计学习理论的理论基础[D];河北大学;2007年
2 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
3 廖甜甜;白细胞图像语义识别分类的研究[D];南昌航空大学;2010年
4 黄正荣;基于振动波的高速公路车辆行驶状态辨识理论研究[D];南昌航空大学;2010年
5 刘棉;人机划拳系统的实现[D];山东科技大学;2010年
6 刘桂珍;颅骨三维重建与信息提取[D];山东科技大学;2010年
7 马冉冉;集成学习算法研究[D];山东科技大学;2010年
8 吕芳芳;基于查询扩展的垂直搜索研究[D];山东科技大学;2010年
9 张海峰;空间三维信息重构与飞行器路径规划[D];山东科技大学;2010年
10 田文娟;基于支持向量机的人民币序列号识别方法的研究[D];山东科技大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 徐义全;电子文件系列讲座之十二 电子档案的鉴定销毁[J];北京档案;2001年12期
2 倪红;信息化在档案资源整合中的作用[J];北京档案;2004年05期
3 张万寅;档案信息自动化系统管理若干问题的思考[J];北京档案;1999年02期
4 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
5 胡细宝,刘吉佑;DES体制的S-盒的与体制忠实性相关的性质[J];北京邮电大学学报;1999年04期
6 范开宏;数字图书馆之忧思[J];图书与情报;2002年01期
7 刘家真;保存电子文件的国际合作[J];档案管理;2000年01期
8 刘东斌;数字档案馆建设面临的难题[J];档案管理;2003年04期
9 陈智为;试论档案工作的社会效益[J];档案与建设;1995年08期
10 谭必勇;论电子政务信息资源与档案信息资源的合作共建[J];档案与建设;2003年07期
中国硕士学位论文全文数据库 前1条
1 唐飞龙;Internet信息获取技术的研究[D];合肥工业大学;2002年
【相似文献】
中国期刊全文数据库 前10条
1 丁勇江;;浅谈档案信息化[J];新疆有色金属;2010年S2期
2 方芳;;馆藏档案数字化工作实践及认识[J];黑龙江史志;2011年07期
3 陶碧云;论档案信息化内涵及其相互关系[J];档案学通讯;2002年06期
4 刘燕;;加快档案信息化建设探讨[J];才智;2011年18期
5 吕冬煜,党齐民;基于文本挖掘的可视化竞争情报提取[J];计算机应用与软件;2005年02期
6 杜日红;;浅谈档案数字化中的件符识别[J];黑龙江档案;2010年06期
7 耿新青;娄亚斌;张恩胜;;一种基于哈希技术的文本关联规则算法[J];鞍山师范学院学报;2007年06期
8 刘振;推进档案数字化进程 提高档案利用服务水平——福建行政学院档案信息化工作浅探[J];福建行政学院福建经济管理干部学院学报;2004年S1期
9 徐卫华;韩敏;;浅谈档案数字化图像信息的处理[J];山东档案;2007年02期
10 赵文存;;供电企业档案数字化加工及管理探讨[J];青海电力;2010年03期
中国重要会议论文全文数据库 前10条
1 杨重高;;档案数字化与档案仿真复制[A];回顾与展望:2010年全国档案工作者年会论文集(上)[C];2010年
2 丛范滋;;浅议企业档案的信息化建设[A];2008年海峡两岸档案暨缩微学术交流会论文集[C];2008年
3 何拥军;;把握时代脉搏 促进档案事业发展——广西档案信息化发展之路[A];广西档案2010年第5期(总第101期)[C];2010年
4 屠跃明;钱毅;黄建峰;韩李敏;李培力;陈伟;邱晓威;郝晨辉;朱九兰;任旭钧;;档案信息化发展现状、趋势的研究报告[A];回顾与展望——中国档案事业发展研究报告[C];2010年
5 孟根图雅;;浅谈档案信息化的安全隐患及对策[A];档案安全与档案服务——2011年甘肃省档案工作者年会论文集[C];2011年
6 李振银;;论档案的信息化管理[A];齐鲁档案论坛——山东省档案学会2009年学术年会会刊[C];2009年
7 李进军;;浅议如何提高档案安全体系建设的保障措施[A];贵州省档案局、贵州省档案学会“纪念贵州省档案馆成立50周年”学术交流会论文集[C];2010年
8 李德庚;;档案数字化信息的收集与利用[A];中国档案学会第六次全国档案学术讨论会论文集[C];2002年
9 王继成;孙颖;张福炎;;文本挖掘-数据挖掘研究的新课题[A];第十六届全国数据库学术会议论文集[C];1999年
10 刘鹏;;档案数字化管理的探索[A];2011年海峡两岸档案暨缩微学术交流会论文集[C];2011年
中国重要报纸全文数据库 前10条
1 杨萍 邓小玲;海南将实现诉讼档案数字化[N];人民法院报;2010年
2 特约记者 何涛;北京市房山区档案数字化全面提速[N];中国档案报;2011年
3 许建智 特约记者 袁光;江苏专题研讨档案数字化[N];中国档案报;2005年
4 潞安矿业集团公司漳村矿 贾淑珍;运用法治手段推进档案数字化[N];山西科技报;2003年
5 记者 张淑会;我省初步建立档案数字化网络体系[N];河北日报;2009年
6 李旭海;绵竹市为婚姻档案数字化再投入15万元[N];中国档案报;2009年
7 徐澄 沈炜;诉讼档案数字化初探[N];江苏法制报;2010年
8 记者 王爽;房屋档案数字化 公众查询更便捷[N];济南日报;2010年
9 刘来山;北京朝阳区启动“十二五”时期档案数字化项目[N];中国档案报;2011年
10 杨俊君;档案数字化中应注意问题之我见[N];中国档案报;2011年
中国博士学位论文全文数据库 前10条
1 李芳;文本挖掘若干关键技术研究[D];北京化工大学;2010年
2 陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;2010年
3 耿新青;基于模糊逻辑和神经网络的数据及文本挖掘的方法研究[D];天津大学;2005年
4 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
5 文翰;面向信息检索的Web文本挖掘方法研究[D];华南理工大学;2012年
6 黄宁;遥感图象中模式分类技术的研究[D];中国科学院电子学研究所;2001年
7 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
8 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
9 刘永丹;文档数据库若干关键技术研究[D];复旦大学;2004年
10 黄定轩;企业核心能力智能挖掘应用基础研究[D];西南交通大学;2005年
中国硕士学位论文全文数据库 前10条
1 张帆;档案数字化中两项关键技术的研究[D];华中科技大学;2007年
2 李明;数据清洗技术在文本挖掘中的应用[D];南京理工大学;2008年
3 刘明岩;面向语义关系发现的文本挖掘研究[D];南京理工大学;2010年
4 李钝;基于粗糙集理论的文本挖掘技术研究[D];山西大学;2003年
5 程春惠;公安犯罪案件文本挖掘关键技术研究[D];浙江大学;2010年
6 徐爱华;面向文本分类的中文文本挖掘技术研究及实现[D];武汉理工大学;2004年
7 刘岩;基于Web的文本挖掘技术的研究[D];哈尔滨工程大学;2004年
8 姚继伟;基于XML的Web文本挖掘的研究[D];吉林大学;2010年
9 易高翔;Web文本挖掘研究与实现[D];武汉科技大学;2004年
10 杨斌;中文文本数据挖掘研究[D];湘潭大学;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026