您现在的位置在: 首页 > 档案法规 > 学校规章 > 正文
上海交通大学档案馆纸质档案数字化技术规范
发布日期:2008-08-06    撰稿:    摄影:
字号:[]
为了规范、科学、合理的开展纸质档案数字化工作,使档案信息资源准确、方面、快捷地提供共享利用,以满足学校对档案的需求,现参照《纸质档案数字化技术规范》(DA/T 31-2005),并结合本馆实际,制订本技术规范

为了规范、科学、合理的开展纸质档案数字化工作,使档案信息资源准确、方面、快捷地提供共享利用,以满足学校对档案的需求,现参照《纸质档案数字化技术规范》(DA/T 31-2005),并结合本馆实际,制订本技术规范。

 

一、本规范的适用范围


    本规范规定了纸质档案数字化的主要技术要求。
   
本规范适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。

 

二、纸质档案数字化的基本原则:

 

纸质档案数字化的基本原则是使档案信息资源准确、方便、快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。

1.规范性原则:所有档案信息必须按照规定的技术要求、文本格式和工作标准进行数字化,并尽可能采取通用标准,在特定技术参数方面适当调高。

2.安全性原则:在档案信息数字化过程中要确保档案原件的安全、确保数字化档案信息的内容与档案原件相吻合、确保档案信息内容不泄密。

3.效益性原则:在充分调研的基础上选择最优的档案信息数字化方案,包括选择最优的工作流程、最合理的技术手段和最适宜的数字化加工设施等。

 

三、纸质档案数字化对象的确定:

 

    应当对所要进行数字化的对象按照一定的原则和利用方法进行确认,只有符合一定要求的纸质档案文献才能进行数字化。

1. 保护至上,分步实施原则

2. 需求导向,急用先上原则

3.剔除无用,避免浪费原则

 

四、纸质档案数字化技术要求

 

1.         扫描档案的总体要求:每张图片应在200%的查看比例下,字迹、边框清晰,图片上加有水印专用章、图片顺序号与案卷的页码号一致;

2.         扫描均为24位色彩色模式。分辨率要求:历史档案:≥400dpi;非历史档案:≥200dpi。数码相机拍摄档案的分辨率要求:相机的像素设定应相当于或大于分辨率200dpi;分辨率的设定应以“每张图片应在200%的查看比例下,字迹清晰、完整”为原则;若有特殊情况导致影响扫描图像的利用和阅读的(包括图像的清晰度是否理想、图像大小是否合适),可根据实际情况作以调整:

3.         对于所扫描图片原始文件,按照相应的规格,在保存时,应按照图片的最高品质保存; 对于压缩、处理后的图片,应保证图像的清晰、可读。

4.         图片宽度一般设置为430-600像素,每幅图片的宽度和长度最大分别不得超过1000像素;图片大小设置为90-150K,最大不得超过150K;图片尺寸和大小的设定原则应按照档案信息管理系统的要求来设定。

5.         图形图像的存储格式为:JPGPDF;图像文件OCR转换后的存储格式为:DOCXLSPDF格式的文件内部顺序应与相应的案卷页码顺序保持一致。

6.         加工方应提供三套图像数据光盘。一套为初始图像;另一套为加入水印后的图像;还有一套为初始图像的PDF格式的文件。此外,光盘的品牌、型号、规格等指标参数必须经档案馆认定;

7.       各个门类的档案在加工处理上可能存有异同,相异之处,应按本门类档案的特有属性来加以区别对待,并按事先约定的特殊要求和程序来处理。

加工方在移交图像之前,应对图像偏斜度、清晰度、失真度、排列顺序以及是否漏扫等方面进行检查,不符合质量要求的,应重新进行图像的扫描或处理。

 

五、纸质档案数字化工作流程及具体要求

 

纸质档案数字化的基本流程主要包括:档案借出、档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份等。

1.档案交接,出库登记:

1)档案调出库房应由双方共同清点案卷数量,仔细查看每个案卷,对于案卷有否破损、残缺、漏页、缺页、有无卷内目录、页码是否连续,装订是否牢固,有否破损等情况均记录备案,并作为档案再入库验收的依据;

2)档案数字化外加工(即扫描或翻拍、图像处理)的数量,一般一次50卷左右。档案离馆之前,应办理交接手续,由档案馆档案保管利用室主任和加工方法人代表共同签字后,方可离馆;

3)由档案馆派出代表与加工方共同将待数字化外加工的档案护送至加工场地,以确保档案之安全。

2.拆除案卷,区分类型:

(1)拆卷前,先检查卷内文件是否编有页码。未编页码的,用铅笔编写在单面材料的右上角、编制双面书写的文字材料时正面编写在右上角,反面编写在左上角;

(2)如发现卷内目录和卷内实际分页不符,整理人员校核后用铅笔修改错误的页码;

(3)拆卷时,要首先去掉金属物。对于必须裁页才能扫描的文件,在经档案管理人员同意后方可用裁纸刀沿文件原有折痕细心裁切,不得徒手撕裁;拆卷后的所有案卷一律平放,不得竖放和侧放;

(4) 按要求把同一案卷中的扫描件和非扫描件区分开。普发性文件区分的原则是:无关的重份的文件要剔除,有正文的文件可以不扫描原稿。正式文本中的定稿(文件处理签及定稿中有领导人亲笔批示和审改内容的除外)、成批统计报表中的重复性填表说明文字、有正式转发件(发文)的被转发件(收文)等无须列入数字化处理的对象。

3.分清类型,分类扫描

根据档案幅面的大小(A4A3A0)选择相应规格的扫描仪或专业扫描仪。一般普通纸张的案卷采用高速扫描仪进行批量快速扫描;针对纸张状况较差,以及过薄、过软或超厚的档案,采取加保护套及平板扫描方式。

(1)扫描工作开始前,应检查扫描软件技术参数设置是否正确;

(2)扫描时,必须保证文件夹命名正确;

(3)扫描时,先扫案卷封面和卷内目录,封面和卷内目录各自单做一个文件扫描;同时对照卷内目录所示页码对卷内文件进行分件扫描;

(4)扫描时,应对不同的纸张采用对应的方法进行扫描,对于纸张太薄、太差、太小、破损或字迹模糊的,可用A4幅面空白纸张进行背面托衬扫描,或者扫描为灰度模式或彩色模式;对于纸张太大无法高速扫描的,应采用平板扫描,注意科学合理的切分,并应在对应的文件题名中作以说明或标记,无法标记的,应记录在案;

(5)扫描应尽量减少扫描图像的黑边和杂点;应尽量保证扫描图像正立;

(6)扫描要务必避免漏扫、错扫、重扫、分件错误、图像残缺等现象;

(7)扫描后的纸张应尽量保持页码排序正确,并对已扫描的案卷作以简单的整理。应保持扫描工作区域的整洁有序,避免案卷、文件混杂、无序;

(8)扫描好的案卷应及时分批移交给装订人员,并登记在案,对有特殊情况如需要补扫、重扫或纸张太乱的,应及时向装订人员说明,并记录在案;

4.图像处理,归类归档

(1)对图像偏斜度、清晰度、失真度进行检查。发现不符合图像质量要求时,应重新进行图像的处理。

(2)由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。

(3)发现文件漏扫时,应及时补扫并正确插入图像。

(4)发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。

(5)认真填写相关表单,记录质检结果和处理意见

(6)纠偏:对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。

(7)去污:对图像页面中出现的影响图像质量的杂质如黑点、黑线、黑框、黑边等应进行去污处理。处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。

(8)图像拼接:对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。

(9)裁边:采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。

5.图像存储:

首先建立影像数据库模板,设置字段,确定录入标准;对照案卷原件(或卷内目录)建立索引;对录入信息进行校对检查;提交录入信息,建立索引。

纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为这份文件扫描后的图像文件命名。多页文件可采用该档号建立相应文件夹,按页码顺序对图像文件命名。具体命名规则如下:

 

6.校对总检,备份数据:

检查扫描参数、扫描分辨率、存储格式等是否正确;检查图像数据的清晰度,以及可懂度、失真度(确保放大200%图像依然清晰);检查文件夹及文件命名是否正确,检查图像数据库管理是否正确科学;对发现的图像质量有问题,参数设置不正确,图像缺失,数据库混乱等情况进行处理。验收"通过"的结论,必须经分管领导审核、签字后方有效。特别指出的是:原始图片在验收时,以原始图片的相应的分辨率的最高存储品质为验收标准;

经验收合格的完整数据应及时进行备份。
(1)
备份方式
   
为保证数据安全,备份载体的选择应多样化,可采用在线、离线相结合的方式实现多套备份,并注意异地保存。
(2)
数据检验
   
备份数据也应进行检验。备份数据的检验的内容主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。
(3)
备份标签
   
数据备份后应在相应的备份介质上做好标签,以便查找和管理

7.目录著录,图像挂接:

按照上海交大数字档案馆档案信息著录规则之要求,规范档案中的目录内容。包括确定档案目录的著录项、字段长度和内容要求。采用人工校对的方式,对目录数据库的建库质量进行检查。如有错误或不规范的案卷题名、文件名、贾任者、起止页号和页数等,应进行修改。

挂接全文数据成果。档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认为"合格"后,通过网络及时加载到数据服务器端汇总。通过编制程序或借助相应软件,可实现目录数据对相关联的数字图像的自动搜索,实现批量、快速挂接。

      以纸质档案目录数据库为依据,将每一份纸质档案文件扫描所得的一个或多个图像存储为一份图像文件。将图像文件存储到相应文件夹时,耍认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中该份文件的页数是否一致,图像文件的总数与目录数据库中文件的总数是否相同等。通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。

8.数据移交、验收

档案馆档案保管利用室负责对存在光盘上的数字化加工后的档案信息进行检查验收,以抽检的方式进行移交数据的验收,一个全宗的档案,数据验收时抽检的比率不得低于5%;抽检的合格率需达到95%以上(含95%)时,方予以验收通过,合格率=抽检合格的文件数/抽检文件总数×100%;验收不合格的应由加工方负责立即修改;

检查验收标准:光盘上的信息能否读取、是否存在病毒、图片是否清晰(每张图片验收时应以200%比例查看,字迹、边框是否清晰)、图片上是否加有水印专用章、图片顺序号与案卷的页码号是否一致、以及查看是否按照其它规定的指标参数进行标准化的加工制作。

9.装订还原,入库验收:

案卷装订工需严格按照装订技术标准,依照恢复原样的原则,完成装订。同时对各项工作的检查校对后,对数据、条目工作成果作以系统性、全面性的备份,档案原件归还。装订工作需注意以下要点:

(1)检查案卷封面、目录、原件、备考表等构成部分是否齐全和一一对应;

(2)检查各纸质档案是否有破损、丢失、遗漏、混乱等情况,如发现是属于前环节操作不当导致的,应及时报告项目负责人,则追究有关人员的责任;如是装订人员在工作中操作不当导致的,则应及时纠正,并及时报告,情节严重的,则追究有关人员的责任;

(3)正确排序:检查页码排序是否正确,检查文件正反面、横竖面是否正确;

(4)检查大幅面纸张折叠是否正确合理,检查是否有破损严重的,如有则应进行裱糊;

(5)装订时,须依照右对齐、下对齐的方法将文件纸张对齐;

(6)装订穿孔时,尽量使用原装订孔,若原装订孔不能使用,需要打穿新孔的,则应尽量保证装订孔不要压住文字、图表;

(7)装订穿线时,须保证装订线不要拧缠在一起,装订线要平整。装订线要拉紧。装订线应在案卷背面打结,余线要适中(2cm左右)。

数字化加工后的档案交接验收应由双方共同负责,其验收的主要内容:清点档案数量是否正确、档案复原装订是否牢固、档案是否破损、档案案卷页码是否颠倒、是否有缺页现象等;

加工方必须将前一次的外借档案连同制作完成的初始图像光盘、水印图像光盘以及PDF文件光盘交给档案馆。在双方对档案案卷和数字化加工后的档案信息交接验收无误后,应由双方代表签字,以示该批档案数字化加工完毕;方可进行下一次的档案外借工作。并且,加工方应对前一次计算机硬盘上留有的数字化档案信息应该予以清除。

 

 


【浏览次数】:

Copyright© 2018 上海交通大学

地址:上海市东川路800号  邮编:200240

官方微信

官方微博