行业应用

纸质档案数字化全程管理实践与思考

日期:2013年12月19日 12:04

 

为按期完成国家重点档案抢救任务,加快推进数字档案馆建设步伐,江西省档案馆于2007年启动省档案馆馆藏纸质档案数字化工作,围绕如何解决数字化服务外包过程中的档案实体与档案信息安全、质量控制,以及如何提升纸质档案数字副本凭证性问题,不断学习、研究、总结,形成了一整套可行的纸质档案数字化全程管理工作方法与措施。

    一、实施纸质档案数字化全程管理的必要性

    1.实施全程管理是维护档案实体与档案信息安全的重要屏障

    在纸质档案数字化外包过程中如何保障档案实体和档案信息的安全,已成为开展纸质档案数字化外包工作中急需解决的问题。在维护档案实体和档案信息安全实践中,档案实体和档案信息在数字化各环节中流转,都离不开人这个关键因素,而把具有主观能动性的人与具有客观性的流程设计管理制度、监控设备有机结合起来的有效手段,就是全程管理。只有进行全程管理,实现两方面优势互补,才能最大限度地保障档案实体和档案信息安全。

    2.实施全程管理是质量控制的必然要求

    质量控制如同医生看病,治标不能忘治本,现实中经常存在“头疼医头、脚疼医脚”的“重结果轻过程”的质量管理误区。对纸质档案数字化实施全程管理,就是为了彻底走出“事后控制”的误区,由单一的事后质量检验把关控制转变为“预防式”的事前控制、事中控制和事后数据质检相结合的综合管控策略,实现质量问题的处理“由堵向疏”的转变,进一步提高数据质量,提高各环节工作效率。

    3.实施全程管理将为今后认定纸质档案数字副本凭证性奠定基础

    通过数字化转换制作纸质档案数字副本,是当前和今后一个时期实施重要档案异质异地备份,加快数字档案资源建设与网络化共享的主要途径。以数字副本作为纸质档案的异质备份件,在网络化查档利用工作中代替档案原件出证,这都要求纸质档案数字副本应具备凭证功能,这也是今后必须解决的问题。鉴于当前我国认定数字副本法律地位的法规和标准尚未出台,而纸质档案数字化以及数字副本的长期保存是一个浩大的系统工程,在经费、人力、物力等方面的投入可谓巨大,属于稀缺资源的档案原件在数字化过程要经过一场浩荡的拆装过程,若以这样的代价制作形成并长期保存的数字副本仅具有查考价值,那么纸质档案数字化的工作绩效将被大打折扣。基于这样的认识,参照《缩微摄影技术缩微品法律认可性》等标准,省档案局馆认为只有通过全程管理,从保障纸质档案数字副本真实性、完整性、可靠性和可用性入手,规范数字副本的制作过程,尽力保存数字副本的背景和结构信息才能为将来认定它的凭证性奠定基础、创造条件。

    二、纸质档案数字化全程管理实践的主要做法

    省档案馆将纸质档案数字化全程分为10个基本环节,包括审批数字化对象、制定数字化工作方案、档案出库、整理分件、建元数据库、档案扫描、图像处理、数据质检、档案还原入库、数字化成果验收移交等,同时,针对数字化基本环节建立数字化工作文档管理制度。下面重点介绍下省档案馆在几个关键环节的主要做法。

    1.数字化对象的审批。为证明民国档案数字副本来源的可靠性,参照档案原件缩微品规范制作要求,对数字化对象实行审批制,由法人签署《纸质档案原件数字化审批书》,并将其纳入全宗卷和数字化工作文档管理范畴。审批书主要内容包括数字化对象、数字化目的、授权信息、审批时间等。

    2.制定数字化工作方案。省档案馆把数字化工作方案视为有效管理数字化全程、控制数字化成果质量的重要武器,因此,它既是数字化服务外包招标文件的主要内容,也是项目实施全过程的操作和管理标准,应尽量具体、量化并具可操作性。省档案局馆编制的纸质档案数字化工作方案主要包括数字化现场安全保密措施、项目管理要求、档案整理与修复要求、技术标准、数字化工作文档管理要求、数据质检与验收要求、数字化成果移交要求等主要内容。每个方面都有详细的要求,比如,技术标准部分又进一步明确了数字图像技术参数、图像处理、格式与存储、命名标准、著录与目录数据库建库、数字化元数据赋值等要求。

    3.整理分件。整理分件是整个数字化过程的重要环节,直接关系到档案实体安全和数字副本的命名、存储与质量控制,抓好该环节,整个数字化工作将事半功倍。省档案局馆的主要做法:一是加强对数字化服务外包商员工的集中培训,他们对民国时期公文、组织职能等方面的认知水平将决定整理分件的准确性,培训内容包括民国公文种类、公文处理办法、民国时期文化背景知识、政府机构的衍变、电报在公文中的应用等;二是每个案卷填写一张数字化流程单,并跟随案卷在数字化各个环节流转,需要填写案卷的总页数、页号编制、修裱、分件情况,登记珍贵和特殊档案页面;三是实行流水线上整理分件环节的在线指导,发现问题及时指正,提高整理分件的准确率,从而提高整个项目的工作效率。

    4.建文件级元数据库。省档案局馆将档案目录数据与数字化元数据的集合称为元数据库。自2009年起,省档案局馆要求数字化服务外包公司在数字化过程中由数字化系统自动捕获或手动批量著录数字化授权、时间、分辨率、格式、捕获设备等20个有关数字副本背景和结构的元数据。这一做法在后来发布的《信息与文献——文件档案数字化实施指南》中得到印证。同时,在准确分件的基础上按照《档案著录规则》《民国档案目录中心数据采集标准民国档案著录细则》《江西省文书类电子档案著录与数据格式规范》等标准规范进行著录与目录数据录入,建立案卷级、文件级目录数据库。鉴于经费、人力和时间等方面的限制,着眼为今后各项业务工作建立基础数据库,省档案局馆采取了民国档案文件级著录分步实施、逐渐完善的策略,即在数字化过程中做到卷内档案分件基本准确,建立文件级目录数据库时照录档案原有事由,无事由时才重拟题名,为今后著录职能部门依托数字档案集成管理系统进一步开展著录工作奠定基础。实践证明这是一项有效的举措。

    5.图像处理。按照精确复制的原则并参照《纸质档案数字化技术规范》的要求实施图像处理,使数字图像清晰、端正,准确反映档案原件的原始面貌,不去除档案页面原有的纸张褪变斑点、水渍、污点、装订孔等;在距页边最外沿约2毫米处裁剪数字图像,保留纸质档案原有页边,包括破损、歪斜页边。

    6.数据质检。包括数字图像质检与目录数据质检两个部分。按批次数据随机抽检方式进行质检,质检次数一般为两次。一次质检抽检率不少于20%,二次质检抽检查率不少于10%,批次抽检合格率应为100%,否则整批数据打回重新制作或不予验收,同时据实填写质检任务安排单、质检情况登记表、质检验收登记表等数字化工作文档,作为数字化成果验收移交的依据。

    7.数字化成果验收移交。移交的内容包括符合标准化要求的纸质档案数字副本及其元数据库、数字化工作文档以及按照规范要求制作的存储移交介质。其中,纸质档案原件数字化审批书、数字化工作方案、数字化项目招投标文件、中标通知书、数字化项目合同书等凭证性文件的数字副本一同存储于移交介质的授权文件夹中。

    三、几点思考

    纸质档案数字化是高速发展的信息时代给档案工作带来的一项新内容,在推进过程中不可避免会遇到一些新情况、新问题。

    1.如何更加科学确定数字化范围,除了考虑档案重要程度、破损情况、利用需求等,是否还要结合数字化工作进度、工作量以及数字化绩效等实际情况综合考虑。

    2.数据质检与准确率问题。面对数以百万级甚至千万级的目录和图像数据,即使实施全程管理、尽最大努力提高抽检比例,也难免会挂一漏万。在合理安排年度工作量的前提下,如何提高数据准确率,需要进一步摸索、研究和总结推广。

    3.数字副本的法律地位问题。目前,我国尚未启动有关数字副本法律认可性的法规标准的制定工作,现有标准均没有明确的相关条款,通过实践证明《信息与文献——文件档案数字化实施指南》以及澳大利亚等国的先进标准具有科学性、合理性和可操作性,因此,应该参照这些标准并结合我国的具体实践着手制定有关标准,用于规范数字副本制作的全程管理与技术要求。总结省档案局馆在这方面的做法主要包括以下几个方面:

    (1)实施数字化对象审批制,用以记录数字化项目授权信息,证明数字副本来源的合规性;

    (2)建立并归档保存规范的数字化工作文档,记录、审核数字化项目全过程管理信息;

    (3)完整扫描关于同一项业务活动的往来文件,以及一份文件的正本、定稿、公文处理单、重要修改稿等,确保数字化对象及其来源信息的完整性;

    (4)精确复制、准确标识,以文件级档号及件内页面流水号命名数字副本,以彩色JPEG格式存储源版数字副本,完整记录档案原件页面原有内容,包括斑点、破损页边等页面信息;

    (5)通过数字化元数据记录纸质档案数字副本的技术参数与生成背景;

    (6)通过先期制定数字化工作方案,结合现场监管、按比例抽检、分阶段验收等方式,实施数字化成果的质量控制。

    原载于《中国档案报》2013年11月14日 总第2533期 第一版

所属类别: 新闻中心

该资讯的关键词为:

资质荣誉