一、数字化中期:目录优先,注重源头,确保质量
1.确保目录数据库的规范和完善
虽然档案信息全文数字化是数字化工作的方向,但在全文检索还无法大规模实现的今天,机读目录数据仍是档案检索的主战场,构建规范和完善的目录数据库是档案信息进行数字化的第一步。各学校应首先补充完善案卷级与文件级机读目录,特别是办学历史悠久和馆藏档案数量大的学校;其次,应检查已有机读目录数据的质量和规范,目录信息能否规范、准确地反映档案内容。
2.重视电子文件的接收
电子文件的接收是减轻档案数字化工作压力的有效途径,每推迟一年接收电子文件,就意味着以后要多花人才物力对其进行数字化工作。目前,大部分学校都实现了校园办公自动化,但都着重于文件资料的流转利用,至于归档保存则是另一回事。因此,学校档案部门应主动与本单位信息部门商讨,将档案信息化管理纳入校园信息化工程,以实现电子文件的网上传输和归档,对于还未实现校园一体化的单位,则应要求在纸质文件归档同时要求提交电子版。
3.做好全文数字化档案的校验工作
全文数字化是一项工作量相当庞大的工程,但学校专职档案管理人员往往人数偏少,因而档案全文数字化工作一般都委托给数字化处理专业公司来做。数字化专业公司常常是在短期内加班加点完成委托的数字化处理任务,至使档案管理人员无法逐个对图像文件进行校验。因此,各学校在与数字化处理专业公司签订数字化处理技术委托合同时,应明确写明数字化处理的质量要求、质量标准、质量检查方法以及质量问题的解决办法等。在实践过程中,除了数字化专业公司指定专人负责数字化处理中的校验工作,还应安排档案管理人员进行抽样校验工作,校验工作与专业公司数字化处理工作同步,做到随扫随校,发现错误,立即重扫,确保不会出现图像歪斜、污点、大小不一等情况。
二、数字化后期:统筹兼顾,安全第一,讲求实效
1.统筹兼顾,保证数字化工作可持续
档案数字化工作牵涉多个业务部门,只有统筹和兼顾好各种关系,数字化工作才能可持续。一是要善于共享、利用本校的软硬件设施和网络资源,避免不必要的重复投资;二是要合理分配部门内人员和技术,避免有限资源的不合理分配;三是要根据馆藏实际情况配置适用的设备,避免不必要的高起点、高标准和盲目跟风;四是要合理安排每年的工作进度,避免不切实际、盲目乐观地定数量、定进度;五是要借档案数字化之机,进一步规范纸质档案管理,避免数字化档案被随意访问、篡改、复制等破坏档案原始凭证性和真实性所带来的严重后果。
2.确保数字化工作的安全
首先,档案数字化过程中要大量利用档案实体,因而应加强档案实体流通过程的监控,保证档案实体不丢失、不损坏,确保绝对安全;其次,要选择安全的档案信息存储设备。数字档案信息能否长期存取与存储介质息息相关,一旦存储介质受损,其数据也将不复存在。因此,应选择优质、安全的存储介质来确保数字档案信息的安全,如光盘、移动硬盘、服务器等。再次,要做好档案信息备份。数字化处理的档案信息应备份两套以上,其中原件封存保管,复件用于对外查阅利用和异地保存,同时做好原件与复件数据的比对校验工作,确保备份信息可读、可还原,并做好数据信息备份时的登记工作。最后,应做好信息数据库的日常维护,以防止数据的丢失、破坏、更改、非法下载复制、病毒侵袭、系统崩溃、硬件损坏等不安全因素。
中国气象局气象档案馆(以下简称气象档案馆)馆藏的我国器测气象观测记录始于19世纪40年代,而可利用的数字化气象记录档案基本始于解放后。大量纸质气象记录档案无论在实体所占空间还是在内容记录时间跨度上都处于绝对优势地位,这种档案的实体状况严重限制了其信息提供利用的时间范围与空间范围,降低了其信息利用的效率,亟待数字化。在此背景下,气象档案馆于2007年2月正式启动了气象记录档案数字化项目。近期,气象档案馆决定,在做好此次低温雨雪冰冻灾害灾后重建阶段档案服务的同时,加快历史气象档案数字化的步伐,加大档案数字化的力度。
制定气象记录档案数字化方案
为顺利完成气象记录档案数字化,气象档案馆在项目启动前制定了完整的方案,对气象记录档案数字化的内涵、范围、建设原则和组织实施方案等方面作出了明确的定义与说明,对什么是气象记录档案数字化、如何开展气象记录档案数字化等问题给出了详细的阐释。
参考现有气象记录电子文件格式,我馆决定将TXT格式作为本次电子文本形态气象记录档案的标准格式。
一、对数字形态档案信息进行科学管理
数字化气象记录档案信息的编目是以传统形态气象记录档案目录为基础,结合新生成数字化形态气象记录档案信息的组成形式及内容特点,以条目的形式对数字化形态气象记录档案信息的内容种类、信息组织形式、记录责任者、观测要素、时空范围等信息内容与形式属性进行概括的工作。为规范该项工作,我馆制定了《数字化气象档案案卷级和文件级目录著录格式》,对著录内容与格式作出明确规定。
数字化形态气象记录档案的整理是指按照相关档案管理规定对新生成数字化气象记录档案进行完整性检查、质量和格式检查及逻辑分类与排序的工作,它是数字形态气象记录档案信息生成的基本环节,其工作质量直接影响到档案归档后的管理与利用。气象档案馆制定了《历史气象档案扫描电子文件检查方案》等技术规范来对数字化形态气象记录档案的整理提供技术支撑。
数字化气象记录档案的存储是将整理完成的数字化形态气象记录档案存储在特定的磁带、磁盘或光盘上的工作。根据现有电子档案存储设备及档案管理和利用的需求,我馆要求数字化气象记录档案使用磁带、光盘各存储一套。归档存储的各种技术指标,按照《电子文件归档与管理规范(GB/T18894―2002)》等相关规定执行。
二、对数字形态气象记录档案信息进行有效利用
对数字形态气象记录档案信息进行有效利用是本次档案数字化的最终目的,需要解决的主要问题是确定提供利用的范围、对象及方式。根据中国气象局《气象资料共享管理办法》规定,本次档案数字化形成的所有数字形态气象记录档案信息都应提供利用,提供利用的对象及其利用权限参照该办法中的相关规定执行,提供利用的时间顺序由数字化形态信息归档的先后顺序决定。
档案利用的方式可根据是否使用网络分为在线与离线两种。离线服务与传统气象记录档案的服务相同,按同一规章制度及程序执行。在线服务是通过建立网络平台来满足用户通过网络调用档案的需求。与离线服务相比,在线服务工作相对复杂,其主要任务是满足档案管理与利用需求的系统平台建设。为建设系统平台,我们制定了《历史气象档案电子文件应用服务系统功能需求》,委托数字化加工企业据此开发。
三、气象记录档案数字化实施原则
气象记录档案数字化实施原则是数字化工作必须遵循的强制性规则,是达到数字化总体目标的重要保证。根据档案管理需求与数字化工作总体目标,气象档案馆确定了四条原则:保证档案的安全性:气象记录档案的安全包括实体安全与内容信息安全两方面;保证档案的有序性:气象记录档案的有序性包括纸质或缩微胶片气象记录档案的有序性和数字化形态档案信息的有序性;保证档案信息的真实性:在档案数字化实施过程中保证原始气象记录档案内容信息的真实性,避免信息被篡改;便于管理和利用:利用需求不同对气象记录档案信息组织形式要求也不同,档案数字化产品的特点与形式必须兼顾档案的管理需求与用户的利用需求。
气象记录档案数字化的经验与不足
通过对气象记录档案数字化方案的贯彻执行,气象档案馆实现了馆藏194万页气象记录档案的扫描数字化,完成了数字化档案应用服务系统的开发建设。在实现档案数字化既定目标的同时,取得了宝贵的实践经验,为馆藏其他档案数字化及全国气象记录档案数字化奠定了坚实基础。
通过对气象记录档案数字化工作实施情况的分析,总结出以下经验:即只有对气象记录档案数字化流程进行全程管理、规范管理、安全管理才能较好地完成数字化工作。
1.全程管理是气象记录档案数字化成功的基本保证。根据气象记录档案数字化方案的有关规定,本次档案数字化工作实现了数字化流程的全程介入管理和全面细节管理,有效保证了传统形态信息的安全、有序,较好地保证了数字化产品的质量与应用效果。
2.规范管理是气象记录档案数字化成功的关键。由于本次数字化的气象记录档案数量巨大、种类众多、格式复杂,使得数字化工作任务繁重、技术问题繁杂、工作流程复杂、产品质量控制困难。为此,必须制定详尽的数字化操作流程及技术标准来规范具体的档案数字化工作。
3.安全管理是气象记录档案数字化的基本要求。为做好数字化过程中的档案安全保障工作,气象档案馆采取了诸多措施,如提供专用的数字化加工场地、制定规范档案移交与归还的《历史气象档案交接管理办法》、制定响应突发安全事件的《气象档案馆防火应急预案》、在数字化加工合同中明确规定档案保密与保护条款等。
4.档案修复与数字化工作同步进行。由于档案修复工作需翻阅全部档案并进行破损情况鉴定,为节约时间和减少档案原件调用次数,气象档案馆将破损档案鉴选与档案整理编页同时进行。
根据档案数字化的具体情况,结合工作实践,总结了以下三点不足:
1.前期传统载体档案整理工作不足。由于历史原因,在数字化工作开展初期许多需要数字化的气象记录档案没有编页,气象档案馆与数字化加工企业的档案交接以册而不是以页为单位进行,一方面给档案完整性检查带来不便,另一方面也给数字形态档案信息文件排序造成了障碍。为解决该问题,气象档案馆不得不对这些档案以原档案实体状态及档案内容的内在逻辑联系作为数字化文件完整性检查与文件排序的依据。
2.数字化加工进度控制不足。本次气象记录档案数字化在进度控制方面有所欠缺,未按预定计划完成数字化任务。原因主要在于气象记录档案数字化是一项任务繁重、流程复杂的工作,在实际工作中存在很多无法预见的问题。
3.档案信息安全管理不足。本次气象记录档案数字化工作对档案实体安全进行了有效的管理,但对档案内容信息安全的管理在档案内容接触范围及档案传输控制方面略有不足。第一,数字化工作委托企业进行,在客观上不可避免地扩大了档案信息的接触范围。第二,数字化过程有质量检查、格式检查、信息复制等环节,无法实现扫描与存储设备的全封闭管理,给档案内容信息的外泄留下隐患。目前,我们正针对如何对档案信息内容进行更严密的安全管理做深入研究。
总体情况
2000年12月,国家档案局、中央档案馆印发的《全国档案事业发展“十五”计划》,把“加快档案信息化建设”、“加快现有档案的数字化进程”列入其中。同月,国家档案局在中国档案管理现代化建设研讨会上宣布“十五”期间,我国将加快数字档案馆的建设。为适应新时期档案工作需要,北京市档案局(馆)在《北京市档案事业“十一五”发展规划》、《北京市档案馆“十五”发展规划》、《北京市档案局馆20042008信息化建设要点》中提出了“档案数字化工程”概念,该工程包括三大系统:制作系统、存储系统和应用系统。其中制作系统是指传统载体档案的数字化,即:纸质档案、缩微品档案和照片音像档案的数字化,由此拉开了大规模对馆藏档案数字化工作的序幕。
2001年确立馆藏档案全面数字化的发展战略;
2002年4月起,纸质档案数字化工作全面推进。以每年400万页的速度递增,截止到2010年底,纸质档案数字化累计完成112万卷册、3525万页,占馆藏纸质档案总量的58%,完成了“十一五”规划的3500万页预定目标;
2005年底,建立数字化档案利用系统,实现了接待利用工作从登记检索到调档归卷、复制、审批、统让阅览、打印全过程的计算机管理,利用者可登录系统在线检索目录数据并阅览、打印数字化档案;
2007年国家档案局的传统载体档案数字化试点工作中,分别提出了“统筹规划、分步实施”、“需求引导、利用优先”、“三网并进,高效服务”、“确保安全、平衡发展”和“优先存量、注重源头”的数字化工作原则;
2008年针对档案数字化之后成品利用率不高的问题,陈乐人局馆长提出了提高数字化工作质量,加强挂接工作,做到数字化进度与成品利用进度同步的要求,提高数字化工作质量和成品挂接工作,使档案原件保护和数字档案利用工作进一步强化。技术部门通过案卷级别挂接和文件级别挂接建立了目录条目到电子图片的对应关系,目前已经实现了3000万页档案全文数据在局域网的挂接;
历经十年的不懈努力,至“十一五”末,全馆已建立起一套包括纸质、缩微品、照片和音频、视频等各种载体档案在内的数字化加工、存储、利用系统,系统功能更加全面,性能更加稳定。在档案利用大厅,22台计算机、高速的局域网络和先进的档案利用系统搭建起北京市档案馆数字档案利用平台,馆藏全部全宗级目录和案卷级目录、75%文件级目录实现了计算机检索,利用者采用刷卡登录系统的方式,可以在线检索42个数据库的700多万条数据,在线阅览3000万页数字化档案,同时档案馆通过北京市档案信息网提供180余万页开放档案的互联网在线阅览。数字档案资源不断丰富,数字档案利用成效凸显,档案利用工作的效率极大提高,广大利用者真正享受到方便快捷的服务,切实体会到档案数字化成果带来的实惠。
工作目标和原则
馆藏档案数字化工作对北京市档案馆而言是全新的工作,也是一项长期的系统工程,局(馆)党组对给予了高度的重视和持续的关注,制定了明确的工作目标和工作原则,不断提出新要求,完善工作意见,确保平稳、有序、全面、深入、可持续地开展数字化工作创造了条件。
(一)“全面数字化”工作目标
“全面数字化”涵盖三个层面的含义。
第一,要对全部馆藏档案数字化。北京市档案馆保存着记录北京几百余年历史发展的文字、照片、音像等不同载体的档案210万卷件,“全面数字化”就是要将这些存储于多种载体上的档案信息全部异质转化为数字档案。
第二,要对每个全宗中的每卷件档案全部进行数字化。
第三,要建立起包括纸质、缩微品、照片、音视频等多种档案载体在内的全套而非单一载体的档案数字化系统。
(二)五项工作原则
1统筹规划、分步实施
以纸制档案数字化工作的发展阶段为例。
2002年数字化工作启动之初,北京市档案馆采取外包服务形式,指定公司对馆藏档案进行数字化制作、档案馆负责质量检验。经过两年的探索,初步积累了一定的实践经验。
2004年,由馆长总牵头,馆内主要业务处室参与,由信息化主管处室负责总体协调和质量检验,档案事业服务中心负责纸制档案数字化制作。
目前,采取由局(馆)统一管理数字化工作设备,以劳务派遣的方式聘用员工从事数字化制作,档案馆工作人员负责后期质量控制检验的工作模式。经过多年的实践和不断发展,已建立了一套较为完善的档案数字化管理工作机制,目前拥有工作人员50余人,各类专业设备百余台,日扫描量2万余页。
2需求引导、利用优先
为加快数字化工作,我们区分馆藏档案情况,制定了“先目录、后全文”、“先纸质、后其他载体”、“先开放、后控制”、“先历史、后现代”的数字化实施步骤,并根据实际情况进行适时调整。结合利用需求分析,对利用率高的开放档案先行数字化,如:民国社会局、警察局档案等;对尚未开放的档案,从利用需求和利用安全等方面考虑,选择性地进行数字化,如:奥运档案、房产档案等。通过实践,“需求引导、利用优先”的工作原则在实际工作中发挥重要的指导作用。
3三网并进,高效服务
北京市档案馆始终把为利用者提供高效便捷的服务放在首位,逐步建立了分别以互联网、政务网和局域网为平台的档案信息资源网络服务体系。网络服务体系面对不同服务对象,提供不同的服务内容,如面向公众、以互联网为平台,提供馆藏80余万条开放档案目录和馆藏180余万页档案数字化原文及1000张数字照片的在线查询服务;面向全市各委、办、局,以政务网为平台,提供馆藏26万行云流余条档案目录“一对一”查询服务;面向来馆查阅档案的利用者和局馆内部人员,以局域网为平台,提供馆藏全部700万条档案目录和馆藏3000万页档案数字化原文的查阅服务,最大限度地满足了各类利用需求。
4确保安全,平衡发展
档案实体安全和信息安全始终是北京市档案局(馆)各项工作的重中之重。按照陈乐人局(馆)长围绕档案实体安全、信息安全、设备设施安全、馆室环境安全,筑牢思想、机构、制度、技术、设施、网络和应急七道防线的要求,全馆不断加强信息系统安全防护能力,实施局域网、互联网、政务网物理隔离,对所有上网档案进行二次鉴定,确保档案信息的安全。平衡发展,是在大规模开展馆藏档案数字化工作的同时,也同样重视缩微复制技术的运用,把馆藏中不开放档案制作成缩微品,待其开放后可直接由缩微胶片进行数字转换,两种技术的充分融合,为档案的安全存储和有效利用提供技术保障。
5优先存量,注重源头
为了对档案进行抢救性保护,我们把数字化重点优先放在馆藏档案上面,也同样注重即将进馆档案的数字化工作。通过《北京市档案馆档案接收办法》和全市档案移交工作会议,提出对移交档案进行数字化的要求,要求移交单位开展档案数字化工作。
抓住机遇,加快建设