研究动态
朱琪:民国档案数字化前原数据整理编目
上传日期: 2018-04-18 作者:朱琪

  当今信息技术的飞速发展和互联网络的无限延伸,数字化、网络化、信息化已深刻影响着人们的工作和生活,社会已进入到数字时代、大数据时代,未来档案馆将朝着成为数字化档案馆的方向发展。馆藏档案数字化是档案信息化建设的重要内容,也是档案工作融入社会主流生活的客观要求和深度利用档案资源服务社会的必然选择。而如何解决好馆藏海量文献的整理编目,以便顺利实现民国档案数字化的文化保护与利用,是当前档案馆所面临的重要课题。

  整理编目概述

  民国档案是我国历史档案中重要的组成部分,在现存历史档案中以其完整性、系统性、丰富性、多样性以及存量大而著称。中国第二历史档案馆(简称“二史馆”)是集中典藏了民国时期历届中央政府及其所属机构档案最多最全的中央级国家档案馆,在海内外享有盛誉,已成为我国最大的保藏民国档案中心和民国史料研究中心。截止到目前,二史馆收藏有1354个全宗,225万卷(宗),22000万页,这是几代档案工作者历经艰辛收集积累的宝贵历史文化资源。将馆藏民国档案数字化,对于继承和保护人类宝贵的文化财富,无疑具有重要意义。

  民国档案数字化是指利用数据库技术、数据压缩技术、高速扫描技术等技术手段,将纸质的民国档案以数字形式处理,系统地组织具有有序结构的档案目录信息库和档案全文信息库的过程。在档案数字化中,健康、标准和系统的档案原数据是构建档案目录信息库的关键要素,档案原数据优劣决定了档案数字化成果的质量及其效用的发挥。而在档案数字化建设中,硬件、软件和数据三者中,档案原数据准备的时间往往大大超过硬件购置和软件研制的时间。

  档案原数据整理编目工作是档案数字化前为确保档案原数据的优良而进行的一项重要基础性工作。其内容包括数字化全宗确定、案卷标题修正、案卷内文件整序、案卷目录审核以及对破损档案、重复文件、不开放档案的标注等。这项工作是以充分尊重前人劳动成果为前提,利用原有编目基础,解决当前案卷目录中存在的历史遗留问题,重新审视案卷目录的科学性与规范性,满足信息时代档案信息深度检索的需要,为建立高质量档案目录检索库而进行的一项重要工作。

  整理编目现状

  在20世纪50年代,民国档案整理面临三大问题:一是民国档案散乱庞杂,数量众多,堆积如山;二是整理人员极度匮乏,缺少经验;三是这些档案必须尽快为国家建设和科学研究发挥作用。1956年,二史馆老一辈领导者和工作者根据当时社会的迫切需求和馆内的具体情况,提出了整理工作“两步走”的方针,以加快民国档案的整理步伐,为社会各界所用。

  第一步,进行粗整。先区分出全宗,然后按机关单位和组织系统清检档案、拟订标题、装订捆扎案卷、排列、编号、登记编目等,从而编制出可以使用的案卷目录。这个阶段的任务主要是解决档案实体从混乱状况,变为排列有序、有目可查、有助利用的问题。这个时期的案卷目录揭示档案内容与成分较为粗疏,只是为档案今后查找利用打下了一个初步基础。

  第二步,进行细整。即在原全宗档案初步整理的基础上,按照“科学化与系统化”的要求,进行细加工,解决当初案卷过于庞大、内容涉及多主题、卷内文件排列无序、未编页号。由于政治历史客观原因,二史馆目前大部分案卷,仍未按照第二步“科学化与系统化”的要求进行细加工。

  目前案卷目录这种未能够翔实反映馆藏档案内容与成分的粗疏状况,在很大程度上影响了档案的查找检索和开发利用,并严重滞后于当今信息社会对档案数据精准性和翔实性的发展要求。因此,馆藏档案数字化工程的实施,为馆藏档案按照“科学化与系统化”要求进行第二步细加工,创造了客观条件。

  整理编目工作实施
1.档案全宗的鉴选

  由于民国档案数量浩繁,机构众多,而资金、人力资源相对有限,档案数字化不可能先后不分,主次不分,一步到位。数字化全宗的鉴选,实质是对民国档案数字化宏观质量的一种控制,其目的是要重点朝着建立档案数字化优质馆藏的方向迈进。因此,馆藏档案数字化应坚持优选原则,稳妥有序推进海量档案文献的数字化。

  一是馆藏珍贵档案应优先数字化。各档案馆都有其最为珍贵的“镇馆之宝”,从保护人类历史遗产和抢救的角度出发,这些特藏应该成为数字化的首选对象。

  二是濒危、经过鉴定确认具有重要保存和使用价值的档案应优先数字化。此举有利于加快抢救与妥善保存这些反映民国时期历史进程、社会变迁等重大历史事件的档案信息。

  三是具有馆藏特色的档案应优先数字化。二史馆是集中收藏民国时期中央机关及其所属机构的档案资料中心。因此,中央一级机关独有、特有的档案资源应成为馆藏档案数字化的主体。

  四是利用率高、当前急需的并开放的档案应优先数字化。这样不仅可以发挥馆藏档案的社会效益和经济效益,而且有利于对档案原件的保护以减少原件的磨损与丢失。

  2.整理编目规则的制定与实施

  为适应数字时代案卷目录科学规范的要求,二史馆制定了档案数字化前整理编目的相关业务文件,有《民国档案数字化前整理规则》《民国案卷标题问题及处理方法》《馆藏档案卷内文件编页号实施细则》《案卷审查要求》《民国档案案卷标题修正案例解析》等业务规章与实训案例,以确保数字化前档案整理编目工作标准化和规范化。

  档案数字化前档案整理编目,就是在馆藏档案第一步整理的基础上,利用现有基础,在保持原全宗号、子号不变的情况下,以原案卷实体为基础,就卷整卷,对于大卷、厚卷、捆卷等形式的案卷,或者案卷编目出现以“人事”“经费”“组织”“业务材料”“杂卷”等类别作为标题的,应化大为小,按照科学化与系统化进行细分加工。对于已经拆分的一卷多宗,应化宗为卷,重新编列案卷号和补写案卷标题。

  对于案卷标题笼统,主题不明,或者缺少必要的要素,如事由、地名、时间或机构名称等,应按照《民国档案案卷问题及处理方法》要求,根据案卷史实情况修改补充或重新拟写客观完整的案卷条目。标题拟写应在遵循客观性、科学性以及一致性原则的前提下,科学采用标题拟写的不同方法,准确概括案卷内容与成分,提高数字化前档案原数据的精准性、翔实性和规范性,以达到建立高质量案卷目录检索库的目的。

  对于案卷内文件排列无序者,应按照《馆藏档案卷内文件编页号实施细则》,理顺文件排列顺序,编制页码,以保持文件之间有机的历史联系。同时还要对破损档案、重复档案、控制档案进行特别标注,以解决档案修复保护、消除信息冗余以及保护国家利益与个人隐私的问题。

  档案整理工作效益研究

  在实施数字化前对档案文献进行整理编目时,应坚持“三个结合”。通过“三个结合”能够最大限度取得档案数字化前整理编目的综合效益,实现“数字化战略带动档案馆基础工作更上一个水平”的预期目标。

  1.整理工作与制作优质案卷目录检索库相结合

  作为数字化前沿先锋——数字化前档案整理工作,一定要把生成高效规范优质档案目录检索库当作一项重要基础工作来做。我们要以对工作极端负责的精神,认真踏实的态度,解决好案卷目录中的历史遗留问题,保证数字化前海量数据整理编目的质量,以适应数字时代与大数据时代对档案目录数据的客观要求。这项工作的成败将直接影响今后档案数字化成果转化与利用。

  2.整理工作与档案开放鉴定相结合

  档案数字化工作的重要目的就是要使数字化的档案为社会所用。作为经过选定的数字化全宗,在前整理编目的后期阶段,还要根据最新案卷目录以及实体内在内容进行开放鉴定。二史馆已制定了历史档案控制范围,规定凡是有损党、国家、国防、外交、民族利益和声誉及个人隐私的档案材料均属控制范围。档案开放鉴定工作应在整理编目成果形成后与数字化同期开展,实现数字化成果利用的即时性。

  3.档案整理工作与抢救保护工作相结合

  民国档案形成于战争纷繁、社会动荡的年代,加上“文革”冲击,饱受了自然的、人为的损伤。随着时间的推移,很多档案纸张强度下降、发黄变脆、字迹洇化、褪色,破损严重,急需重点实施保护处理。通过数字化前档案整理工作,可以顺势对馆藏全宗各档案破损状况做到心中有数,使得档案修复保护工作有的放矢,对影响数字化扫描的破损档案即时修裱,在一定程度上保证了档案实体的安全与档案信息的完整。

  馆藏民国档案数字化工程任重而道远。俗话说,“三分技术,七分管理,十二分数据”;“进入系统的是垃圾,你从系统中得到的也将是垃圾”。因此,数字化前一定要严把案卷整理基础关和案卷编目关,以确保档案原数据的准确、翔实与规范。“在挑战中前行,在发展中提升”,让我们以实际行动做好民国档案海量文献整理编目工作,以适应大数据时代背景下的民国档案数据建设的新要求。