声像档案因其形象、直观、生动、活态等特点,在社会记忆构建中具有重要作用和不可替代性。在声像档案的实际保存过程中,因其制成材料的快速老化、技术更新快、读取设备缺失、保管不善等因素,导致部分信息质量快速下降乃至消失,严重影响声像档案的利用和保存。在现有条件下,只有尽快借助数字化手段,将声像档案复制迁移至新的载体或存储系统,才能使声像档案在未来仍能被读取使用并保存下来。
“声像档案数字化研究与实践”项目组从声像档案抢救保护障碍分析及数字化抢救方法入手,从技术上解决了声像档案的长期保存问题,最大程度地消除保存隐患,并从声像档案保存设备的获取、保管状况改善、保管水平提高、制度保障等方面提出声像档案抢救性保护的策略。项目组还专门打造了声像档案管理系统,该系统在著录、元数据构建、存储格式、长期保存方式等方面突出声像档案的特点,便于信息的共享与利用。
该项目荣获2020年度国家档案局优秀科技成果二等奖。在深入研究的基础上,项目组分别制定了2项国家标准、6项标准草案及规范性手册等,填补了国家声像档案保护技术规范空白。目前,项目研究成果已在辽宁省档案馆、中国人民大学社会与人口学院和首都经济贸易大学等多家单位得到推广运用,取得不错成效。
声像档案数字化抢救的策略与方案
2011年,国家档案局发布的《各级各类档案馆收集档案范围的规定》明确指出,档案馆在收集档案时,应同时收集有助于了解档案内容、立档单位历史的资料,收集有助于管理和利用档案所必需的专用设备。在此之前,档案读取设备一直没有被列入档案收集计划,导致档案读取设备缺失。信息呈现设备的可获取性和性能是档案读取、利用及长期保存的核心要素,是保证声像档案信息能够真实、完整呈现的前提和保证。项目组通过多种调查方式掌握了声像档案读取设备的保存现状、利用情况,为制定全面的设备收集范围、收集方案奠定了基础。同时,项目组提出建设声像档案读取设备博物馆,以此来实现全国范围内大面积濒危读取设备的收集、抢救和长期保存。
声像档案数字化采集是利用计算机、录音机、录像机、声音采集卡或视频采集卡等将唱片、录音带、录像带中的模拟信号转化为计算机可识别的数字音视频信号并著录存储的过程,包括对声像档案及读取播放设备的预处理、档案数字化采集、采集质量评估3个步骤。
声像档案数字化后的档案信息因种种原因存在图像模糊、噪点、斑块、残缺等问题,虽然现阶段计算机越来越多地被应用于修复工作中,特别是在文物保护、影视特效制作、虚拟现实等方面有着广泛的应用,但是利用计算机修复技术对档案信息进行修复尚存争议。本着搁置争议的原则,项目组对声像档案数字化信息的修复问题进行了专门研究。
项目组将声像档案数字化后,再将数字档案副本加载至修复工作站,转换为可修改的声音和活动图片,通过计算机技术、人机交互技术检查音视频需要修复的区域或问题。根据不同的损伤类型,选择相应的修复算法进行修复处理。在实际工作中,对声像档案采用各种修复算法后的修复效果不甚理想,一般在此基础上还要加入人工修复的操作过程。人工修复即采用外部修复工具、软件进行修复,最后通过评估修复效果,检验修复是否合格,若合格,即将音视频文件著录、存储、入库保存,以备检索利用。
2018年1月1日,《录音录像类电子档案元数据方案》(以下简称《方案》)的发布施行解决了这一问题。《方案》设置了25个元数据描述,考虑了描述型、管理型、结构型、法律权利和技术型元数据的特征,包括档案馆代码、档案门类代码、聚合层次、唯一标识符、档号、题名、责任者、时间、主题、来源、保管期限、权限、附注、存储、原始载体、生成方式、捕获设备、信息系统描述、计算机文件名、计算机文件大小、格式信息、视频参数、音频参数、参见号、数字签名。系统的元素设计详细标识了录音、录像类电子档案的整理层级,为录音、录像类电子档案的著录、利用与统计提供基准,有利于元数据库的管理与控制。在附录中,针对不同聚合层次(宗、类、卷、件)分别提供了著录模板,使标准更具可行性和参照性。藉此标准,可以推动实现真正意义上的声像档案数字化抢救。
音视频数据所占空间容量较大,一般采用分级存储的模式,即基于局部的数据访问,将访问频率低或者作为备份的档案采用磁带库或硬磁盘作离线存储,将访问频率不高或访问量不大的数据作近线存储,将访问频率高的档案信息作在线存储,或存储至独立式声像档案系统。
声像档案数字化抢救策略与方案的应用
针对不同类型载体声像档案数字化播放设备不齐全、技术方法不同、参数设计难以确定、信息修复无法开展、数字化及存储管理系统建设无参考案例等问题,项目组通过系统研究,从数字化抢救技术、路径和方法等方面提出了系统解决策略与方案,并将方案应用于以下案例:辽宁省档案馆录音录像带档案数字化抢救、中国人民大学李景汉先生口述录音档案和首都经济贸易大学傅筑夫教授录像档案数字化抢救。通过案例应用分析验证理论方案的可行性,给全国不同区域、不同行业的声像档案数字化抢救及长期保存提供借鉴。
辽宁省档案馆数字化抢救的声像档案资源包括名人传记、政务活动、评剧名家名段、老电影、老歌曲等,其保存和利用价值巨大。辽宁省档案馆专门建设了声像档案处理室,打造了声像档案数字化平台。声像档案处理室面积约为160平方米,房间密封性好,经过防尘处理,配有中央空调、专业防磁柜、视频监控等设备设施,适合开展声像档案数字化工作。业务用房一般被划分成两个区域:一是声像档案数字化与视频编辑区;二是音视频档案资料及其他视频资料审查、观看区域(视听室)。
中国人民大学社会与人口学院李景汉先生口述录音档案因在自然条件下保存,没有使用专门的声像档案防磁设备保管,也没有在合适的温湿度范围内进行保管,其口述录音档案从录制至今未进行过转录利用,现已无法读取。在此背景下,项目组对其口述录音带进行了数字化抢救。首先,项目组对录音档案的灰尘、断裂、松散、发霉、粘连、氧化物脱落、边缘磨损等问题进行了预处理,再根据录音带型号到读取设备库里选择熊猫(PANDA)F-536型录音机进行信息采集。采集过程记录在档案采集过程质量控制单上,明确记录每个阶段是否存在失真,是否有噪音,运行速度情况、音量情况等信息。转换后的口述录音档案中夹杂了很多噪音,项目组通过非线性编辑软件快速有效地去除了录音中残留的持久性噪音,还原了声音的清晰度,并根据要求对数字化后的档案进行著录和存储。
在首都经济贸易大学傅筑夫教授录像档案数字化抢救工作中,项目组采用的是中国华录集团提供的东芝放像机,并配备了装有视频采集软件的电脑、监视器、A/V连接电缆(三头分别为白色、红色和S端子)、视频采集卡、非线性编辑卡(1394卡)、光盘刻录机等。在数字化抢救过程中,对于视频画面抖动、黑屏等问题,项目组坚持在不影响内容读取的前提下进行删除和拼接。对于色彩偏色、灰暗等问题,项目组利用视频编辑软件对其进行色彩饱和度、亮度、对比度处理,以获得较为清晰的视频图像。对于视频中的雪花点、划痕类小条纹损伤,根据斑块大小进行分类,根据类别选择区域修复或帧修复,根据视频斑块修复算法进行修复,并将数字化加工后的声像档案上传至首都经济贸易大学声像档案管理系统存储并管理。
在项目研究过程中,首先,项目组从理论层面构建了面向国家、跨行业、跨系统的读取设备利用平台及数字化抢救平台,从档案原件、档案读取设备的预处理,修复,数字化采集标准的选择,数字化质量评估,数字化后信息的修复、著录、存储等方面探索声像档案数字化抢救及长期保存的全面策略与方案。其次,提出将数字化加工后档案上传至独立式声像档案管理系统。最后,以辽宁省档案馆录音录像带档案数字化抢救、中国人民大学李景汉先生口述录音档案和首都经济贸易大学傅筑夫教授录像档案数字化抢救为案例开展了实证研究,恢复原来无法利用的声像信息,再现当时的记录。在实践层面开展的研究,一方面解决了声像档案保存利用中信息采集和修复等核心问题,另一方面完善了长效保护利用理论,为推动全国声像档案抢救工作奠定了基础。
原载于《中国档案报》2021年4月19日 总第3667期 第三版