摘 要:随着数字存储技术不断创新,形成了各类格式繁多、存储介质不一的声像档案。它们的长期安全保存成为了亟需解决的问题之一。本文以数字档案保存为中心,就所涉及的数据迁移和数据仿真两个方面比较各自的优缺点,并提出更合适地保存策略。
关键词:声像档案保存数字迁移法数字仿真法
中图分类号:G275.9文献标识码:A文章编号:1673-9795(2011)08(b)-0227-01
1 高校数字声像档案现状
高校档案是指在高校各项工作中,通过各种拍摄手段形成的照片、底片、录音录像带、磁盘、光盘等特殊载体的电子档案。随着信息技术的发展,利用信息技术对数字资源进行收集、开发、利用,使用户可以进行检索、阅读等操作,从而实现资源共享,最大限度地发挥了声像档案的价值。通过多种渠道采集而来的电子文件,文件格式种类繁多,如照片,有bmp、dib、jpg、gif、tiff等格式。电子文件的保存介质也有很多,有磁盘、硬盘、光盘等。当然,随着技术的不断发展,会有更多的文件格式和存储介质出现,原有的则逐渐被淘汰。声像档案电子文件的长期安全保存是亟需解决的一个问题。
2 数字信息长期保存的技术比较
声像数字信息保存的目的是提供利用。由于数字信息不能直接读取需依赖设备,故而要提供利用,不仅要保证信息载体的安全,还要保证内容是可识别。数据资源的保存可分为三个层次:技术层次、元数据层次、技术和组织层次。其保存技术分为:原始数据处理和保存原始数据。目前保存技术讨论比较多的是数据迁移和数据仿真。前者属于处理原始数据的技术,后者则是保存原始数据的技术。
数据迁移(Migration),是根据信息技术的发展将数字资源迁移到不同的软、硬件环境下,从而保证数字资源可以在发展的环境中被识别,以进行数字信息的长期保存。迁移技术通过改变或更新数字资源的格式,使其适应于新的环境,其目的在于确保用户使用当前软、硬件有效地识别过去的数字资源。例如,PDF1.1版本将被PDF1.4版本代替,所有采用1.1版本的数字资源需转换为新的格式。这就要进行一个数据迁移过程。数据迁移主要有三种类型:存储介质迁移、软件的向后兼容性迁移和数字资源文件格式迁移。
存储介质迁移。声像档案的数字资源基本上都记录在磁盘、底片、光盘等之上。由于外部因素的影响,质量会逐年下降,有时会出现损坏,使声像档案受损。针对存储介质的这个特点,需要定时对存储介质上的声像数字资源进行迁移。
软件的向后兼容性迁移。随着版本的更新,软件会对早期的格式提供兼容性支持。以视频播放软件为例,早期只支持VCD版,后来支持DVD,目前已有支持蓝光DVD格式的了。但是考虑到软件的服务对象是要长期保存的档案,若要采用新版本的软件,用户需要对该软件进行全方位的测试,否则可能会影响档案利用,甚至会对声像档案的安全造成影响。
数字资源文件格式迁移。格式的迁移就是将文件由一种格式转换为另一种格式,多为压缩格式。而多数的压缩时利用有损压缩的原理进行,利用人对图像或声波中的某些频率成分不敏感的特性,允许压缩过程中损失一定的信息,不断地格式转换就意味着信息的不断丢失。
数据迁移的优点:数字资源总是以通用格式被人们使用,现行的硬、软件能够毫无障碍地访问数字资源,且可以被复制。而其缺点则是:在格式转化过程中,数字资源的一些样式,甚至一些数据的大部分细节和背景情况将被过滤掉,也可能会改变格式无法保存原始数据的“全貌”,而主要是保存数据内容和内容关系;每一次转换都可能丢失一定的细节信息,多次转换导致的信息损失累积起来,会使当前数字信息内容出现严重差异,并且是不可逆的。
迁移法的操作对象是数字资源集合中的单件资源。数字资源集合庞大,转化过程需很长时间,工作量很大;如果数字资源的文件格式已作废或所用的转换工具不再有效,那么采用这种方法进行格式转换就不可行。因此,采用数据迁移策略时,必须不断地开发并运行转换程序,以免数字资源的格式过时,这样迁移耗时费力。
数据仿真(Emulation),就是用一个仿真器模仿数字信息生成时的软、硬件环境,使数字信息能够以原始状态得以重现。仿真技术能保存原始文件,并适用于所有对象。仿真器能够在新的系统平台上模拟软件在旧的系统上的运行,因此数字信息本身不需要进行格式的转换,有利于保持数据的完整性。仿真器的一个特点就是能向下兼容,但这种兼容性是受计算机软、硬件发展所局限的。由于新技术的不断涌现,要保持向下兼容变得非常困难。同时,研制向下兼容也需投入大量人力物力。如果采用仿真技术作为长期保存办法,则必须为每一种形式研制一种仿真器,从jpg图片到mpg影像文件,多种仿真器的研制将耗时耗力。特别是近年来图像处理技术的飞速发展,声像电子文件不断推陈出新,需要不断研制新的仿真器。最后就是不同声像电子文件不存在兼容关系,无法发挥仿真技术一次开发永久使用的优点。
3 结语
信息技术的发展使数字声像档案的长期保存成为一个新的、十分艰巨的和复杂的课题。对于高校的数字声像资源来说, 当前有以下几点考虑:(1)声像数字资源的利用角度。就是根据查阅资源的终端用户的要求来决定。(2)技术发展条件。技术环境的变化要求数字资源的保存格式能够被现行的软硬件技术所访问,并且能够被复制和重复使用。(3)资源本身的特点。声像数字资源数据量大,格式多样,数据关联性不大。从以上几点可以看出,在声像数字资源的长期保存方面,数据迁移有着比较好的应用前景。但数字声像档案长期保存还是一种新生事物,而且保存技术也处在高速的变化发展过程中,故而为了满足日益增长的数字声像档案管理需求,需要我们对数字档案的长期保存技术做进一步的研究和探讨。
参考文献
[1]Stewart Granger. Emulation as a Digital Preservation Strategy[Z].2009-01-27.
[2]肖英.仿真—— 数据信息长期存取理论与实践[J].档案管理,2002(3).
[3]毛峥嵘.高校声像档案数字化建设研究[J].浙江师范大学学报(自然科学版),2004(2).
[4]王清飞,刘琳.数字资源长期保存的策略探讨[J].江西图书馆学刊,2008(3).
[5]徐瑞平.数字迁移研究[J].河南图书馆学刊.2007(3).
[6]杨淑萍.关于数字资源长期保存风险管理问题的探讨[J].图书学研究,2007(7).
[7]亢明宇.数字声像档案迁移风险的研究[J].消费导刊,2008(10).
[8]邓漓虹.浅谈高校数字声像档案管理工作[J].世纪桥,2008(7).
相关热词搜索: 探讨 保存 长期 高校 档案