首页 >> 知识讲坛 >> 文献设备 >> 走出困境——缩微信息与数字信息的相互转换

走出困境——缩微信息与数字信息的相互转换

来源:中国人民大学信息资源管理学院 张美芳  2009年9月23日

 

走出困境——

缩微信息与数字信息的相互转换

张美芳

中国人民大学信息资源管理学院

 

  要:缩微影像数字化和数字信息缩微化输出是模拟信息和数字信息相互转化的两种方式。针对这两种技术在实际工作中的突出问题,分析解决问题的方法和措施,介绍有关数字信息缩微化输出的国际标准和国家标准,提出缩微信息和数字信息相互转换过程中的质量要求,同时要不断加强标准化建设工作。

关键词:缩微信息;数字信息;相互转换;COMCIM

 

缩微技术是上个世纪80年代信息记录技术形式之一,在国内外得到普遍推广和应用。许多单位相继购买设备,培训人员,学习缩微专门技术。这期间,图书、档案、个人手稿、图纸、病历、报纸、发票、收据等相继被转化为缩微信息,由此而带动了缩微品材料、设备、技术研发、标准建设等方面的快速发展。而计算机技术的普遍使用,使缩微技术逐渐从普遍使用到极少使用,目前,已进入低谷期,这是现代社会许多领域遇到的一个突出问题。

缩微影像的数字化(CIM)与数字信息缩微化输出(COM),这两个概念是在计算机技术与缩微技术结合后产生的两门单独技术。CIM是将模拟信息转化为数字信息,是通过缩微胶片扫描仪、计算机以及管理软件构成的系统,把缩微胶片上的影像进行数字处理,再转换成为数字影像,存储在光盘或服务器中,可做到缩微影像数字信息的网络传递、检索利用、异地输出打印。COM是利用缩微摄影技术将数字信息转存到缩微胶片上的过程,其实质,就是将缩微影像可以长期存储的优点与数字信息方便利用的优点结合在一起,寻找一条既能长期保存又能方便利用的信息记录和存储途径。COMCIM的逆过程,其强调的功能不同CIM主要是为了信息利用而提出的实践思路;而COM则是为了应对数字信息的安全隐患而设计的实践方案,将数字信息转化为模拟信息,便于长期存储。

 

1 相互转换中的突出问题

    经过国内外较长时间的缩微技术的应用与发展,如今已经建立了大量的缩微文献资源库。在我国,为了抢救公共图书馆的大批珍贵古旧文献,1985年,国家文化部成立了全国公共图书馆文献缩微复制中心,各地图书馆也开始缩微复制技术工作,拍摄了大量各类建国前和建国后的报纸、古籍善本、地方志、族谱和期刊文献,建立了丰富的缩微信息资源库。国内许多档案馆、医院、银行、高校等都在不同程度上积累了大量的缩微文献资源。

在英国,UMIUniversity Microfilms)于1938年创立,现拥有世界上最大商业缩微全集,其55亿页的图像收录了500年的信息,分别来自于成千上万种文艺、新闻和学术作品等。当战争的阴云随时威胁着大英博物馆的知识宝库时,许多信息因具有缩微形式得以保存下来,它们是当年UMI的首个产品。早期的英文书籍、印刷本目录、博士论文、学术研究全集、指南、报纸、期刊、索引和绝版书被收集、编索引、做胶片和再版。UMI Research Collections收录了《早期英语书在线》(EEBO),并提供了成千上万份家谱及地方志、大量的历史图形图像和文学与人文学科专辑;UMI以紧凑持久的缩微形式提供独一无二的一次文献,拥有700多个原始文献专辑,它们都源于全世界的图书馆和私人藏书,以缩微胶片形式获得。在绝大多数情况下,这些珍贵的研究材料在别处是难以获得的。UMI的缩微格式连续出版物提供世界范围内最大、最全面的期刊、报纸、杂志及其他系列文献的缩微形式的资料,包括来自世界各地的21 000多种期刊及7 000多种报纸,从这些缩微胶片上,研究人员能阅读到报纸上所有的文章、广告等信息。

计算机技术的广泛应用和快速发展使缩微技术步入了严重的困境,主要表现为停止发展和萎缩。有些单位将设备闲置、变卖,曾经在缩微技术领域独当一面的专门人才转岗或下岗,生产缩微设备和原材料的厂家转换产品,开展缩微技术业务的单位越来越少。

对于国内外这样大的缩微文献资料,如何不断补充更新知识库(包括缩微信息库和数字信息库)?如何让更多的人利用它?探索新途径,扩大缩微技术的应用领域,也许是使缩微技术走出困境的尝试。缩微胶片库的建设不能因为数字信息的普及和广泛应用而停止工作。对于一些旧报纸、杂志和发脆的纸质文献等,可以借助缩微技术的开展,将信息转换到缩微胶片上,防止载体的继续恶化,导致信息无法利用。从缩微信息库转化到数字信息库是非常容易且经济实用的一项工作,从国内外开展的工作来看,要比纸张直接数字化效果更好。

由于年代久远,多数处于急待抢救的文献,其纸张也存在不同程度的老化。近代出版物,如旧报纸、旧期刊中有许多因纸张严重变质已无法继续流通,假如再对这些文献直接进行数字化处理,许多脆化的文献就会由此而损毁。实验表明,用缩微胶片扫描系统将缩微影像转换为数字影像,要比其纸质原件经平板扫描仪扫描后转换为数字信息快6倍。可见,将缩微胶片文献数字化不仅避免了对原件的损坏,还节省了数字化的人力与时间。

康奈尔大学上个世纪90年代开展的“数字信息转换到缩微胶片”项目(Digital to Microfilm Conversion Project)同样证实了数字信息输出到缩微胶片上的费用比将纸张文献拍摄到缩微胶片上的费用低、速度快。另外数字信息输出到纸张上可以解决长期存储的问题,但仍然占据大量的空间,输出到其他载体上又存在一定的风险,输出到胶片上既可以解决空间的问题,又可以解决长期存储的问题。

在数字化形式的引领下,国内许多档案馆、图书馆引进缩微胶片数字化设备(电子影像系统(Ugbrid Imaging System),它包括缩微胶片扫描仪和电子影像处理软件;有些档案馆还购买了数字信息输出到胶片上的机器,目的是解决数字信息长期存储的问题。

如何利用现有的数字资源库,如何挖掘原有的缩微信息库,如何使信息长期存储、方便利用是本文讨论的主题,也是现在缩微技术和计算机技术有机、高效结合必须面对的问题。

 

2相互转换中的相关技术

    缩微技术和纸张数字化的顺序应怎样为好呢?如果已经拥有大量缩微信息资源库,不妨先考虑由缩微胶卷实现数字化;如果拥有大量的纸张数字化信息,不妨利用COM 方法(由计算机向缩微胶卷输出)将文献内容保存到缩微胶卷上。这种做法可以加强缩微资源库和数字资源库的建设,同时最大程度地方便存储与利用。另一种做法是利用缩微与数字化合成拍摄机同步进行缩微和数字化处理。对于报纸,一般首选缩微处理,这是最常用的方法。

缩微胶卷的保存期限可达500 年,它可以安全地保护文字档案,对于已经发脆的纸张也可以进行缩微拍摄处理。数字化可以提供方便的存取手段。而缩微胶卷的使用比以纸为介质的档案更为便利。如果在缩微化的过程中考虑这方面的因素,以缩微胶卷作为数字化的中间介质将会更方便和经济。具体而言可:

1采用缩微技术解决珍贵档案、大型图纸等的存储、保存期限、法律效力、标准化等方面的问题;采用光盘存储及数据交换技术,解决其阅读、利用等诸多方面的问题。

2同时采用缩微和扫描技术,对需要永久或长期保存而且利用率高的档案,采取两者结合的方式,既制成缩微品又生成数字影像文件,达到有效保存和方便检索的目的。

3只采用扫描技术,对于利用率高、要求检索速度快且利用群体广的档案,采用扫描技术将其数字化,生成数字影像文件存储在大容量的硬盘或光盘上。这类档案由于时效性强无需长期保存,故不必采用缩微技术。

如台湾“国史馆”是台湾撰修历史的最高机构,所有文献都采用数字和缩微两种方式存储、检索,在经历了欲用数字化替代缩微的波动之后,仍然认为缩微保存比数字化存储寿命更长、更安全。

2.1缩微影像数字化

将缩微影像转换为数字图像文献的技术早已成熟,自1999年以来,OCLC的保存资源公司就已经扫描了多种格式的缩微胶片。实践证实,今天的技术已经可将所有标准胶片上的模拟信息转换为高质量的双色或灰色的数字影像。

扫描缩微胶片要比直接数字化其原件,获取的信息更完整。文献缩摄前必须进行一系列的补配、加工与整理工作。例如,建国前的旧报纸,保存至今绝大部分已残缺不全,许多善本也破损严重。缩微拍摄前,许多图书馆到全国各地图书馆或其他文献收藏单位对这类文献已经进行过补缺,以及逐页检查、整理、修补和著录等一系列前期工作。尽管能补齐的是极少数,但绝大多数文献经过补缺后,明显地提高了自身史料价值。在缩微拍摄前,一般要将文献的顺序整理一遍,有些古籍善本,在缩摄前还请了研究古籍的行家负责古籍善本著录标板的校编等。由上可见,优先将缩微胶片文献转换为数字文献,文献的完整性得到了保证。

根据缩微胶片画幅的尺寸选择相应的倍率进行扫描。根据缩微胶片扫描设备的型号和图像质量,选择自动扫描和手动扫描。当使用的缩微胶片扫描设备具有自动扫描功能的,在一盘(张)缩微胶片里影像的密度、解像力、幅面尺寸基本一致时,可选择自动扫描方式。当使用的缩微胶片扫描设备不具有自动扫描功能的,或在一盘(张)缩微胶片里影像的密度、解像力、幅面尺寸不一致时,在扫描过程中需要对对比度、曝光亮度、画幅大小进行调整,应选择手动扫描方式。

字迹清晰的影像采用黑白二值模式进行扫描;字迹清晰度差或带有插图的影像,可采用灰度模式扫描。在选择扫描线数时,应根据具体情况做具体分析。对于字迹比较清晰而且缩微原件图像大小为A4A3的,分辨率采用200dpi。对于字迹太小、不清或缩微图像尺寸大于A3的,扫描线数要适当增加,具体的增加程度以在原件尺寸下,在计算机上可以清晰的看出图像的内容为准。一般情况下扫描分辨率应不低于200dpi。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高。需要进行OCR汉字识别的图像,如对于报纸等效果较差,原始幅面较大的材料,扫描分辨率应不低于300 dpi。采用黑白二值模式扫描的图像文件,一般采用TIFF(G4)格式存储;采用灰度模式扫描的文件,一般采用JPEG格式存储;提供网上检索利用的图像文件,也可存储为CEBPDF或其他格式。存储压缩率的选择应以图像清晰、可读、完整为前提。

必须强调缩微胶卷的拍摄质量对于数字化的图像质量非常重要。对于数字化后的报纸进行全文检索有赖于高质量的OCR 处理,而它必须依靠高精度的图像。换言之,输出取决于输入,因此,缩微信息质量必须依据缩微处理的技术标准。对于原件的文字较灰或纸质发脆、纸色返黄,高对比度的缩微胶卷可以获得较好的扫描效果。文字可以与底版明显地区分开来,可以把原件上较小的斑点、污点或皱折去除,这样便于OCR 软件对数字图像进行识别。缩微比例为16 倍时,可以较好地满足质量指标要求,当缩微比例超过20时,可能就无法满足质量指标的要求。拍摄机品牌、分辨率以及缩微胶卷(第一代母片还是第二代拷贝片)的影响与OCR 识别相关。必须注意在50 年代和60 年代拍摄的老缩微胶卷可能无法进行OCR 识别,而80 年代以后根据国际标准拍摄的缩微胶卷OCR 识别的效果较好。

2.2数字信息缩微输出

康奈尔大学示范项目(Digital to Microfilm Conversion Project)由600dpi 1bit 扫描的发脆图书的影像数字化到缩微胶片上,胶片质量基本满足或超过ANSI/AIIM缩微质量标准和长期保存要求,数字信息缩微化的过程中解像力没有损失。该项目的技术咨询委员会建议:应该制定纸质文献数字化的质量标准。该项目的实施进一步说明数字信息缩微输出是数字信息长期存储的一条途径,现在的技术能够实现这一转换,并能充分保证胶片的质量。

 

3 转换过程中涉及到标准问题

缩微信息与数字信息转换过程中涉及的国际标准和国家标准相对较少,具有实际指导作用和意义的标准:有我国颁布的国家标准,《GB/T 19474.1-2004  缩微摄影技术  字母数字计算机输出缩微品质量控制 第1部分:测试幻灯片和测试数据的特征》和《GB/T 19474.2-2004  缩微摄影技术 字母数字计算机输出缩微品质量控制  2部分:方法》,这两个标准等同采用ISO 8514-1:2000ISO 8514-:20002个标准规定了数字信息输出后胶片缩率、曝光量、解像力、密度的要求,见表1。

表1 COM记录仪允许的密度极限

胶片类型

处理

密度测量方法

最小背景密度值

透明区域最大密度值

最小密度差

-明胶型

常规冲洗

复制或视觉漫射

0.75

0.150.10

加片基ª

0.60

-明胶型

全反转或直接正片

复制或视觉漫射

1.50

(优选1.80

0.20

加片基ª

1.30

干银

热法处理

复制ISO1

1.00

0.40

加片基ª

0.60

(优选0.80

a 无涂层片基的密度

    信息转换过程中涉及到的国际标准和美国标准有:

(1)ISO/DIS 11506  Document management applications Archiving of electronic data Computer output microform (COM) / Computer output laser disc (COLD)

ISO/DIS 11506   文件管理应用   档案电子数据  数字信息缩微化输出/数字信息输出到光盘(冷输出)

(2)ISO 11928-1:2000 - Micrographics -- Quality control of graphic COM recorders -- Part 1: Characteristics of the test frames

ISO 11928-1:2000  缩微摄影技术  图形COM阅读器的质量控制 第1部分  测试板的特性)

(3)ISO 11928-2:2000 - Micrographics -- Quality control of graphic COM recorders -- Part 2: Quality criteria and control

ISO 11928-1:2000  缩微摄影技术  图形COM阅读器的质量控制 第2部分  质量标准与控制)

(4)ISO 14648-1:2001 - Micrographics -- Quality control of COM recorders that generate images using a single internal display system -- Part 1: Characteristics of the software test target

ISO 14648-1:2001  缩微摄影技术  利用单独内部显示系统生成影像的COM阅读器的质量控制  1部分软件测试标板的特性)

(5)ISO 14648-2:2001 - Micrographics -- Quality control of COM recorders that generate images using a single internal display system -- Part 2: Method of use (ISO 14648-2:2001  缩微摄影技术  利用单独内部显示系统生成影像的COM阅读器的质量控制  2部分使用方法)

(6)ISO 8514-1:2000 - Micrographics. Alphanumeric computer output microforms. Quality control. Characteristics of the test slide and test data.

ISO 8514-1:2000 缩微摄影技术  字母数字计算机输出缩微品质量控制 第1部分:测试幻灯片和测试数据的特征)

    (7)ISO 8514-2:2000 - Micrographics. Alphanumeric computer output microforms. Quality control. Method.

ISO 8514-2:2000  缩微摄影技术 字母数字计算机输出缩微品质量控制  2部分:方法)

(8)ANSI/AIIM MS1-1996, Recommended Practice for Alphanumeric Computer-Output Microforms - Operational Practices for Inspection and Quality Control

(美国国家标准-1996  字母数字计算机输出缩微品推荐规范——质量检查与控制操作规范)

(9)ANSI/AIIM MS43-1998, Recommended Practice for Operational Procedures - Inspection and Quality Control of Duplicate Microforms of Documents and From COM

(美国国家标准-1998  操作过程推荐规范——文件缩微复制和计算机输出检查与质量控制)

(10)ANSI/AIIM MS62-1999, Recommended Practice for COM recording systems having an internal electronic forms generating system - Operational practices for inspection and quality control

(美国国家标准-1999  内部以电子形式生成的数字信息缩微化输出系统推荐规范——检查与质量控制操作规范)

(11)ANSI/AIIM MS40-1987 (R1999), Microfilm Computer Assisted Retrieval (CAR) Interface Commands

(美国国家标准-1987 缩微计算机辅助检索系统((CAR)代码)

以上国际标准和美国国家标准对计算机信息输出缩微胶片有一定的规范,对我们的实际工作有一定的指导,国际上已经对此进行过大量研究,我们应该及时地借鉴和应用,同时转化为国家标准。如果对此项研究从头开展,一方面浪费时间、人力、物力和财力,另一方面意义不大。而对于缩微胶片数字化这一工作,国内外正在普遍开展,这一工作规范性和指导性的国际标准或国家标准仍没有出台,因此有必要集中力量,开展此方面的研究,及时地指导实际工作。


[关闭窗口]

  发表评论
以下网友留言只代表网友个人观点,不代表中国文化办公设备制造行业协会观点,请文明留言。
姓名: (可不填写)
Email: (可不填写)
评论:
 
  行业新闻
  协会动态
  展会新闻