关于历史报纸数字化报纸扫描细节及注意事项

来源: 乐山全新媒体公司

广告:

一、扫描方式

(1)根据报纸幅面的大小(四开、对开等)选择相应规格的扫描仪或专业扫描仪进行扫描。为提升扫描效率,对开报纸采用超宽幅扫描仪进行扫描,可同时对4个版的对开报或者8个版的四开报进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。

(2)扫描时应根据报纸的材质选择相应的扫描设备,保证报纸不受损。纸张状况较差,以及过薄、过软或超厚的报纸,应采用平板扫描方式,纸张状况好的报纸可采用高速扫描方式以提高工作效率。对需要进入宽幅扫描机的时候进行覆膜保护后再扫描。

(3)扫描时保证放纸端正、不压边、不漏扫、错扫、严格确保图像质量。

扫描色彩模式

(1)扫描色彩模式一般有黑白二值、灰度、彩色等。通常采用黑白二值,以扫描后的图像清晰、完整,报纸内容信息与报纸原件一致为准。

(2)版面为黑白两色,并且字迹清晰、不带插图的报纸。可采用黑白二值模式进行扫描。

(3)版面为黑白两色,但字迹清晰度差或带有插图的报纸,以及版面为多色文字的报纸,可以采用灰度模式扫描。

(4)版面中有红头或插有黑白照片、彩色照片、彩色插图的报纸,可视需要采用彩色模式进行扫描。对于年代久远、字迹模糊、纸张颜色和文本反差不大、斑迹较大等情况的报纸采24位彩色方式扫描。

二、扫描分辨率

(1)扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。

(2)对进行OCR汉字识别的报纸,扫描分辨率建采用大于或等于250dpi,本次项目均采用300dpi扫描。

三、扫描登记

填写历史报纸数字化转换过程交接登记表单,登记扫描的发行时间、发布期号,核对每份报纸的实际扫描版数与报纸整理时填写的报纸版数是否一致,不一致时应注明具体原因和处理方法。

四、图像处理

图像数据质量检查

(1)由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。

(2)漏扫时,及时补扫并正确插入图像。对报纸中漏编的版面进行合版处理,确保扫描好的影像版数与原版数一致。

(3)扫描图像的排列顺序与报纸原件不一致时,及时进行调整。最终扫描文件以日期为文件夹编号进行排序存储。

五、纠偏

对图像偏斜度、清晰度、失真度等进行检查。发现不符合图像质量要求时,应重新进行图像的处理。每版影像左右端正度控制在2度以内,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像进行旋转还原,以符合阅读习惯。不出现图像的一部分出现倾斜或扭曲而影响阅读的现象。厚的报纸装订线较近边角的报纸内容会产生扭曲现象,需保证版面能看清楚。

六、去污

在保证版面内容完整的前提下,影像版无扫描过程中带来的污斑,无黑边,外观达到清晰、平直、干净。对图像版面中出现的影响图像质量的杂质如黑点、黑线、黑框、黑边等进行去污处理。处理过程中遵循在不影响可读性和可理解性的前提下展现报纸原貌的原则,由于报纸本身因陈旧、破损或不洁等造成版面上有污点的,如果在版面视图下无法看清,或该污点嵌在文本行中无法清除,可不予清除。纸张太薄或字体颜色过浓,扫描时倒映反面文字,文字上的污点无法去污时,保证正文文字可以看清楚。

七、裁边处理

采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。

图像处理后保证图像信息与原报纸内容完全一致,不删除版面任何有用信息,包括正文内容、版眉、版脚等。扫描的版面内容基本居中显示,不出现明显偏左或偏右现象。不准出现版面内容残缺或将其它版面信息扫入本版的现象。

八、图像存储

存储格式

一般采用PDF格式存储,以文件为单位生成PDF文件,一个版面对应一个PDF文件,一份报纸对应一个或多个PDF文件。一个期号、版面分别对应一个文件夹,一个项目文件包括一个或多个文件夹,一个文件夹包括一个或多个版面文件夹,一个期号文件夹包括一个或多个PDF文件。

九、扫描件的命名

历史报纸目录数据库中的每一份文件,都有一个与之相对应的唯一编号,以该报纸为这份文件扫描后的图像文件命名。以年月日和期号对文件夹进行命名,以日期号和版面号对PDF文件进行命名,如20210529-01,为2021年5月29日第一版。

十、装订

扫描工作完成后,拆除过装订物的报纸应按档案保管的要求重新装订。恢复装订时,应注意保持档案的排列顺序不变,做到安全、准确、无遗漏。

装订不能损害报纸原件。装订时应按原有顺序装订,报纸不掉版、左边和底边整齐,保持拆卷前的原貌;装订后由甲方负责检查,不符合要求的退回重新装订,要求一次性完成装订。并认真做好报纸期码、版数的登记。

广告:

相关内容

编辑:Admin 时间:2024/1/26 13:46:37 阅览:85   返回    
历史报纸数字化
扫描关注53BK报刊官网
扫描关注阅速公司微信