Sunday, July 18, 2021

文件扫描成黑白 PDF 文件的优化处理

在纸质文件电子化的过程中,绝大多数的文件都不需要采用彩色 PDF 保存,只需要用黑白 PDF 文件保存。

无论选择 Color、Black and White 或 Grayscale 模式,使用扫描仪直接扫描出来的 PDF 文件都不会很理想,经常有各种阴影和散布的黑点。

如何得到高质量的黑白 PDF 产品?借助几个开源软件和一些编辑技巧可以实现这个目标。

基本过程是这样的:

  1. 用 Irfanview 将文件扫描成高分辨率(600 DPI 或者 1200 DPI)的 TIFF 文件(LZW 压缩,Grayscale);
  2. 用 ScanTailor 处理 TIFF 文件,转换成黑白的 TIFF 文件;
  3. 用 Photoshop 或者 GIMP 或者 Irfanview 等编辑软件对这个黑白 TIFF 文件再修饰,并剪切成标准尺寸(用 Irfanview 可以批处理 CROP)生成最终 TIFF 文件;
  4. 将最终 TIFF 文件转换成 PDF 文件(我使用 Irfanview,并做出 cmd 批处理文件来执行);
  5. 用 PDFtk Server 批处理命令将一页一页的 PDF 文件合并起来。
  6. 用 Ghostscript 批处理命令将 PDF 文件进行压缩。当然,你也可以不做这一步。

下面是北美最常用的 Letter 尺寸的纸张在不同分辨率下的尺寸,也就是剪切后的最终 TIFF 尺寸。这个计算器很有用。

  • 300 DPI - 2550 x 3300 pixel
  • 600 DPI - 5100 x 6600 pixel
  • 1200 DPI - 10200 x 13200 pixel

如果是 Legal 纸张呢?Legal 纸张大小是 8.5" x 14",如果 DPI 是 600,那么就是 5100×8400 pixels。

  • 300 DPI - 2550 x 4200 pixel
  • 600 DPI - 5100 x 8400 pixel
  • 1200 DPI - 10200 x 16800 pixel

如果你想扫描成彩色的 PDF 文件,以上方法不适用,最好选用高质量的照片扫描仪。

 





No comments:

Post a Comment