Tuesday, February 20, 2024

Adobe Scan 和 Microsoft Lens 等是很方便的传统纸质文件或图片的电子化工具

用手机来实现传统的纸质文件或图片的电子化,很多年来我用 Microsoft Lens (以下简称 ML )手机应用程序,它简单好用。昨天我又重新安装了 Adobe Scan (以下简称 AS ),发现它改进很大,比 ML 好很多。

AS 免费版本有哪些优点呢?

  1. 存成 PDF 文件的时候自动去掉无用的背景色,完全黑白化处理,最终生成的 PDF 就超级清晰。不知道彩色文件内容它是否也会这么处理,我还没测试过。
  2. 可以 cleanup 黑点、黑边缘。黑白化传统纸质文件往往会有一些黑点。另外,无论 ML 还是 AS 这些应用程序拍出来的图片都歪七歪八的,黑白化处理后十分容易出现黑色边缘。cleanup 功能就可以把黑点去掉,将边缘填色。
  3. 可以 OCR 文字识别。

这些工具虽然方便,但是比不过扫描仪。扫描仪结合各种软件工具那就更强大了。

这些工具不好的地方在哪里?

  1. 生成的 PDF 文件大小不是标准纸张,各种奇奇怪怪的大小。多页 PDF 文件每一页都可能不一样。
  2. 生成的 PDF 文件一般都超级大,一页经常 1MB 以上。AS 压缩到足够小的文件后内容质量十分差。
  3. 生成的 PDF 文件内容歪歪扭扭。
  4. OCR 功能不是那么强大。
  5. 整个过程几乎无法干预或者后处理。所以难得一见 AS 有 cleanup 或者压缩文件这样的功能。

基于以上缺陷,我很少用这些工具。能带回家处理的文件我都带回家用扫描仪和电脑软件来处理。出门在外,不得不用的时候我才用它们。

我之前详细介绍过:在扫描仪的帮助下,我用 Scantailor Advanced 来实现黑白化处理,在这个过程中还用了 Irfanview、GIMP、PDFtk、GhostscriptHugin、网上计算器等免费开源软件。OCR 识别我用基于 Linux 操作系统下的 OCRmyPDF

No comments:

Post a Comment