跳至內容

OCRmyPDF

OCRmyPDF 智慧文件識別工具

軟體分類 網路與資訊安全 (Network & Security) / 滲透測試 (Penetration Testing)
開發廠商 ocrmypdf
Stars
33.9k
Forks
2.3k
License
MPL-2.0
Version
vv17.4.1
Update
2026-06-12
OS

#### 產品特色

* 支援多種語言OCR識別
* 可調整頁面旋轉與裁剪
* 保持原始圖片分辨率
* 自動產生PDF/A格式
* 優化PDF圖片大小

#### 主要功能、特點

OCRmyPDF可將掃描PDF文件的圖片內容轉換為可搜尋的PDF檔案,並在不影響原始圖片品質的前提下,將OCR文字正確地放置在圖片下方。該工具支援多種語言OCR識別,並自動調整頁面旋轉與裁剪,以提高識別準確度。OCRmyPDF可利用Tesseract OCR引擎識別超過100種語言,並自動產生符合PDF/A格式的輸出檔案,確保檔案的可長期存儲性。此外,該工具可利用多核心並行處理,並支援Docker容器運行,使使用者可輕鬆部署與使用。

#### 指令

“`bash
# 無常用指令(自動生成)
“`