Skip to content

Paperwork

個人紙本文件數位化管家

軟體分類 生產力 / 文書處理
軟體標籤
開發廠商 Jerome Flesch / OpenPaperwork
Stars
0
Forks
0
License
GNU GPL V3
Version
v2.2.5
Update
OS

產品說明

Paperwork 是一款主打「簡單、直覺」的開源個人文件管理工具。它的核心理念是將你的掃描器與硬碟整合成一個強大的可搜尋檔案庫。它不只是儲存檔案,而是透過自動化的流程,將紙本發票、合約與信件轉化為數位化資產。

與其他需要安裝 Docker 或資料庫的專業級 DMS 系統不同,Paperwork 是一個純粹的桌面應用程式。你只需要連接掃描器,按下按鈕,它就會自動執行 OCR(光學字元辨識),讓你未來只需輸入關鍵字,就能在幾秒內從數千張掃描檔中找到三年前的家電保固卡。

核心特色:

  • 一鍵掃描與導入:支援大多數主流掃描器,並提供 PDF 批次導入功能。
  • 自動 OCR 索引:內建 Tesseract OCR 引擎,上傳文件的瞬間即完成全文索引。
  • 標籤與智慧建議:支援使用標籤分類,並能學習你的習慣,自動為相似的文件建議標籤。
  • 開放格式存儲:檔案以標準的 JPEG/PDF 搭配 hOCR 格式儲存在資料夾中,絕不鎖死資料,即使不使用 Paperwork 也能讀取。
  • 快速全文檢索:類似 Google 搜尋的體驗,輸入關鍵字即刻列出所有相關的文件縮圖。

常用指令

雖然 Paperwork 是以 GUI 操作為主,但對於進階用戶,它也提供了後端指令工具 (paperwork-shell) 來進行批次處理。

基礎操作

# 啟動圖形介面
paperwork

# 透過 shell 指令搜尋包含 "稅單" 字樣的文件 (需安裝 backend 包)
paperwork-shell search "稅單"

# 強制重新掃描現有的工作目錄以更新索引
paperwork-shell rescan

# 匯入特定目錄下的所有 PDF 檔案
paperwork-shell import /home/user/scans/
功能模組說明技術細節
GUI (Main)主要操作視窗基於 GTK 開發,提供流暢的預覽與搜尋體驗
OCR Engine文字辨識核心使用 Tesseract 進行多國語言(含中文)辨識
Search Index搜尋引擎採用 Whoosh 輕量級索引庫,無須額外資料庫
Ironscanner掃描驅動專案開發的硬體驅動層,確保掃描器相容性

進階技巧

  • 雲端同步備份:由於 Paperwork 將所有資料存放在單一目錄,你可以直接將該目錄設為 Nextcloud、Dropbox 或 Syncthing 的同步路徑,實現跨裝置查看文件。

  • 標籤自動化:在設定中開啟「自動標籤建議」,系統會根據文件內容的關鍵字,自動判定該文件屬於「發票」或「合約」。

  • PDF 選取與匯出:你可以選取多張掃描的頁面,點選「匯出」直接合併成一份多頁的 PDF,方便透過 Email 寄送。


操作介面