ArchiveBox
ArchiveBox 個人網頁存檔系統
軟體分類 其他 / 網頁存檔
軟體標籤
1101648GPL1647程式設計
開發廠商 Nick Sweeting
抵禦遺忘的數位防線:內容會消失,但您的備份不會
- 多維度完整封存: 不僅僅是儲存連結,它會同時生成網頁的靜態 HTML、PDF、長截圖、單一檔案 (SingleFile) 以及影音媒體(透過 yt-dlp),確保即使原始網站倒閉,您依然能讀取完整內容。
- 極強的輸入相容性: 支援從瀏覽器書籤、Pocket、Instapaper、RSS 訂閱源甚至是簡單的文本檔案中大量匯入連結,並自動排程進行背景封存。
- 數據主權與隱私: 所有資料完全儲存在您的本地硬碟中,不依賴任何第三方雲端服務,且支援全文檢索與標籤管理,讓封存的資料隨時可查、隨時可用。
主要功能、特點
介紹: ArchiveBox 是一個基於 Python 撰寫的自動化封存框架。它整合了多種開源工具(如 Chromium、SingleFile、Wget),旨在為網際網路建立一個可私有的、長期的數位紀錄副本。
特色服務:
- 自動化排程任務: 透過 Cron 任務,您可以讓系統每天自動爬取特定的新聞網站或個人部落格,實現無感的內容同步與封存。
- 靜態導出功能: 封存後的資料夾結構清晰,您可以直接透過任何網頁瀏覽器打開存檔,無需啟動伺服器後端。
- 整合 Wayback Machine: 支援在本地封存的同時,自動將連結提交至 Internet Archive (Wayback Machine),為人類文明的數位保存貢獻一份力。
- 強大的全文檢索: 2026 年版本強化了 OCR 辨識與 PDF 內容檢索,讓您即便在數萬份存檔中,也能透過關鍵字精準定位到目標資訊。
快速部署範例 (Docker Compose)
使用 Docker 快速建立您的私有存檔庫:
# 建立資料夾並進入
mkdir my-archives && cd my-archives
# 使用官方指令初始化環境並啟動
docker run -v $(pwd):/data -it archivebox/archivebox init
docker run -v $(pwd):/data -p 8000:8000 archivebox/archivebox
訪問 Web 介面:http://localhost:8000
產品說明
ArchiveBox 是數位時代的「圖書館管理員」。它解決了現代網際網路最令人頭痛的「內容易逝性」問題。不同於簡單的書籤工具,ArchiveBox 追求的是「內容的絕對保存」。它透過冗餘的儲存策略(同時存為多種格式),對抗技術迭代帶來的讀取障礙。對於需要追蹤產業動態的專業人士,或是希望永久保留珍貴網路回憶的用戶來說,ArchiveBox 提供了一個近乎軍事等級的數據存檔框架。它讓您在面對「此網頁已移除」或「404 Not Found」時,依然能氣定神閒地從本地庫中喚回那份珍貴的數位記憶。

