Skip to content

Whisper.cpp

Whisper.cpp 高效語音轉文字工具

軟體分類 生產力 / 文書處理
軟體標籤
影片編輯器Nero Burning RomOpenShot影片編輯器編輯影音Microsoft Planner剪輯影片軟體
開發廠商 Georgi Gerganov
Stars
47.4k
Forks
5.3k
License
MIT
Version
v1.5.4
Update
2026-03-05
OS
webassembly
  • 徹底解放 AI 語音辨識的硬體門檻。Whisper.cpp 透過純 C/C++ 的優化實作,讓您無需昂貴的顯卡與複雜的 Python 環境,即可在本地端進行快速、精準且完全隱私的跨語言語音轉文字服務。
  • 極致效能優化: 針對 CPU 進行深度優化,支援 AVX 指令集與 Apple Silicon 的 Core ML / Metal 加速,辨識速度遠超原始 Python 版本。
  • 零相依性設計: 採用純 C/C++ 撰寫,整個執行檔輕量且獨立,無需安裝 PyTorch 或龐大的運行環境,真正做到解壓縮即用。
  • 強大的隱私保護: 所有的辨識運算皆在本地設備完成,不需將音訊上傳至雲端伺服器,確保敏感會議紀錄或個人隱私絕不外洩。
  • 支援多國語言與翻譯: 繼承了 OpenAI Whisper 的強大能力,能自動偵測語系並支援超過 90 種語言的轉錄,甚至能直接將他國語音翻譯為英文。
  • 多樣化應用場景: 提供從命令列工具、即時語音轉錄範例到 WebAssembly 版本,方便開發者將其整合至影片字幕生成、即時會議紀錄等各類應用中。

主要功能、特點

  • 介紹: Whisper.cpp 是一款高效能的自動語音辨識 (ASR) 引擎。它將 OpenAI 的大型 Transformer 模型轉化為資源佔用極低的輕量化工具。

  • 服務: 提供高精度的語音轉文字、多語系翻譯、時間軸對齊 (Timestamping) 以及語音活動偵測 (VAD) 功能,是現代數位工作者不可或缺的 AI 生產力利器。


指令