Skip to content

Visidata

終端機數據分析瑞士刀

軟體分類 數據分析 / 試算表工具
開發廠商 Saul Pwanson
Stars
8.9k
Forks
327
License
GNU GPL V3
Version
Update
2026-03-14
OS

產品說明

Visidata (常被簡稱為 vd) 是一款專為終端機(Terminal)打造的互動式數據多功能工具。如果說 Excel 是圖形介面的試算表霸主,那麼 Visidata 就是文字介面下的數據分析法拉利。它能夠以極快的速度載入 CSV、JSON、Excel、SQLite 甚至 HDF5 等多種格式的檔案,即便面對數百萬行的資料,操作依然流暢滑順。

對於資料科學家、後端工程師或需要頻繁檢視 Log 的維運人員來說,Visidata 提供了比 grepawkpandas 更直覺的探索方式。你不需要編寫複雜的程式碼,只需透過類似 Vim 的鍵盤快捷鍵,就能瞬間完成資料的篩選、排序、樞紐分析(Pivot Table)以及頻率統計圖表。它是一個讓你在「撰寫 Python 腳本」與「開啟笨重 Excel」之間,找到最完美平衡點的強大工具。

核心特色:

  • 極致效能:針對速度優化,開啟數 GB 的 CSV 檔僅需數秒,且記憶體佔用極低。
  • 萬用格式支援:原生支援 CSV, TSV, JSON, YAML, XLSX, HDF5, SQLite, PCAP 等數十種資料格式。
  • 探索式分析:獨創的「頻率表 (Frequency Table)」功能,按一個鍵就能統計某個欄位的數值分佈並畫出長條圖。
  • 非破壞性編輯:所有的篩選、排序與修改操作都不會直接覆寫原始檔案,確保原始數據的安全,並可隨時儲存為新檔案。

常用指令

Visidata 的操作邏輯深受 Vim 影響,強調「雙手不離鍵盤」。以下是新手最需要掌握的核心指令:

基礎操作與範例

# 範例 1:開啟檔案
# 直接在終端機輸入 vd 加上檔名即可開啟,支援多檔案同時開啟
vd data.csv

# 範例 2:從管線 (Pipe) 讀取資料
# 將其他指令的輸出結果直接傳給 Visidata 進行分析
ls -l | vd

# 範例 3:指定檔案格式
# 若副檔名不標準,可強制指定格式 (例如將 log 當作 csv 讀取)
vd -f csv access.log
# 範例 4:批次處理 (Batch Mode)
# 雖然 Visidata 是互動工具,但也支援腳本模式來自動轉換資料
# 以下指令將 xlsx 轉換為 csv
vd -b -o output.csv input.xlsx
按鍵/指令功能說明對應操作
Shift + F頻率統計建立當前欄位的頻率分佈表 (Histogram),分析資料分佈最常用的功能
[ / ]排序依據當前欄位進行「升冪」或「降冪」排序
Ctrl + H說明選單開啟內建的指令說明與快捷鍵列表 (Cheat Sheet)
Shift + I資料概況建立「描述性統計表」,顯示欄位的平均值、中位數、標準差等
" (雙引號)複製選取將目前「選取 (Selected)」的列,複製並開啟為一個新的工作表
g + /全域搜尋在所有欄位中搜尋特定的關鍵字 (Regex 支援)
Ctrl + S儲存檔案將目前的處理結果儲存為檔案 (可指定副檔名自動轉檔)
q返回/退出關閉目前的工作表 (Sheet);若在最後一層則為退出程式

進階技巧

  • 樞紐分析 (Pivot):在想要分析的欄位上按 ! 將其設為 Key,再按 Enter 即可進入樞紐分析模式。
  • 直覺篩選:移動到某個儲存格,按 | 即可篩選出「符合該儲存格內容」的所有資料;按 則為排除。
  • 圖表視覺化:在數值欄位上按 . (dot) 可以繪製簡易的散佈圖 (Scatter Plot)。

操作介面