產品說明
Visidata (常被簡稱為 vd) 是一款專為終端機(Terminal)打造的互動式數據多功能工具。如果說 Excel 是圖形介面的試算表霸主,那麼 Visidata 就是文字介面下的數據分析法拉利。它能夠以極快的速度載入 CSV、JSON、Excel、SQLite 甚至 HDF5 等多種格式的檔案,即便面對數百萬行的資料,操作依然流暢滑順。
對於資料科學家、後端工程師或需要頻繁檢視 Log 的維運人員來說,Visidata 提供了比 grep、awk 或 pandas 更直覺的探索方式。你不需要編寫複雜的程式碼,只需透過類似 Vim 的鍵盤快捷鍵,就能瞬間完成資料的篩選、排序、樞紐分析(Pivot Table)以及頻率統計圖表。它是一個讓你在「撰寫 Python 腳本」與「開啟笨重 Excel」之間,找到最完美平衡點的強大工具。
核心特色:
- 極致效能:針對速度優化,開啟數 GB 的 CSV 檔僅需數秒,且記憶體佔用極低。
- 萬用格式支援:原生支援 CSV, TSV, JSON, YAML, XLSX, HDF5, SQLite, PCAP 等數十種資料格式。
- 探索式分析:獨創的「頻率表 (Frequency Table)」功能,按一個鍵就能統計某個欄位的數值分佈並畫出長條圖。
- 非破壞性編輯:所有的篩選、排序與修改操作都不會直接覆寫原始檔案,確保原始數據的安全,並可隨時儲存為新檔案。
常用指令
Visidata 的操作邏輯深受 Vim 影響,強調「雙手不離鍵盤」。以下是新手最需要掌握的核心指令:
基礎操作與範例
# 範例 1:開啟檔案
# 直接在終端機輸入 vd 加上檔名即可開啟,支援多檔案同時開啟
vd data.csv
# 範例 2:從管線 (Pipe) 讀取資料
# 將其他指令的輸出結果直接傳給 Visidata 進行分析
ls -l | vd
# 範例 3:指定檔案格式
# 若副檔名不標準,可強制指定格式 (例如將 log 當作 csv 讀取)
vd -f csv access.log
# 範例 4:批次處理 (Batch Mode)
# 雖然 Visidata 是互動工具,但也支援腳本模式來自動轉換資料
# 以下指令將 xlsx 轉換為 csv
vd -b -o output.csv input.xlsx
| 按鍵/指令 | 功能說明 | 對應操作 |
|---|---|---|
| Shift + F | 頻率統計 | 建立當前欄位的頻率分佈表 (Histogram),分析資料分佈最常用的功能 |
| [ / ] | 排序 | 依據當前欄位進行「升冪」或「降冪」排序 |
| Ctrl + H | 說明選單 | 開啟內建的指令說明與快捷鍵列表 (Cheat Sheet) |
| Shift + I | 資料概況 | 建立「描述性統計表」,顯示欄位的平均值、中位數、標準差等 |
| " (雙引號) | 複製選取 | 將目前「選取 (Selected)」的列,複製並開啟為一個新的工作表 |
| g + / | 全域搜尋 | 在所有欄位中搜尋特定的關鍵字 (Regex 支援) |
| Ctrl + S | 儲存檔案 | 將目前的處理結果儲存為檔案 (可指定副檔名自動轉檔) |
| q | 返回/退出 | 關閉目前的工作表 (Sheet);若在最後一層則為退出程式 |
進階技巧
- 樞紐分析 (Pivot):在想要分析的欄位上按
!將其設為 Key,再按Enter即可進入樞紐分析模式。 - 直覺篩選:移動到某個儲存格,按
|即可篩選出「符合該儲存格內容」的所有資料;按則為排除。 - 圖表視覺化:在數值欄位上按
.(dot) 可以繪製簡易的散佈圖 (Scatter Plot)。
操作介面





