跳至內容

Tesseract

Stars
0
Forks
0
License
APACHE-2.0
Version
v5.5.2
Update
OS

#### 產品特色

* 支持多種語言識別
* 支援多種圖像格式
* 提供多種輸出格式
* 可訓練辨識其他語言
* 兼容舊版Tesseract引擎

#### 主要功能、特點

Tesseract是一種強大的OCR引擎,可辨識超過100種語言,支援多種圖像格式如PNG、JPEG和TIFF,並提供多種輸出格式如純文本、hOCR(HTML)、PDF、TSV、ALTO和PAGE。使用者可透過命令行使用Tesseract進行文字識別,並可自訂設定以提升識別品質。Tesseract還支援使用舊版引擎(Tesseract 3)進行文字辨識,並提供訓練資料以訓練辨識其他語言。

#### 指令

“`bash
# 無常用指令(自動生成)
“`