大家都知道如果文字出現在圖片上,就無法直接複製或編輯文字內容,必須透過 OCR 光學字元辨識技術進行掃描,再把結果轉為純文字格式輸出,以前介紹過 Project Naptha 擴充功能讓圖片裡的文字可以直接被複製、選取,後來也有不少支援中文的免費 OCR 工具像是 EasyScreenOCR 和 NewOCR、Free Online OCR 等等,而現在手機相機鏡頭也內建 OCR 效果,直接拍攝後辨識取得文字內容,非常方便。
本文要推薦的「PearOCR」是一個相當強大的免費 OCR 文字辨識工具,這項服務完全免費,而且沒有任何使用次數限制,支援繁體中文、簡體中文和英文內容,最大特色是 PearOCR 可在離線狀態下完成所有運算,不需要用到任何的第三方服務 API,也無需將圖片上傳,這也確保使用者資料不會在過程中洩漏或有隱私安全疑慮。
PearOCR 使用自行開發的輕量化識別引擎,透過深度學習訓練得到的模型擁有非常強大的文字識別能力,整個識別過程都在網頁中完成,只要選擇本機圖片或是直接讀取剪貼簿(在複製圖片的情況下)就能進行文字辨識,將圖片出現的中英文內容轉換為純文字或 PDF 格式。
前面有提到 PearOCR 可以在離線狀態使用,本身支援 PWA 標準(Progressive Web App,漸進式網頁應用程式),只要之前打開過網站,即使沒有連線亦可正常使用文字辨識功能,或以應用方式安裝到桌面使用。
PearOCR 文字識別
https://pearocr.com/
使用教學
STEP 1
開啟 PearOCR 文字辨識工具,從下方的「識別語言」選擇要使用的語言,可以切換為繁體中文、簡體中文或英文三種。
STEP 2
接著直接把要辨識的圖片拖曳到 PearOCR 網站,或是從下方選擇「本地圖片」或「讀剪貼板」兩項功能,前者是選擇要上傳辨識的圖片檔案,如果圖片已經複製到剪貼簿,可以使用後者直接讓網頁讀取剪貼簿內容(會跳出提示訊息需要給網站部分權限)。
STEP 3
瀏覽器會開始掃描、識別使用者上傳的圖片文字,耗費時間不會太久,速度相當快。
OCR 識別完成後偵測到的文字部分就會顯示於右側,右側純文字可以直接複製使用。
STEP 4
點選右側下方選項「純文字方式顯示」會將掃描後的文字部分顯示為純文字格式,當然有可能因為文字大小、字型或顏色等等原因而造成辨識錯誤或誤植為其他文字,取用後還是需要手動校正一次以避免有錯字產生。
除此之外,下方的選項還有一個「以表格方式顯示」也很有趣,會顯示在圖片上識別出的本文和置信度,也方便取出某段文字,而這個數值可以透過右下角「設定」選項進行調整。
STEP 5
點選右下角的 PearOCR 設定功能,可以設定「置信度閥值」或是文字背景色、文字顏色等參數,設定後保存、點選「重新識別所有圖片」有助於得出更正確的結果,如果掃描出來的結果差異非常多可以試著調整這些參數再重試看看。
STEP 6
PearOCR 有個很有用的功能就是右下角的「在文本底下顯示圖片」,可以在辨識結果下方重疊原有圖片,讓使用者在取用文字內容時馬上知道在那個位置。
除了直接複製 OCR 識別出來的純文字內容,也能點選「導出所有圖像到 PDF」,將識別的文字轉為 PDF 格式,預設情況下會將辨識的文字內容和圖片一起匯出,而且可以讓原圖附在下一頁,方便讓瀏覽者檢視對照,直接複製純文字。
值得一試的三個理由:
- PearOCR 是免費文字識別工具,提供沒有次數限制的文字辨識功能
- 支援繁體中文、簡體中文和英文三種語言
- 可在離線狀態下完成運算,不需使用第三方 API 或上傳圖片