歡迎光臨
每天分享高質量文章

Python人工智慧之圖片識別,Python3一行程式碼實現圖片文字識別

我們以識別詩詞為例 
下麵是我們要識別的圖片

先看下效果圖

我們執行程式碼後識別的結果,有幾個字沒有正確識別,但是大多數字都能識別出來。

一行程式碼就能識別圖片,我們背後要做些準備工作的

  • 這裡我們需要用到兩個庫:pytesseract和PIL

  • 同時我們還需要安裝識別引擎tesseract-ocr

下麵就來講講這幾個庫的安裝,因為只有這幾個庫安裝好以後Python才能實現一行程式碼實現圖片文字識別

一,pytesseract和PIL的安裝

安裝這兩個包可以藉助pip 
– 1,命令列安裝 
pip install PIL 
pip install pytesseract 
– 2,如果你用的pycharm編輯器,就可以直接藉助pycharm實現快速安裝。 
在pycharm的Settings設定頁按照下麵步驟操作 

這樣就能成功安裝pytesseract,安裝PIL只需要在上面第三步裡搜尋PIL並點選安裝即可 這時我們安轉好了庫,執行下麵程式碼

會報下麵錯誤,錯誤原因是:沒有安裝識別引擎tesseract-ocr

二,安裝識別引擎tesseract-ocr

  • 1.下載下麵的安裝包,然後直接點選安裝即可 

http://download.csdn.net/download/qiushi_1990/9987023

解壓安裝tesseract-ocr後做如下操作,就可以支援中文識別了。因為tesseract-ocr預設不支援中文識別。 

  • 2,安裝完成tesseract-ocr後,我們還需要做一下配置 
    在C:\Users\huxiu\AppData\Local\Programs\Python\Python35\Lib\site-packages\pytesseract找到pytesseract.py開啟後做如下操作

也可以透過pycharm快速開啟pytesseract.py

至此我們所有的配置就完成了,執行下麵程式碼就可以把杜甫的登高這首圖片詩解析成文字了

作者:邱石1990

源自:http://blog.csdn.net/qiushi_1990/article/details/78041375

宣告:文章著作權歸作者所有,如有侵權,請聯絡小編刪除

贊(0)

分享創造快樂