python进行ocr识别图片上的中文

2021/4/22 20:27:06

本文主要是介绍python进行ocr识别图片上的中文,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

sudo apt-get install tesseract-ocr
 sudo apt-get install python-imaging
 pip install pytesseract
 中文库
 sudo apt-get install tesseract-ocr-chi-sim

import  pytesseractfrom PIL import Image
im=Image.open('/home/chenyang/PycharmProjects/python_ocr/1.png')print(pytesseract.image_to_string(im,lang='chi_sim'))

如果图片有噪点
可以进行二值化处理

import  pytesseractimport cv2from PIL import Image
image_text=cv2.imread("/home/chenyang/PycharmProjects/python_ocr/1.png")image_text1=image_text>180image_text[image_text1]=255image_text1=image_text<130image_text[image_text1]=0im=Image.fromarray(image_text)print(pytesseract.image_to_string(im,lang='chi_sim'))

在这里插入图片描述



这篇关于python进行ocr识别图片上的中文的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程