python进行ocr识别图片上的中文
2021/4/22 20:27:06
本文主要是介绍python进行ocr识别图片上的中文,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
sudo apt-get install tesseract-ocr sudo apt-get install python-imaging pip install pytesseract 中文库 sudo apt-get install tesseract-ocr-chi-sim
import pytesseractfrom PIL import Image im=Image.open('/home/chenyang/PycharmProjects/python_ocr/1.png')print(pytesseract.image_to_string(im,lang='chi_sim'))
如果图片有噪点
可以进行二值化处理
import pytesseractimport cv2from PIL import Image image_text=cv2.imread("/home/chenyang/PycharmProjects/python_ocr/1.png")image_text1=image_text>180image_text[image_text1]=255image_text1=image_text<130image_text[image_text1]=0im=Image.fromarray(image_text)print(pytesseract.image_to_string(im,lang='chi_sim'))
这篇关于python进行ocr识别图片上的中文的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-05-08有遇到过吗?同样的规则 Excel 中 比Python 结果大
- 2024-03-30开始python成长之路
- 2024-03-29python optparse
- 2024-03-29python map 函数
- 2024-03-20invalid format specifier python
- 2024-03-18pool.map python
- 2024-03-18threads in python
- 2024-03-14python Ai 应用开发基础训练,字符串,字典,文件
- 2024-03-13id3 algorithm python
- 2024-03-13sum array elements python