OCR识别常见开源库_IT分享知识网

OCR识别常见开源库

大家好，欢迎来到IT知识分享网。

OCR （Optical Character Recognition，光学字符识别）技术是一种将印刷体或手写文字转化为可编辑文本的技术。亦即将图像中的文字进行识别，并以文本的形式返回。做OCR有很多库可以使用。免费开源库有：Tesseract，PaddleOCR。商业付费OCR有：腾讯云OCR，阿里云OCR。下面分别介绍。

Tesseract

新建系统变量

我的电脑点击右键，属性，高级系统设置，环境变量，系统变量里面，新建一个TESSDATA_PREFIX变量名，路径就是tessdata文件夹的路径地址。如：D:\tessdata。

Python环境配置

测试代码

运行测试代码，使用Pillow读取图像

import pytesseract from PIL import Image import matplotlib.pyplot as plt srcImage = Image.open('./pic/t1.jpg') plt.imshow(srcImage) plt.show() text = pytesseract.image_to_string(srcImage, lang='eng') print(text)

运行测试代码，使用OpenCV读取图像

import pytesseract import cv2 as cv srcImage = cv.imread('./pic/t7.jpg') grayImage = cv.cvtColor(srcImage, cv.COLOR_BGR2GRAY) thresh, binaryImage = cv.threshold(grayImage,0, 255, cv.THRESH_BINARY|cv.THRESH_OTSU) blurImage = cv.GaussianBlur(binaryImage, (5, 5),3) cv.imshow('blurImage',blurImage) text = pytesseract.image_to_string(blurImage, lang='eng') print(text) cv.waitKey(0) cv.destroyAllWindows()

VS环境配置

Vcpkg环境配置

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://haidsoft.com/122701.html