OCR识别常见开源库

OCR识别常见开源库做 OCR 有很多库可以使用

大家好,欢迎来到IT知识分享网。

OCR (Optical Character Recognition,光学字符识别)技术是一种将印刷体或手写文字转化为可编辑文本的技术。亦即将图像中的文字进行识别,并以文本的形式返回。做OCR有很多库可以使用。免费开源库有:Tesseract,PaddleOCR。商业付费OCR有:腾讯云OCR,阿里云OCR。下面分别介绍。

Tesseract

新建系统变量

我的电脑点击右键,属性,高级系统设置,环境变量,系统变量里面,新建一个TESSDATA_PREFIX变量名,路径就是tessdata文件夹的路径地址。如:D:\tessdata。

Python环境配置

测试代码

运行测试代码,使用Pillow读取图像

import pytesseract from PIL import Image import matplotlib.pyplot as plt srcImage = Image.open('./pic/t1.jpg') plt.imshow(srcImage) plt.show() text = pytesseract.image_to_string(srcImage, lang='eng') print(text) 

运行测试代码,使用OpenCV读取图像

import pytesseract import cv2 as cv srcImage = cv.imread('./pic/t7.jpg') grayImage = cv.cvtColor(srcImage, cv.COLOR_BGR2GRAY) thresh, binaryImage = cv.threshold(grayImage,0, 255, cv.THRESH_BINARY|cv.THRESH_OTSU) blurImage = cv.GaussianBlur(binaryImage, (5, 5),3) cv.imshow('blurImage',blurImage) text = pytesseract.image_to_string(blurImage, lang='eng') print(text) cv.waitKey(0) cv.destroyAllWindows() 

VS环境配置

Vcpkg环境配置

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/122701.html

(0)
上一篇 2025-10-14 18:10
下一篇 2025-10-14 18:15

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信