Extraer Texto de Imágenes con OCR utilizando Pytesseract

30/08/2018 - Actualizado: 22/12/2020

Introducción:

Hola amigos de Internet. Les doy la bienvenida a Mi Diario Python, el mejor blog en español para Aprender Python.

En este articulo, veremos como extraer texto de imágenes utilizando OCR (Reconocimiento Óptico de Caracteres) y Pytesaract.

Instalación de Pytesseract:

Pytesseract es una herramiento de OCR (Reconocimiento Óptico de Caracteres) para Python. Es muy fácil y sencillo de utilizar.

Podemos instalar Pytesseract utilizando PyPi: https://pypi.org/project/pytesseract/.

pip install pytesseract

También podemos hacerlo de la siguiente manera:

pip install -U git+https://github.com/madmaze/pytesseract.git

Y listo, ya podemos trabajar con Pytesseract.

Adicionalmente también deberemos utilizar la librería Pillow:

Extraer Texto de Imágenes:

Muy bien, una vez que tengamos Pytesseract a nuestra disposición, podemos utilizarlo para extraer texto de nuestras imágenes.

La imagen que utilizaremos como ejemplo la siguiente:

A continuación te mostrare un código que nos permite extraer texto de una imagen que utilizare como ejemplo:

# Importamos la libreria Pillow
from PIL import Image

# Importamos Pytesseract
import pytesseract

# Abrimos la imagen
im = Image.open("example_01.png")

# Utilizamos el método "image_to_string"
# Le pasamos como argumento la imagen abierta con Pillow
texto = pytesseract.image_to_string(im)

# Mostramos el resultado
print(texto)

Noisyimage
to test
Tesseract OCR

Excelente, como pueden ver, el resultado es muy bueno. Podemos repetir este proceso con todas la imágenes que deseen.

Probemos con otra imagen:

# Importamos la libreria Pillow
from PIL import Image

# Importamos Pytesseract
import pytesseract

# Abrimos la imagen
im = Image.open("example_02.jpg")

# Utilizamos el método "image_to_string"
# Le pasamos como argumento la imagen abierta con Pillow
texto = pytesseract.image_to_string(im)

# Mostramos el resultado
print(texto)

The quick brown fox
jumped over the 5
lazy dogs!

Perfecto, muy bien.

Si eres de los que prefieren trabajar con OpenCv en vez de Pillow, puedes simplemente utilizar OpenCv, si tener que cambiar nada más que la forma de abrir la imagen. Veamos un ejemplo:

# Importamos la libreria OpenCv
import cv2

# Importamos Pytesseract
import pytesseract

# Abrimos la imagen
im = cv2.imread("example_02.jpg")

# Utilizamos el método "image_to_string"
# Le pasamos como argumento la imagen abierta con Pillow
texto = pytesseract.image_to_string(im)

# Mostramos el resultado
print(texto)

The quick brown fox
jumped over the 5
lazy dogs!

Como pueden ver, nos da el mismo resultado.

Bueno, eso es todo. Como pueden ver es muy sencillo, no tiene muchas complicaciones.

¿Alguna duda? ¿Quieres saber como realizar un OCR? Deja tu comentario.

Mi nombre es Luis, y fue un placer compartir mis conocimientos con todos ustedes :D.

Luis Salcedo

Unknown dice:

agosto 31, 2018 a las 11:56 am

Muy bueno, gracias

Responder
1. Luis Salcedo dice:
  
  agosto 31, 2018 a las 10:45 pm
  
  Gracias Paulo por visitar el blog y dar tu opinión. Saludos :D.
  
  Responder
BGL dice:

agosto 31, 2018 a las 10:04 pm

Muy interesante y también muy didactica la manera de explicarlo. Yo no tengo un nivel alto de Python y lo comprendo con facilidad. !! Muchas gracias!!

Responder
1. Luis Salcedo dice:
  
  agosto 31, 2018 a las 10:46 pm
  
  Gracias por visitarnos 😀 Saludos
  
  Responder
Unknown dice:

septiembre 1, 2018 a las 9:27 pm

Este comentario ha sido eliminado por el autor.

Responder
Unknown dice:

septiembre 1, 2018 a las 9:43 pm

hola luis, tendras algun manual sobre phyton el cual empleas para poder entender phyton y que nos puedas compartir te agradeceria

Responder
1. Unknown dice:
  
  septiembre 2, 2018 a las 8:07 pm
  
  Buenas yo aprendí python con una blog llamado "python para impacientes"
  
  Responder
Anónimo dice:

septiembre 20, 2018 a las 5:36 pm

como usar pyteseract con imagenes con textos en español

Responder
1. Unknown dice:
  
  diciembre 14, 2018 a las 9:17 pm
  
  A la hora de cambiar de imagen a texto se le puede dar parámetro de lenguaje: text = pytesseract.image_to_string(img, lang="rus") #RUS es para ruso, habría que buscar el de español
  
  Responder
Unknown dice:

diciembre 25, 2018 a las 8:11 pm

hola, como puedo solo tener los datos de la imagen para yo, comparar letra con letra con alguna base de datos?, sin que lo haga todo casi solo la libreria??

Responder
Unknown dice:

marzo 29, 2019 a las 8:22 pm

Buena tarde, quisiera adicional a extraer el texto, que me informe en una función o algo así, la coordenada (ubicación) de una palabra específica

Responder
1. Anónimo dice:
  
  junio 24, 2020 a las 9:04 pm
  
  Podes usar alguna librería que lea el documento y te marque la posición de la palabra que buscas. Usaba una que encontraba la palabra y copiaba la línea calculo que con esa misma se podría
  
  Responder
hans dice:

abril 6, 2019 a las 9:57 am

Muchas gracias amigo , adicional para los que tengan problema al instalar tesseract, bajense el ocr, instalenlo luego pongan una linea antes del img esto :
pytesseract.pytesseract.tesseract_cmd = r'.....Tesseract-OCRtesseract.exe' o donde este ubicado su tesseract, saludos y gracias.

Responder
1. Unknown dice:
  
  abril 23, 2019 a las 4:37 am
  
  Gracias por data!
  
  Responder
Luís dice:

junio 17, 2019 a las 3:14 am

Cómo puedo capturar los valores numéricos de una imagen eh imprimir la suma de emmos

Responder
estudiante dice:

agosto 27, 2019 a las 6:56 pm

Disculpen la pregunta, ¿en donde debo de poner la imagen para que la pueda leer sin problema ?

Responder
ra dice:

octubre 12, 2019 a las 7:35 pm

como se podria hacer con la camara activada leer el texto

Responder
Sebaste dice:

marzo 12, 2020 a las 8:55 pm

Hola, para palabras en español como ñ o acentos tildes, etc? funciona?

Responder
miguel dice:

agosto 6, 2021 a las 6:56 pm

muy interesante la explicación, tengo una consulta. se podrá pasar formatos escritos.(reportes de producción), escanearlos y por medio de Python pasarlos a un Excel o otra base de datos. algo así como digitalización de archivos. para sus posterior análisis y de paso se crea un historial. Saludos.

Responder

Deja una respuesta Cancelar la respuesta