Extraer Texto de Imágenes con OCR utilizando Pytesseract
Introducción:
Instalación de Pytesseract:
pip install pytesseract
pip install -U git+https://github.com/madmaze/pytesseract.git
Extraer Texto de Imágenes:
# Importamos la libreria Pillow from PIL import Image # Importamos Pytesseract import pytesseract # Abrimos la imagen im = Image.open("example_01.png") # Utilizamos el método "image_to_string" # Le pasamos como argumento la imagen abierta con Pillow texto = pytesseract.image_to_string(im) # Mostramos el resultado print(texto)
Noisyimage to test Tesseract OCR
# Importamos la libreria Pillow from PIL import Image # Importamos Pytesseract import pytesseract # Abrimos la imagen im = Image.open("example_02.jpg") # Utilizamos el método "image_to_string" # Le pasamos como argumento la imagen abierta con Pillow texto = pytesseract.image_to_string(im) # Mostramos el resultado print(texto)
The quick brown fox jumped over the 5 lazy dogs!
# Importamos la libreria OpenCv import cv2 # Importamos Pytesseract import pytesseract # Abrimos la imagen im = cv2.imread("example_02.jpg") # Utilizamos el método "image_to_string" # Le pasamos como argumento la imagen abierta con Pillow texto = pytesseract.image_to_string(im) # Mostramos el resultado print(texto)
The quick brown fox jumped over the 5 lazy dogs!
-
-
Gracias Paulo por visitar el blog y dar tu opinión. Saludos :D.
-
-
Muy interesante y también muy didactica la manera de explicarlo. Yo no tengo un nivel alto de Python y lo comprendo con facilidad. !! Muchas gracias!!
-
Gracias por visitarnos 😀 Saludos
-
-
Este comentario ha sido eliminado por el autor.
-
hola luis, tendras algun manual sobre phyton el cual empleas para poder entender phyton y que nos puedas compartir te agradeceria
-
Buenas yo aprendí python con una blog llamado "python para impacientes"
-
-
como usar pyteseract con imagenes con textos en español
-
A la hora de cambiar de imagen a texto se le puede dar parámetro de lenguaje: text = pytesseract.image_to_string(img, lang="rus") #RUS es para ruso, habría que buscar el de español
-
-
hola, como puedo solo tener los datos de la imagen para yo, comparar letra con letra con alguna base de datos?, sin que lo haga todo casi solo la libreria??
-
Buena tarde, quisiera adicional a extraer el texto, que me informe en una función o algo así, la coordenada (ubicación) de una palabra específica
-
Podes usar alguna librería que lea el documento y te marque la posición de la palabra que buscas. Usaba una que encontraba la palabra y copiaba la línea calculo que con esa misma se podría
-
-
Muchas gracias amigo , adicional para los que tengan problema al instalar tesseract, bajense el ocr, instalenlo luego pongan una linea antes del img esto :
pytesseract.pytesseract.tesseract_cmd = r'.....Tesseract-OCRtesseract.exe' o donde este ubicado su tesseract, saludos y gracias.-
Gracias por data!
-
-
Cómo puedo capturar los valores numéricos de una imagen eh imprimir la suma de emmos
-
Disculpen la pregunta, ¿en donde debo de poner la imagen para que la pueda leer sin problema ?
-
como se podria hacer con la camara activada leer el texto
-
Hola, para palabras en español como ñ o acentos tildes, etc? funciona?
-
muy interesante la explicación, tengo una consulta. se podrá pasar formatos escritos.(reportes de producción), escanearlos y por medio de Python pasarlos a un Excel o otra base de datos. algo así como digitalización de archivos. para sus posterior análisis y de paso se crea un historial. Saludos.
Deja una respuesta
Muy bueno, gracias