Saltar al contenido

Amazon Textract frente a Amazon Rekognition DetectText

Solución:

Si simplemente hay texto aleatorio en la imagen, utilice Amazon Rekognition. Encontrará texto en cualquier lugar.

Amazon Textract está diseñado para convertir documentos en papel en datos organizados. Probablemente no funcionará bien con una imagen aleatoria (¡aunque no lo he probado, así que no puedo estar seguro!).

Con respecto a la resolución de problemas de un extremo a otro, Textract funcionará mejor porque tiene más funciones para OCR. Si simplemente está tratando de extraer una línea o dos de texto de una imagen tomada en la naturaleza, como carteles de calles o vallas publicitarias, (es decir, no un documento o formulario), recomendaría Amazon Rekognition.

Amazon Textract es un servicio de AWS más nuevo que se creó como una solución especialmente diseñada para el problema del OCR (reconocimiento óptico de caracteres) en imágenes de documentos y PDF. Si bien Rekognition es un servicio de visión por computadora más generalizable, Textract tiene muchos más parámetros de ajuste orientados a OCR para optimizar el proceso de extracción de texto de manera precisa y efectiva.

Fuera de la caja, si todo lo que está tratando de hacer es detectar texto y los metadatos relevantes (coordenadas, ángulo, valor de confianza), el Rekognition DetectText El método probablemente funcionará de manera similar al equivalente analyze_document en Textract, sin embargo, Textract ofrece una estructuración semántica adicional que ayuda con la curación / formato del texto que abstrae otras formas de posprocesamiento que el desarrollador tradicionalmente necesitaría escribir por sí mismo.

Por último, al comparar los costos de los dos métodos de Detectar texto, Textract cuesta un poco más ($ 1.50 / 1k imágenes) en comparación con Rekognition ($ 1.00 / 1k imágenes).

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *