Solución:
Si simplemente hay texto aleatorio en la imagen, utilice Amazon Rekognition. Encontrará texto en cualquier lugar.
Amazon Textract está diseñado para convertir documentos en papel en datos organizados. Probablemente no funcionará bien con una imagen aleatoria (¡aunque no lo he probado, así que no puedo estar seguro!).
Con respecto a la resolución de problemas de un extremo a otro, Textract funcionará mejor porque tiene más funciones para OCR. Si simplemente está tratando de extraer una línea o dos de texto de una imagen tomada en la naturaleza, como carteles de calles o vallas publicitarias, (es decir, no un documento o formulario), recomendaría Amazon Rekognition.
Amazon Textract es un servicio de AWS más nuevo que se creó como una solución especialmente diseñada para el problema del OCR (reconocimiento óptico de caracteres) en imágenes de documentos y PDF. Si bien Rekognition es un servicio de visión por computadora más generalizable, Textract tiene muchos más parámetros de ajuste orientados a OCR para optimizar el proceso de extracción de texto de manera precisa y efectiva.
Fuera de la caja, si todo lo que está tratando de hacer es detectar texto y los metadatos relevantes (coordenadas, ángulo, valor de confianza), el Rekognition DetectText
El método probablemente funcionará de manera similar al equivalente analyze_document
en Textract, sin embargo, Textract ofrece una estructuración semántica adicional que ayuda con la curación / formato del texto que abstrae otras formas de posprocesamiento que el desarrollador tradicionalmente necesitaría escribir por sí mismo.
Por último, al comparar los costos de los dos métodos de Detectar texto, Textract cuesta un poco más ($ 1.50 / 1k imágenes) en comparación con Rekognition ($ 1.00 / 1k imágenes).