Saltar al contenido

¿Cuál es la fuente ideal para OCR?

Puede darse el caso de que halles algún fallo con tu código o proyecto, recuerda probar siempre en un entorno de testing antes subir el código al trabajo final.

Solución:

De acuerdo, una búsqueda en Google arroja esto, una fuente OCR específica: Fuente OCR

Parece que es un estándar adoptado en 1973.

Después de probar muchas fuentes diferentes y motores OCR Tiendo a obtener los mejores resultados usando Consolas. Es un monoespaciado tipo de letra como OCR-A, pero más fácil de leer para humanos. Consolas está incluido en varios productos de Microsoft.

También hay un fuente abierta fuente Inconsolata, que es influenciado por Consolas. Inconsolata es un buen reemplazo para Consolas, especialmente considerando los detalles de la licencia.

En mis pruebas, los números y espacios en la fuente Calibri no siempre se reconocieron correctamente. OCR-A dio muchos errores de lectura. No probé MIRC, ya que no es fácil de leer para la mayoría de los humanos.

Nota: tesseract requiere muchas pruebas y ajustes antes de ser confiable. En nuestro caso, cambiamos a un motor de OCR con licencia comercial (ABBYY), especialmente porque la confiabilidad era muy importante y necesitábamos admitir varios idiomas (europeos).

Actualizar: 2017 31 de enero – Cambiado ‘basado en consolas‘ para ‘influenciado por Consolas‘ debido a posibles problemas de derechos de autor.

Encuentro que Calibri funciona mejor para mí. Usamos el software OCR diariamente en un sistema automatizado y después de probar docenas de fuentes (incluidas algunas específicas de OCR), Calibri es consistentemente la mejor.

Buena suerte.

Al final de la web puedes encontrar los informes de otros desarrolladores, tú todavía tienes el poder dejar el tuyo si te gusta.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *