Mistral AI ha lanzado OCR 4, una herramienta que extrae texto de documentos escaneados y detecta la posición exacta de cada elemento, como títulos o tablas. Su precio es de 4 dólares por cada mil páginas. Para los ciudadanos europeos, esto implica que empresas pueden procesar datos sensibles sin enviarlos a servidores externos, cumpliendo así con el GDPR. Es una opción económica y segura para proteger información personal.
Cómo funciona la precisión posicional de OCR 4 🎯
OCR 4 no solo reconoce caracteres, sino que identifica la estructura del documento: dónde empieza un título, dónde termina una tabla y qué texto pertenece a cada bloque. Esto se logra mediante un modelo de visión por computadora entrenado con millones de páginas. Al procesar todo en local o en servidores europeos, se evita la transferencia de datos a terceros países. La herramienta está diseñada para integrarse en flujos de trabajo de archivado, facturación o digitalización de expedientes legales.
El fin de escanear documentos con el móvil torcido 📱
Quien haya intentado escanear un contrato con el móvil sabe que el resultado parece un origami mal plegado. Con OCR 4, las tablas salen derechas y los títulos no se mezclan con los pies de foto. Eso sí, el precio de 4 dólares por cada mil páginas sugiere que Mistral AI no confía en que tengamos 999 páginas para escanear. Pero oye, si eres de los que aún usan el fax, igual esto no es para ti.