Mistral AI lançou o OCR 4, uma ferramenta que extrai texto de documentos digitalizados e detecta a posição exata de cada elemento, como títulos ou tabelas. Seu preço é de 4 dólares por mil páginas. Para os cidadãos europeus, isso significa que empresas podem processar dados sensíveis sem enviá-los a servidores externos, cumprindo assim o GDPR. É uma opção econômica e segura para proteger informações pessoais.
Como funciona a precisão posicional do OCR 4 🎯
O OCR 4 não apenas reconhece caracteres, mas identifica a estrutura do documento: onde começa um título, onde termina uma tabela e qual texto pertence a cada bloco. Isso é alcançado por meio de um modelo de visão computacional treinado com milhões de páginas. Ao processar tudo localmente ou em servidores europeus, evita-se a transferência de dados para países terceiros. A ferramenta é projetada para ser integrada em fluxos de trabalho de arquivamento, faturamento ou digitalização de processos legais.
O fim de digitalizar documentos com o celular torto 📱
Quem já tentou digitalizar um contrato com o celular sabe que o resultado parece um origami mal dobrado. Com o OCR 4, as tabelas saem retas e os títulos não se misturam com as legendas das fotos. É verdade que o preço de 4 dólares por mil páginas sugere que a Mistral AI não confia que tenhamos 999 páginas para digitalizar. Mas, olha, se você é do tipo que ainda usa fax, talvez isso não seja para você.