Mistral AI 已推出 OCR 4,这是一款可从扫描文档中提取文本并精确定位每个元素(如标题或表格)的工具。其价格为每千页 4 美元。对于欧洲公民而言,这意味着企业可以在不将敏感数据发送到外部服务器的情况下处理这些数据,从而符合 GDPR 要求。这是一种经济且安全的选择,可保护个人信息。
OCR 4 的位置精度如何工作 🎯
OCR 4 不仅能识别字符,还能识别文档结构:标题从哪里开始,表格在哪里结束,以及哪些文本属于哪个区块。这是通过一个经过数百万页训练的计算机视觉模型实现的。在本地或欧洲服务器上处理所有数据时,可以避免将数据传输到第三国。该工具旨在集成到归档、发票或法律文件数字化的工作流程中。
用歪斜的手机扫描文档的终结 📱
任何尝试用手机扫描合同的人都知道,结果就像一张折叠不好的折纸。使用 OCR 4,表格会保持端正,标题不会与图注混淆。当然,每千页 4 美元的价格表明 Mistral AI 并不相信我们有 999 页需要扫描。但嘿,如果你还在用传真机,那这个可能不适合你。