Mistral AI ने OCR 4 लॉन्च किया है, जो स्कैन किए गए दस्तावेज़ों से टेक्स्ट निकालने और प्रत्येक तत्व, जैसे शीर्षक या तालिकाओं की सटीक स्थिति का पता लगाने का एक उपकरण है। इसकी कीमत प्रति हजार पृष्ठ 4 डॉलर है। यूरोपीय नागरिकों के लिए, इसका मतलब है कि कंपनियां संवेदनशील डेटा को बाहरी सर्वरों पर भेजे बिना संसाधित कर सकती हैं, इस प्रकार GDPR का अनुपालन कर सकती हैं। यह व्यक्तिगत जानकारी की सुरक्षा के लिए एक किफायती और सुरक्षित विकल्प है।
OCR 4 की स्थितिगत सटीकता कैसे काम करती है 🎯
OCR 4 न केवल वर्णों को पहचानता है, बल्कि दस्तावेज़ की संरचना की पहचान करता है: शीर्षक कहाँ से शुरू होता है, तालिका कहाँ समाप्त होती है, और कौन सा टेक्स्ट किस ब्लॉक से संबंधित है। यह लाखों पृष्ठों पर प्रशिक्षित कंप्यूटर विज़न मॉडल के माध्यम से प्राप्त किया जाता है। स्थानीय रूप से या यूरोपीय सर्वरों पर सब कुछ संसाधित करके, तीसरे देशों में डेटा स्थानांतरण से बचा जाता है। यह उपकरण संग्रह, बिलिंग या कानूनी फाइलों के डिजिटलीकरण के कार्यप्रवाह में एकीकृत करने के लिए डिज़ाइन किया गया है।
मोबाइल को टेढ़ा करके दस्तावेज़ स्कैन करने का अंत 📱
जिसने भी मोबाइल से अनुबंध स्कैन करने की कोशिश की है, वह जानता है कि परिणाम एक बुरी तरह से मुड़े हुए ओरिगेमी जैसा दिखता है। OCR 4 के साथ, तालिकाएं सीधी निकलती हैं और शीर्षक कैप्शन के साथ मिश्रित नहीं होते हैं। हां, प्रति हजार पृष्ठ 4 डॉलर की कीमत बताती है कि Mistral AI को भरोसा नहीं है कि हमारे पास स्कैन करने के लिए 999 पृष्ठ होंगे। लेकिन अरे, अगर आप अभी भी फैक्स का उपयोग करते हैं, तो शायद यह आपके लिए नहीं है।