जबरन वसूली करने वाला समूह Lapsus$ ने 4 अप्रैल 2026 को Mercor के 40,000 से अधिक सहयोगियों के बायोमेट्रिक डेटा वाली चार टेराबाइट की फ़ाइल जारी की, जो एक ऐसा प्लेटफ़ॉर्म है जो कृत्रिम बुद्धिमत्ता मॉडल को प्रशिक्षित करने के लिए ठेकेदारों की भर्ती करता है। इस लीक में वॉयस रिकॉर्डिंग, दस्तावेज़ स्कैन और वेरिफिकेशन सेल्फी शामिल हैं, जिसके कारण दस दिनों में पाँच सामूहिक मुकदमे दायर किए गए हैं, क्योंकि स्थायी बायोमेट्रिक पहचानकर्ता के रूप में वोकल फिंगरप्रिंट के उपयोग के बारे में चेतावनी नहीं दी गई थी।
पंद्रह सेकंड के नमूने से आवाज़ की नकल 🎙️
तकनीकी जोखिम इस बात में है कि उच्च गुणवत्ता वाली आवाज़ क्लोनिंग के लिए एक वोकल आइडेंटिटी को दोहराने के लिए केवल पंद्रह सेकंड के साफ ऑडियो की आवश्यकता होती है। Mercor की रिकॉर्डिंग, जो इष्टतम परिस्थितियों में दो से पाँच मिनट तक चलती है, सिंथेटिक वॉयस मॉडल उत्पन्न करने के लिए पर्याप्त सामग्री प्रदान करती है। यह प्रत्येक फ़ाइल को प्रतिरूपण का एक वेक्टर बना देता है, बिना प्रभावित लोगों के अपनी वोकल फिंगरप्रिंट को रद्द करने में सक्षम हुए। पासवर्ड या भौतिक टोकन के विपरीत, वॉयस बायोमेट्रिक्स में बदलाव के तंत्र का अभाव है, जो जबरन वसूली या स्वचालित टेलीफोन धोखाधड़ी के मामले में संभावित नुकसान को बढ़ाता है।
आपकी आवाज़ अब आपकी नहीं है, यह एक प्रशिक्षण फ़ाइल है 🤖
इस मामले की सबसे दिलचस्प बात यह है कि प्रभावित लोग AI मॉडल को प्रशिक्षित करने के लिए काम कर रहे थे, और अब वे स्वयं एक अन्य प्रकार की कृत्रिम बुद्धिमत्ता के लिए अनैच्छिक डेटासेट के रूप में काम कर रहे हैं। Mercor ने उन्हें एल्गोरिदम को बेहतर बनाने के लिए स्पष्ट रूप से बोलने के लिए कहा, लेकिन यह उल्लेख करना भूल गया कि उनकी आवाज़ फिर कभी निजी नहीं रहेगी। पंद्रह सेकंड की रिकॉर्डिंग के साथ, कोई भी ओपन-सोर्स स्क्रिप्ट एक ठेकेदार की नकल कर सकती है जो ऋण मांग रहा है। कम से कम, अगर सेल्फी से उनका चेहरा चुरा लिया जाता है, तो वे धूप का चश्मा पहन सकते हैं; आवाज़ के लिए, केवल चुप्पी बचती है।