एक विकेंद्रीकृत और सामुदायिक नेटवर्क की प्रारंभिक दृष्टि एक ऐसे मॉडल की ओर विकसित हो गई है जहां उपयोगकर्ता सूक्ष्म कार्य करते हैं जो बड़े निगमों को लाभ पहुंचाते हैं। लुइस वॉन आह्न जैसे व्यक्ति, reCAPTCHA और Duolingo जैसे प्रोजेक्ट्स के साथ, इस संक्रमण में महत्वपूर्ण थे। उन्होंने रोजमर्रा की क्रियाओं को, जैसे कि यह सत्यापित करना कि हम रोबोट नहीं हैं या भाषाएं सीखना, मूल्यवान डेटा उत्पन्न करने के तंत्रों में बदल दिया। यह मुफ्त कार्य अब कृत्रिम बुद्धिमत्ता के विकास और अन्य व्यावसायिक सेवाओं को बनाए रखता है।
डेटा कैप्चर के पीछे का कोड: इंटरैक्शन से डेटासेट तक 🤖
तकनीकी रूप से, ये सिस्टम मानव-कंप्यूटर इंटरैक्शन (HCI) के चतुर डिजाइनों पर आधारित हैं जो डेटा संग्रह को छिपाते हैं। reCAPTCHA, उदाहरण के लिए, दो शब्द प्रस्तुत करता है: एक नियंत्रण शब्द जो सिस्टम को ज्ञात है और दूसरा एक किताब से स्कैन किया गया जो डिजिटलीकरण की आवश्यकता है। उपयोगकर्ता की सत्यापन दोनों को हल करता है। Duolingo अपनी पाठों को द्विदिश अनुवाद अभ्यासों के रूप में संरचित करता है, जहां प्रत्येक उत्तर भाषा मॉडलों को प्रशिक्षित करने में योगदान देता है। ये डेटा, गुमनाम और एकत्रित, OCR या स्वचालित अनुवाद एल्गोरिदम को प्रशिक्षित करने के लिए डेटासेट बनाते हैं।
दुनिया के सबसे मजेदार काम के क्षेत्र में स्वागत है (पैसे नहीं देता) 🦉
यह सोचने लायक है कि हमारा खाली समय ग्रह पर सबसे वितरित उत्पादन लाइन बन गया है। जबकि हम एक मीम डाउनलोड करने या एक टेक्स्ट बॉक्स के सामने अपनी मानवता साबित करने का मानते थे, वास्तव में हम डेटा फैक्टरी में कार्ड पंच कर रहे थे। अगली बार जब Duolingo आपको रोते हुए उल्लू से स्पेनिश अभ्यास करने की याद दिलाए, तो सोचें कि आप न केवल सीख रहे हैं, बल्कि आप उस IA मॉडल को पॉलिश कर रहे हैं जिसे बाद में कोई कंपनी किराए पर लेगी। कम से कम हमें कार्ड से पंच करने की जरूरत नहीं है।