تتمثل إحدى الاختناقات الكلاسيكية في معالجة الاستدلال في الذكاء الاصطناعي في نقل البيانات من الذاكرة إلى المعالج. تقدم شركة Untether AI معجل Boqueria الذي يكسر هذه الديناميكية. تعمل بنيته المتوازية بشكل هائل في الذاكرة (at-memory)، أي بالضبط حيث يتم تخزين البيانات، مما يقلل من استهلاك الطاقة ويزيد من الأداء لكل واط. إنها ليست سحرًا، بل هي هندسة مدروسة جيدًا.
كيف تعمل بنية الذاكرة (at-memory) لـ Boqueria 🚀
يدمج Boqueria آلاف نوى الحوسبة مباشرة في ذاكرة SRAM، مما يلغي الحاجة إلى نقل البيانات عبر النواقل الخارجية. تنفذ كل نواة عمليات بسيطة ولكن بالتوازي، مما يسمح بمعالجة نماذج الشبكات العصبية بكفاءة عالية. من خلال تقليل زمن الوصول واستهلاك الطاقة لحركة البيانات، تحقق هذه الشريحة أداءً مستدامًا في مهام الاستدلال دون الاعتماد على ذاكرة HBM باهظة الثمن أو التبريد الشديد.
القريب الذكي الذي لا يحتاج إلى الانتقال للعمل 🏠
بينما تقيم المعجلات الأخرى سيركًا لوجستيًا لتقريب البيانات من المعالج، فإن Boqueria هو ذلك الزميل الذي يعمل من المنزل. حرفيًا، يعالج المعلومات حيث تعيش. لذا، إذا كانت وحدة معالجة الرسومات (GPU) الخاصة بك تبدو مثل مكنسة كهربائية صاخبة وساخنة، فقد حان الوقت للتفكير في التغيير. في النهاية، لإجراء الحسابات، لا داعي للسفر إلى الجانب الآخر من الشريحة.