إنفيديا تعدل طريقة تنفيذ معجلاتها لحسابات الدقة المزدوجة

Ilustración conceptual de un chip Nvidia con circuitos luminosos, mostrando cómo el software emula funciones de hardware para cálculos de doble precisión.

تُعدّل Nvidia طريقة تنفيذ معجّلاتها لحسابات الدقة المزدوجة

لقد غيّرت الشركة Nvidia تركيزها في التعامل مع عمليات النقطة العائمة بدقة 64 بت (FP64) في معالجاتها للحوسبة الفائقة. وفقًا للتقارير، توقفت الشركة عن تطوير وحدات أجهزة متخصصة لهذا الغرض في أجيالها الجديدة. وبدلاً من ذلك، تعتمد على محاكاة هذه المهام من خلال خوارزميات داخل مكتباتها CUDA. يسمح هذا الطريقة لها بمطابقة أو تجاوز الأداء النظري في سيناريوهات معينة دون استهلاك مساحة سيليكون متخصصة. 🔄

تكشف أرقام الأداء الاتجاه الجديد

تُظهر بيانات Nvidia الرسمية هذا التطور بوضوح. أحدث معجّل لديها، Rubin، يعلن عن 33 تيرا فلوبس في عمليات FP64 المتجهية بالأجهزة، وهي أرقام مشابهة لتلك في H100 منذ سنوات. ومع ذلك، عند تفعيل المحاكاة بالبرمجيات، تؤكد Nvidia أن Rubin يمكن أن يحقق حتى 200 تيرا فلوبس في حسابات FP64 المصفوفية. حتى الجيل Blackwell، مع هذه التقنية، يمكن أن يصل إلى 150 تيرا فلوبس، أكثر من الضعف مقارنة بسابقه Hopper الذي يعمل بشكل أصلي. 📊

مقارنة رئيسية للأداء:

Rubin (الأجهزة): 33 TFLOPS في FP64 المتجهي.
Rubin (البرمجيات): حتى 200 TFLOPS في FP64 المصفوفي المحاكى.
Blackwell (البرمجيات): حوالي 150 TFLOPS، متفوقًا بشكل كبير على Hopper.

في العديد من الأبحاث مع الشركاء والدراسات الداخلية، اكتشفنا أن الدقة التي نحققها عند المحاكاة هي، على الأقل، مساوية للدقة التي نحصل عليها من نوى التنسور بالأجهزة.

تدفع الدقة المُصَدَّقة التغيير

شرح دان إرنست، المدير التنفيذي في Nvidia للحوسبة الفائقة، سبب هذا التحول الاستراتيجي. أكدت التحقق الداخلي والمع شركاء أن الدقة المحققة عند محاكاة FP64 مساوية على الأقل لتلك عند التنفيذ في نوى أجهزة مخصصة. يسمح هذا الاكتشاف لـNvidia بـتحسين تصميم رقائقها لمجالات مثل الذكاء الاصطناعي، حيث تسود الدقّات الأقل (FP32، FP16)، دون إهمال احتياجات قطاع الحوسبة عالية الأداء (HPC) الذي لا يزال بحاجة إلى FP64. ⚖️

مزايا المحاكاة بالبرمجيات:

تحرير الترانزستورات والمساحة في الرقاقة للوظائف الأخرى.
السماح بتحقيق قمم أداء أعلى في أحمال عمل محددة.
الحفاظ على الدقة اللازمة للتطبيقات العلمية والهندسية.

هندسة جديدة محددة بالبرمجيات

يبدو أن، في المنافسة على قيادة الذكاء الاصطناعي، تخصيص موارد السيليكون لـالمحاكاة بدلاً من التنفيذ الأصلي أصبح النموذج الجديد لـكفاءة الهندسة المعمارية. هذا تحول حيث لا يدعم الـبرمجيات الأجهزة فحسب، بل يعيد تعريف جوهريًا ما يجب أن يكون عليه. تتلاشى الحدود بينهما لإنشاء حلول أكثر تنوعًا. 🚀