تقدم هذه الشركة سرعة استنتاج LLM سريعة لدرجة أنها تدخن، حيث يمكن أن تصل إلى 1500 رمز/ثانية على الأقل!
ما هو المفهوم؟ في مزود نموذج qwen3 coder الخاص بـ openrouter، فإن الإنتاجية كما هو موضح في الشكل أدناه، فإن متوسط إنتاجية cerebras هو 1650tok/s، وهو 17 مرة من المرتبة الثانية 92tok/s.
وفقًا لهذه السعة ، يمكن أن تنتج عدة آلاف من الأسطر من التعليمات البرمجية في بضع ثوانٍ في مجال الترميز!
تتمثل القوة التنافسية الأساسية لهذه الشركة في تقنية الرقائق التي طورتها بنفسها، الصورة أدناه 2 هي مقارنة بين سرعة استدلال رقائقهم وسرعة GPU التقليدية 👇
شاهد النسخة الأصلية