Perusahaan ini menawarkan kecepatan inferensi LLM yang cepat hingga berasap, dapat mencapai setidaknya 1500 token/detik!



Apa konsepnya? Dalam throughput penyedia model qwen3 coder dari openrouter seperti pada gambar di bawah, throughput rata-rata cerebras adalah 1650tok/s, 17 kali lipat dari posisi kedua 92tok/s.

Dengan throughput ini, dalam bidang pengkodean, beberapa ribu baris kode dapat dihasilkan dalam beberapa detik!

Keunggulan inti perusahaan ini adalah teknologi chip yang dikembangkan sendiri, gambar di bawah ini adalah perbandingan kecepatan inferensi chip mereka dengan kecepatan GPU tradisional👇
Lihat Asli
post-image
post-image
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)