Perusahaan ini menawarkan kecepatan inferensi LLM yang cepat hingga berasap, dapat mencapai setidaknya 1500 token/detik!
Apa konsepnya? Dalam throughput penyedia model qwen3 coder dari openrouter seperti pada gambar di bawah, throughput rata-rata cerebras adalah 1650tok/s, 17 kali lipat dari posisi kedua 92tok/s.
Dengan throughput ini, dalam bidang pengkodean, beberapa ribu baris kode dapat dihasilkan dalam beberapa detik!
Keunggulan inti perusahaan ini adalah teknologi chip yang dikembangkan sendiri, gambar di bawah ini adalah perbandingan kecepatan inferensi chip mereka dengan kecepatan GPU tradisional👇
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Perusahaan ini menawarkan kecepatan inferensi LLM yang cepat hingga berasap, dapat mencapai setidaknya 1500 token/detik!
Apa konsepnya? Dalam throughput penyedia model qwen3 coder dari openrouter seperti pada gambar di bawah, throughput rata-rata cerebras adalah 1650tok/s, 17 kali lipat dari posisi kedua 92tok/s.
Dengan throughput ini, dalam bidang pengkodean, beberapa ribu baris kode dapat dihasilkan dalam beberapa detik!
Keunggulan inti perusahaan ini adalah teknologi chip yang dikembangkan sendiri, gambar di bawah ini adalah perbandingan kecepatan inferensi chip mereka dengan kecepatan GPU tradisional👇