2025-08-11 03:22:02

Perusahaan ini menawarkan kecepatan inferensi LLM yang cepat hingga berasap, dapat mencapai setidaknya 1500 token/detik!

Apa konsepnya? Dalam throughput penyedia model qwen3 coder dari openrouter seperti pada gambar di bawah, throughput rata-rata cerebras adalah 1650tok/s, 17 kali lipat dari posisi kedua 92tok/s.

Dengan throughput ini, dalam bidang pengkodean, beberapa ribu baris kode dapat dihasilkan dalam beberapa detik!

Keunggulan inti perusahaan ini adalah teknologi chip yang dikembangkan sendiri, gambar di bawah ini adalah perbandingan kecepatan inferensi chip mereka dengan kecepatan GPU tradisional👇

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

0/400

Tidak ada komentar

Topik
#TOKEN OF LOVE IS BACK
3k Popularitas
#BTC Back To $120k
20k Popularitas
#Show My Alpha Points
84k Popularitas
#SOL Futures Reach New High
22k Popularitas
#ETH ETF Sees 12 Weeks of Inflows
8k Popularitas

Sematkan

peta situs