80B parametre, ancak her token için yalnızca 3B aktif → Qwen'den 10 kat daha ucuz eğitim, 10 kat daha hızlı çıkarım
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
7 Likes
Reward
7
5
Repost
Share
Comment
0/400
MoonMathMagic
· 09-12 01:48
Bu kadar büyük bir model performansı gerçekten dayanabilir mi?
View OriginalReply0
StakeHouseDirector
· 09-12 01:47
Parametreler küçülmesi mi? Teknik gerileme mi?
View OriginalReply0
LiquidityHunter
· 09-12 01:46
Aman tanrım, hem hızlı hem de tasarruflu, boğa gibi.
View OriginalReply0
AllInAlice
· 09-12 01:45
Bu kadar belirgin bir optimizasyon gördüm ki, yatırım yapmayı düşünüyorum.
Qwen3-Next-80B-A3B piyasaya çıktı
80B parametre, ancak her token için yalnızca 3B aktif → Qwen'den 10 kat daha ucuz eğitim, 10 kat daha hızlı çıkarım