Qwen3-Next-80B-A3B est sorti



80 milliards de paramètres, mais seulement 3 milliards activés par jeton → 10 fois moins cher pour l'entraînement, 10 fois plus rapide pour l'inférence que Qwen
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 5
  • Reposter
  • Partager
Commentaire
0/400
MoonMathMagicvip
· 09-12 01:48
Un modèle aussi grand peut-il vraiment tenir le coup ?
Voir l'originalRépondre0
StakeHouseDirectorvip
· 09-12 01:47
Réduction des paramètres ? Recul technique
Voir l'originalRépondre0
LiquidityHuntervip
· 09-12 01:46
Bien joué, rapide et économique, bull.
Voir l'originalRépondre0
AllInAlicevip
· 09-12 01:45
L'optimisation est si évidente que j'ai envie d'investir de l'argent.
Voir l'originalRépondre0
MemeKingNFTvip
· 09-12 01:33
Les grands modèles commencent aussi à être des pigeons avec le Halving.
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)