2025-09-12 01:20:31

Qwen3-Next-80B-A3B est sorti

80 milliards de paramètres, mais seulement 3 milliards activés par jeton → 10 fois moins cher pour l'entraînement, 10 fois plus rapide pour l'inférence que Qwen

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

7 J'aime

Récompense
7
5
Reposter
Partager

Commentaire

0/400

MoonMathMagic

· 09-12 01:48

Un modèle aussi grand peut-il vraiment tenir le coup ?

Voir l'originalRépondre0

StakeHouseDirector

· 09-12 01:47

Réduction des paramètres ? Recul technique

Voir l'originalRépondre0

LiquidityHunter

· 09-12 01:46

Bien joué, rapide et économique, bull.

Voir l'originalRépondre0

AllInAlice

· 09-12 01:45

L'optimisation est si évidente que j'ai envie d'investir de l'argent.

Voir l'originalRépondre0

MemeKingNFT

· 09-12 01:33

Les grands modèles commencent aussi à être des pigeons avec le Halving.

Voir l'originalRépondre0

Sujets populairesAfficher plus
#My Pick In RWA
13k Popularité
#Crypto Market Rebound
268k Popularité
#Double Rewards With GUSD
43k Popularité
#SOL Price Prediction
37k Popularité
#Gate Alpha New Listings
52k Popularité

Épingler