Selon « The Information », Tencent a utilisé Anthropic's Claude Code lors de la phase post-entraînement de Hy3, bien qu'Anthropic interdise de fournir des services commerciaux aux entreprises chinoises. Hy3 est un modèle MoE de 295 milliards, Tencent a effectué une évaluation à l'aveugle avec deux modèles anonymes et a filtré les réponses en se référant à des exemples générés par Claude Code, affirmant qu'il s'agissait d'une norme de référence plutôt que d'une distillation. Anthropic a déclaré surveiller les attaques de distillation et avoir pris des mesures, sans répondre directement à cette affaire. Les entreprises chinoises accèdent à Claude principalement par l'intermédiaire ou avec des informations d'enregistrement non chinoises, et Anthropic a renforcé la vérification d'identité.

BlockBeatNews

2026-05-04 01:51:38

Création du résumé en cours

Selon le rapport de Beating Monitoring, « The Information » cite des sources proches du dossier et un mémo interne de Tencent révélant que des employés de Tencent ont utilisé Claude Code d’Anthropic lors de la phase de post-entraînement du modèle Hy3, malgré l’interdiction claire d’Anthropic de fournir des services commerciaux aux entreprises chinoises pour des raisons de sécurité nationale.

Hy3 est le modèle de langage le plus puissant de la série Mengyuan de Tencent à ce jour, avec une architecture MoE de 295 milliards de paramètres, développé sous la direction de Yao Shunyu, le premier scientifique en IA de Tencent, à la fin de l’année dernière. Lors de la phase RLHF (apprentissage par renforcement basé sur le feedback humain), Tencent a organisé ses employés pour qu’ils jouent le rôle d’évaluateurs humains, un mémo interne fournissant un guide d’installation pour Claude Code, avec une limite d’utilisation de « quelques milliers de tokens » par personne.

Les employés de Tencent ne considèrent pas cela comme de la distillation (entraîner un modèle plus faible à partir de la sortie d’un modèle plus fort). Leur méthode consiste à soumettre la même question de programmation à deux modèles anonymes, puis à effectuer une évaluation à l’aveugle ; en même temps, ils utilisent Claude Code pour générer en temps réel des exemples de comportements de haute qualité comme référence, afin d’aider à filtrer les réponses de faible qualité. Plusieurs employés de sociétés d’IA ont confirmé que l’utilisation de modèles de référence de pointe dans le post-entraînement est une pratique courante.

Un porte-parole d’Anthropic a déclaré que l’équipe de sécurité de l’entreprise « surveille activement les attaques de distillation et agit immédiatement lorsqu’elles sont détectées », mais n’a pas répondu directement à la question de l’utilisation de Claude Code par Tencent. Les moyens courants pour les entreprises et développeurs chinois d’accéder à Claude sont via des intermédiaires, des enregistrements avec des numéros de téléphone non chinois ou des cartes de crédit. Au début de ce mois, Anthropic a renforcé ses exigences d’authentification, certains utilisateurs devant fournir une pièce d’identité officielle délivrée par le gouvernement et une photo d’eux-mêmes.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
WCTCTradingKingPK
582.74K Popularité
#
USSeeksStrategicBitcoinReserve
58.78M Popularité
#
IsraelStrikesIranBTCPlunges
42.08K Popularité
#
BitcoinETFOptionLimitQuadruples
1.04M Popularité
#
#FedHoldsRateButDividesDeepen
45.65K Popularité

Épingler

Une note interne de Tencent divulguée : le dernier modèle Hy3 a utilisé Claude Code lors de la phase post-formation

Sujets populaires

WCTCTradingKingPK

USSeeksStrategicBitcoinReserve

IsraelStrikesIranBTCPlunges

BitcoinETFOptionLimitQuadruples

#FedHoldsRateButDividesDeepen

Épingler