Memorando interno da Tencent divulgado: o modelo mais recente Hy3 usou Claude Code na fase pós-treinamento

robot
Geração do resumo em andamento

De acordo com o monitoramento Beating, o “The Information” citou fontes familiarizadas e um memorando interno da Tencent revelando que funcionários da Tencent usaram o Claude Code da Anthropic na fase de pós-treinamento do desenvolvimento do modelo Hy3, apesar de a Anthropic proibir explicitamente o fornecimento de serviços comerciais a empresas chinesas sob a justificativa de segurança nacional.

Hy3 é o maior modelo de linguagem da série Mengyuan da Tencent até agora, com arquitetura MoE de 295 bilhões de parâmetros, liderado pelo principal cientista de IA da Tencent, Yao Shunyu, no final do ano passado. Na fase de RLHF (aprendizado por reforço com feedback humano), funcionários da Tencent foram organizados para atuar como avaliadores humanos, e um memorando interno forneceu orientações de instalação do Claude Code, com limite de uso de “alguns milhares de tokens” por pessoa.

Funcionários da Tencent não consideram isso como destilação (treinar um modelo fraco usando a saída de um modelo forte). Sua abordagem foi: apresentar o mesmo problema de programação a dois modelos anônimos, fazer avaliação às cegas; ao mesmo tempo, usar o Claude Code para gerar exemplos de comportamento de alta qualidade em tempo real como referência, ajudando a filtrar respostas de baixa qualidade. Vários funcionários de empresas de IA confirmaram que usar modelos líderes do setor como referência de base no pós-treinamento é uma prática comum.

Um porta-voz da Anthropic afirmou que a equipe de segurança da empresa “monitorou proativamente ataques de destilação e tomou medidas imediatamente após a detecção”, mas não respondeu diretamente à questão do uso do Claude Code pela Tencent. Empresas e desenvolvedores chineses geralmente obtêm o Claude por meio de intermediários, registros com números de telefone não chineses ou cartões de crédito. A Anthropic já reforçou os requisitos de verificação de identidade no início deste mês, exigindo que alguns usuários forneçam documentos emitidos pelo governo e fotos pessoais.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar