A Tencent usou o Claude Code, da Anthropic, no treinamento mais recente do modelo Hy3, informa o The Information

De acordo com a The Information, citando memorandos internos da Tencent e fontes, funcionários da Tencent usaram o Claude Code da Anthropic durante a fase de pós-treinamento do Hy3, o modelo de linguagem grande mais recente da empresa, apesar da proibição explícita da Anthropic de serviços comerciais para empresas chinesas, citando preocupações de segurança nacional.

O Hy3 traz uma arquitetura de mixture-of-experts com 295B parâmetros. Durante a etapa de RLHF (reinforcement learning from human feedback), equipes da Tencent atuaram como avaliadores humanos, com uso limitado a milhares de tokens por pessoa. Memorandos internos forneceram guias de instalação do Claude Code. Funcionários da Tencent usaram o Claude Code para gerar exemplos de referência de alta qualidade para pontuar saídas anônimas do modelo, em vez do que eles caracterizaram como distilação. Um porta-voz da Anthropic afirmou que a empresa monitora ativamente ataques de distilação, mas não abordou diretamente o uso do Claude Code pela Tencent.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Sam Altman, Dario Amodei são insuportáveis! O alarmismo sobre o fim da IA e o sentimento de relativa privação têm feito os americanos ficarem contra a IA

O podcast conhecido da Silicon Valley 《All-In Podcast》, ao discutir a indústria de IA, trouxe uma observação bastante contundente: a atitude da sociedade americana em relação à IA está mudando para o negativo, e o alvo mais concreto dessa insatisfação é exatamente o tipo de infraestrutura que as empresas de IA vêm construindo às pressas em todo o país: os data centers. Essa antipatia pode ter origem em cenários apocalípticos sobre a IA, no medo de desemprego ou, talvez, em um descontentamento mais profundo: a nova onda de inovação tecnológica parece mais uma vez enriquecer apenas alguns, enquanto a vida da maioria das pessoas não melhora de forma perceptível. Nos EUA, governos locais já derrubaram casos de construção de data centers Chamath Palihapitiya disse no programa que os problemas que a indústria de IA enfrenta hoje não são apenas a disputa entre modelos, as despesas de capital ou a falta de capacidade computacional, mas sim que “o povo americano, como um todo, está ficando cada vez mais contrário à ideia de IA”. Ele apontou que essa rejeição pode vir de AI

ChainNewsAbmedia1h atrás

Perguntas da comunidade sobre viés ideológico nos principais modelos de IA em 4 de maio

De acordo com o BlockBeats, em 4 de maio, o usuário X Freeze, da comunidade de IA, questionou se modelos de IA mais tradicionais, incluindo ChatGPT, Claude e Gemini, apresentam viés sistemático por estarem menos alinhados com posições conservadoras em temas como gênero, imigração e crime. O usuário sugeriu que, como a IA

GateNews3h atrás

Cerebras planeja $4B IPO na Nasdaq, inicia roadshow em 4 de maio a US$ 115–US$ 125 por ação

De acordo com a Reuters, a fabricante de chips de IA Cerebras Systems iniciou seu roadshow de IPO em 4 de maio para listagem na Nasdaq sob o ticker CBRS. A empresa planeja precificar as ações entre US$115 e US$125 e pode levantar até US$4 bilhões em uma avaliação de aproximadamente US$40 bilhões. Isso marca a segunda

GateNews3h atrás

A IA impulsiona o crescimento do PIB dos EUA no 1T: 75%; em 2027, os 5 maiores players podem ter gastos de capital que superam US$ 1,1 trilhão

Morgan Stanley volta a revisar para cima a estimativa de gastos de capital dos cinco maiores gigantes de nuvem dos EUA: cerca de US$ 805 bilhões em 2026, cerca de US$ 1,116 trilhão em 2027, e em 2026 os investimentos em não tecnologia devem ficar em patamar semelhante ao de 2025. David Sacks afirma que o capex de IA contribui com cerca de 2,5% do PIB e que no próximo ano pode ultrapassar 3%, sendo visto como um novo motor para a economia dos EUA.

ChainNewsAbmedia3h atrás

Para aproveitar a onda de IPOs da SpaceX, da OpenAI e da Anthropic, Nasdaq e S&P afrouxam os requisitos

O Wall Street Journal afirmou que, para receber IPOs de empresas como SpaceX, OpenAI e Anthropic, o S&P e a Nasdaq flexibilizaram os critérios de inclusão de ações na carteira. O S&P reduziu o período de observação para novas ações para 6 meses, ou concedeu isenção do limite de lucro; a Nasdaq 100 lançou a inclusão rápida, e IPOs de grande porte podem entrar no índice no 15º dia após a listagem. A seleção passou a considerar apenas o valor total de mercado, eliminando o requisito de ações em free float mínimo, e adotando ponderação dinâmica. Especialistas questionam se isso pode aumentar os riscos de ações em alta e distorcer a formação de preços quando houver falta de liquidez no processo.

ChainNewsAbmedia4h atrás

ASX alerta empresas para não exagerarem o impacto da IA em 4 de maio

De acordo com a Bloomberg, em 4 de maio, a operadora da bolsa australiana ASX alertou as empresas para não exagerarem o impacto da inteligência artificial em seus negócios. A diretora-chefe de conformidade da ASX, Lucinda McCann, disse que a exchange está de olho em “ramping” ou em alegações destinadas a elevar os preços das ações

GateNews4h atrás
Comentário
0/400
Sem comentários