11:25
DeepSeek V3.2 versão oficial lançada: capacidade de Agent aprimorada, incorporando raciocínio e reflexão
A CoinGolden report, hoje, lançamos simultaneamente dois modelos na versão oficial: DeepSeek-V3.2 e DeepSeek-V3.2-Speciale. O DeepSeek-V3.2 é o nosso primeiro modelo que integra o pensamento na utilização de ferramentas, e suporta simultaneamente chamadas de ferramentas em modo de pensamento e modo não-pensamento. Propusemos um método de síntese de dados de treinamento de grande escala para agentes, criando uma vasta gama de tarefas de aprendizado por reforço "difíceis de responder, fáceis de validar" (mais de 1800 ambientes, mais de 85.000 instruções complexas), melhorando significativamente a capacidade de generalização do modelo. (DeepSeek)
- 1
- 2
