Citic Securities: Narrativa de IA no estrangeiro pode voltar a uma situação otimista

robot
Geração de resumo em curso

De acordo com o Relatório de Investigação de Valores Mobiliários CITIC, recentemente, tem havido uma forte procura por inferência e treino no exterior, e tanto a Amazon Cloud como a Google Cloud aumentaram os preços. No lado da inferência, a implementação de produtos de agente como MoltBot (anteriormente ClawdBot) e Claude Code acelerou, a procura por recursos de computação em nuvem aumentou significativamente, e o número de chamadas de token cresceu rapidamente durante 2-3 semanas consecutivas desde o início de 2026. No lado do treino, modelos como o Grok-5 e o Veo4 ainda estão em iteração, e a indústria continua a explorar o limite superior da escalabilidade para suportar a procura de poder computacional de treino. Embora a visibilidade da atual comercialização em larga escala de aplicações de IA ainda seja insuficiente, olhando para os próximos 3 a 6 meses, com a catálise intensiva da implementação de aplicações de IA de inferência e a iteração contínua do modelo de treino, a CITIC Securities prevê que a procura por potência de computação continue a aumentar.

O texto completo está abaixo

Narrativa de IA no estrangeiro pode regressar ao otimismo

Recentemente, tem havido uma forte procura por inferência e treino de poder computacional no estrangeiro, e tanto a Amazon Cloud como a Google Cloud aumentaram os seus preços. No lado da inferência, produtos Agent como MoltBot (anteriormente ClawdBot) e Claude Code aceleraram a sua implementação, a procura por recursos de computação em nuvem aumentou significativamente e o número de chamadas de token cresceu rapidamente durante 2-3 semanas consecutivas desde o início de 2026. No lado do treino, modelos como o Grok-5 e o Veo4 ainda estão em iteração, e a indústria continua a explorar o limite superior da escalabilidade para suportar a procura de poder computacional de treino. Embora a visibilidade da atual comercialização em larga escala de aplicações de IA ainda seja insuficiente, olhando para os próximos 3-6 meses, com a catálise intensiva da implementação de aplicações de IA de inferência e a iteração contínua do modelo de treino, prevemos que a procura por poder de computação ainda aumente.

Origem do relatório: A procura de potência de computação por inferência e treino no estrangeiro é forte, e tanto a Amazon Cloud como a Google Cloud aumentaram os preços.

Após a AWS implementar um aumento de preço de cerca de 15% para blocos de capacidade de aprendizagem automática EC2 a 23 de janeiro de 2026, a 27 de janeiro, a Google Cloud anunciou que os seus serviços de transmissão de rede na cloud irão iniciar uma ronda de aumentos de preços, dos quais a América do Norte irá trazer um aumento duplicado. Acreditamos que esta ronda de aumentos nos preços dos serviços cloud resulta da tendência contínua de alta na procura de inferência e treino de GPUs. Olhando para os próximos 3-6 meses, espera-se que a implementação de aplicações de IA no lado da inferência continue, e a iteração intensiva do modelo do lado do treino seja sobreposta, e prevemos que a procura de poder de computação continue a aumentar a curto prazo, e as preocupações sobre a “teoria da bolha de poder de computação” que suprimiu o sentimento e a valorização do setor do poder computacional na fase inicial deverão ser aliviadas em fases.

▍Lado da inferência: Os agentes estão a acelerar a sua aterragem, o que deverá suportar a procura de poder de computação de inferência.

Recentemente, a aplicação agente de IA MoltBot (anteriormente ClawdBot) emergiu rapidamente deste círculo, e a AI Agent continua a dar um passo em frente, ganhando maior autoridade sobre as operações do computador e sendo capaz de lidar com tarefas em cenários mais complexos, ao mesmo tempo que traz um maior consumo de poder de computação. Uma série de produtos lançados pela Anthropic, como Claude Code, Agent Skills, Claude Cowork e Claude in Excel, também expandiu a utilização de cenários de implementação do Agent. Do ponto de vista dos dados de utilização real, segundo o OpenRouter, desde o início de janeiro de 2026, o número de chamadas de token manteve um crescimento rápido durante 2-3 semanas consecutivas, e o uso de aplicações de IA continuou a aumentar. Segundo o The Information, a Anthropic elevou as suas previsões de receitas para 2026 e 2027 para 18 mil milhões e 55 mil milhões de dólares, respetivamente. De forma análoga à prosperidade do Google Cloud trazida pela última ronda da Gemini, espera-se também que o fornecedor de serviços cloud da Anthropic promova um rápido aumento da procura por inferência.

▍Lado da formação: A indústria continua a explorar o limite superior da escalabilidade para suportar a procura de poder computacional de treino.

No lado dos modelos, espera-se que uma nova ronda de modelos seja lançada intensivamente no primeiro trimestre de 2026. Em termos de modelos de linguagem, modelos como o Grok-5 e o GPT-6 continuam a explorar o efeito de escalabilidade, e espera-se que utilizem mais dados e maior escala de parâmetros para treinar na nova plataforma de potência computacional GB300, de modo a suportar a procura de poder computacional de treino. Em termos de modelos multimodais, modelos de geração de vídeo como o Veo-4 ainda estão numa fase de iteração rápida, apresentando requisitos mais elevados para o poder de computação. A exploração dos limites das capacidades dos modelos por parte da indústria e da academia apoia conjuntamente a procura por poder computacional de treino. Além disso, no contexto de um lançamento iterativo intensivo do modelo, se as capacidades dos modelos Grok-5, GPT-6 e Veo-4 superarem as expectativas, espera-se que a cadeia Nvidia correspondente e a cadeia Google tragam oportunidades gerais de crescimento. Entre elas, a Nvidia Chain foi suprimida pela narrativa de “TPU a apropriar-se da quota da GPU” devido à capacidade do Gemini 3 de acompanhar a OpenAI na fase inicial, e a elasticidade da reavaliação desta ronda de janela de iteração do modelo pode ser maior.

▍ Catalise do relatório financeiro: A chegada do relatório trimestral do mercado acionista dos EUA é um momento-chave para a confirmação da procura de poder de computação.

Atualmente, o mercado está preocupado com o desempenho dos CSPs no mercado acionista dos EUA e se o Capex pode ser sustentado, e os relatórios financeiros dos quatro principais CSPs tornar-se-ão uma janela importante de observação. A 29 de janeiro de 2026, serão divulgados os relatórios financeiros da Microsoft e da Meta, que deverá verificar pela primeira vez o juízo do mercado sobre a continuidade da procura de poder de computação e dos gastos de capital. Subsequentemente, os relatórios de resultados da Google de 5 de fevereiro e da Amazon de 6 de fevereiro irão melhorar ainda mais a sua orientação de despesa de capital para o ano completo. A divulgação do relatório de resultados da NVIDIA a 26 de fevereiro e da conferência GTC a 16 e 19 de março também deverão abrir uma nova ronda de avaliações de mercado sobre o ciclo anual ascendente do investimento em potência computacional, tornando-se um catalisador importante para a mudança das narrativas de poder computacional no estrangeiro para situações otimistas.

▍Fatores de risco:

a iteração do modelo básico é menor do que o esperado; os principais fabricantes executam bloqueios técnicos; A deterioração macroeconómica levou ao aperto do capital de risco; O software open source avança para além das expectativas; A deterioração da macroeconomia levou a um declínio na disposição dos utilizadores em pagar; O custo de usar o modelo básico aumenta, etc.

▍Estratégia de investimento:

Embora a visibilidade da comercialização em larga escala de aplicações de IA ainda seja limitada, impulsionada pela recente catálise intensiva de modelos e aplicações de IA no estrangeiro, espera-se que a procura de poder computacional internacional mantenha uma tendência ascendente. Julgamos que, nos próximos 3 a 6 meses, espera-se que as cadeias de potência computacional no estrangeiro regressem a uma situação relativamente otimista. Combinado com a atual evolução industrial e o ritmo de iteração dos modelos, recomenda-se focar-se em três tipos de oportunidades de investimento: primeiro, a crescente procura por potência computacional traz oportunidades de investimento para fornecedores de cloud, entre os quais as cadeias industriais relacionadas com a Antropia podem ser a principal direção beneficiária do Agente; A segunda são as oportunidades de investimento em cadeias de poder computacional no estrangeiro, provocadas pela procura por potência computacional. Entre elas, a Nvidia Chain foi suprimida pela narrativa de “TPU a apoderar-se da quota da GPU” devido à capacidade do Gemini 3 de alcançar o OpenAI na fase inicial, e a flexibilidade de reavaliação desta ronda de janela de iteração do modelo pode ser maior; Em terceiro lugar, o próprio modelo supera as expectativas, o que pode levar a uma reavaliação da empresa modelo.

(Fonte do artigo: People’s Financial News)

TOKEN3,62%
GROK5,72%
NVDAON1,07%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar