A IA redefine o navegador: oportunidades e desafios da terceira guerra dos navegadores

A era dos navegadores de IA chegou: oportunidades e desafios da terceira guerra dos navegadores

A terceira guerra dos navegadores está se desenrolando silenciosamente. Desde o Netscape e o IE da Microsoft nos anos 90, até o espírito de código aberto do Firefox e o Chrome do Google, a disputa entre navegadores tem sido uma representação concentrada do controle de plataformas e das mudanças nos paradigmas tecnológicos. O Chrome conquistou uma posição dominante com sua velocidade de atualização e interconexão ecológica, enquanto o Google formou um ciclo fechado de entrada de informações através da estrutura de "duopólio" entre busca e navegador.

Mas hoje, esse padrão está se abalando. A ascensão dos grandes modelos de linguagem (LLM) está fazendo com que cada vez mais usuários completem tarefas na página de resultados de busca com "zero cliques", reduzindo o comportamento tradicional de clicar em páginas web. Ao mesmo tempo, rumores sobre a possibilidade de a Apple substituir o motor de busca padrão no Safari estão ameaçando ainda mais a base de lucros da Alphabet, e o mercado já começa a mostrar preocupação com a "ortodoxia da busca".

O próprio navegador está também a enfrentar uma reconfiguração de papéis. Ele não é apenas uma ferramenta para exibir páginas web, mas sim um recipiente que reúne diversas capacidades como entrada de dados, comportamento do utilizador e identidade de privacidade. Embora o Agente de IA seja poderoso, para realizar interações complexas em páginas, chamar dados de identidade locais e controlar elementos da página, ainda é necessário recorrer às fronteiras de confiança e ao sandbox de funcionalidades do navegador. O navegador está a transformar-se de uma interface humana para uma plataforma de chamadas de sistema para Agentes.

O que pode realmente quebrar o atual paradigma do mercado de navegadores não é outro "Chrome melhor", mas uma nova estrutura de interação: não é a apresentação da informação, mas a convocação de tarefas. O navegador do futuro deve ser projetado para o Agente de IA - não apenas capaz de ler, mas também de escrever e executar. Projetos como Browser Use estão tentando semantizar a estrutura das páginas, transformando a interface visual em texto estruturado que pode ser chamado por LLM, alcançando assim um mapeamento de página para instrução, reduzindo drasticamente o custo de interação.

Os principais projetos no mercado começaram a experimentar: a Perplexity construiu o navegador nativo Comet, substituindo os resultados de busca tradicionais por IA; a Brave combina proteção de privacidade com raciocínio local, melhorando a busca e as funções de bloqueio com LLM; enquanto projetos nativos de cripto como a Donut visam novas entradas para a interação entre IA e ativos em blockchain. A característica comum desses projetos é: tentar reconstruir a parte de entrada do navegador, em vez de embelezar sua camada de saída.

Para os empreendedores, as oportunidades estão escondidas na relação triangular entre entrada, estrutura e agência. O navegador, como a interface que chama o mundo dos futuros agentes, significa que quem pode fornecer "blocos de capacidade" estruturados, chamáveis e confiáveis, pode se tornar parte da nova geração de plataformas. Desde SEO até AEO( Agent Engine Optimization), desde o tráfego da página até a chamada da cadeia de tarefas, a forma do produto e o pensamento de design estão sendo reestruturados. A terceira guerra dos navegadores ocorre na "entrada" e não na "exibição"; o que decide a vitória não é mais quem captura a atenção do usuário, mas quem ganha a confiança do agente e obtém a entrada para a chamada.

Breve História do Desenvolvimento dos Navegadores

No início da década de 90, quando a internet ainda não fazia parte do cotidiano, o Netscape Navigator surgiu, como um barco à vela que abre novos mundos, abrindo as portas do mundo digital para milhões de usuários. Este navegador não foi o primeiro, mas foi o primeiro a realmente se tornar acessível ao público e moldar a experiência da internet. Naquele momento, as pessoas podiam navegar na web de forma tão fácil através de uma interface gráfica, como se o mundo todo de repente se tornasse ao alcance das mãos.

No entanto, o esplendor é muitas vezes efémero. A Microsoft rapidamente percebeu a importância dos navegadores e decidiu forçar a inclusão do Internet Explorer no sistema operativo Windows, tornando-o o navegador padrão. Esta estratégia é considerada uma "arma secreta da plataforma", que desmantelou diretamente a posição dominante de mercado da Netscape. Muitos usuários não escolheram o IE ativamente, mas aceitaram-no porque era o padrão do sistema. O IE, aproveitando a capacidade de distribuição do Windows, rapidamente se tornou o líder da indústria, enquanto a Netscape caiu em uma trajetória de declínio.

Em tempos de crise, os engenheiros da Netscape escolheram um caminho radical e idealista - eles tornaram o código-fonte do navegador público, fazendo um apelo à comunidade de código aberto. Esta decisão, como que uma "cede macedônica" no mundo da tecnologia, prenunciou o fim de uma era e o surgimento de novas forças. Este código mais tarde se tornou a base do projeto do navegador Mozilla, inicialmente nomeado Phoenix(, que significa renascimento da fênix), mas devido a questões de marca, passou por várias mudanças de nome, sendo finalmente chamado de Firefox.

O Firefox não é uma simples cópia do Netscape; ele conseguiu várias inovações em termos de experiência do usuário, ecossistema de plugins e segurança. O seu surgimento marca a vitória do espírito de código aberto e também trouxe nova vitalidade para toda a indústria. Alguns descrevem o Firefox como o "herdeiro espiritual" do Netscape, assim como o Império Otomano herdou o esplendor bizantino. Embora essa metáfora seja exagerada, possui um significado profundo.

Mas anos antes do lançamento oficial do Firefox, a Microsoft já havia lançado seis versões do IE, aproveitando a vantagem do tempo e a estratégia de empacotamento do sistema, fazendo com que o Firefox começasse em uma posição de perseguição, o que tornava essa competição uma corrida desigual desde o início.

Ao mesmo tempo, outro jogador inicial também estava surgindo discretamente. Em 1994, o navegador Opera foi lançado, vindo da Noruega, e inicialmente era apenas um projeto experimental. Mas a partir da versão 7.0 em 2003, ele introduziu o motor Presto desenvolvido internamente, sendo o primeiro a suportar tecnologias de ponta como CSS, layout adaptativo, controle de voz e codificação Unicode. Embora o número de usuários fosse limitado, a tecnologia sempre esteve na vanguarda da indústria, tornando-se "o favorito dos geeks".

No mesmo ano, a Apple lançou o navegador Safari. Foi um ponto de viragem significativo. Naquela época, a Microsoft havia investido 150 milhões de dólares na Apple, que estava à beira da falência, para manter a aparência de concorrência e evitar uma revisão antitruste. Embora o mecanismo de busca padrão do Safari desde o seu nascimento tenha sido o Google, essa história de envolvimento com a Microsoft simboliza a relação complexa e sutil entre os gigantes da internet: cooperação e concorrência, sempre andam de mãos dadas.

Em 2007, o IE7 foi lançado junto com o Windows Vista, mas a recepção no mercado foi medíocre. Em contrapartida, o Firefox, com um ritmo de atualizações mais rápido, um mecanismo de extensões mais amigável e um apelo natural para os desenvolvedores, viu sua participação de mercado aumentar de forma constante para cerca de 20%. O domínio do IE começou a se afrouxar, e a maré estava mudando.

O Google, por sua vez, adotou uma abordagem diferente. Embora tenha começado a desenvolver seu próprio navegador em 2001, levou seis anos para convencer o CEO Eric Schmidt a aprovar o projeto. O Chrome foi lançado em 2008, baseado no projeto de código aberto Chromium e no motor WebKit utilizado pelo Safari. Foi apelidado de "navegador pesado", mas, graças à expertise do Google em publicidade e construção de marcas, rapidamente se destacou.

A chave do Chrome não são suas funcionalidades, mas sim o ritmo frequente de atualizações de versão ( a cada seis semanas ) com uma experiência unificada em todas as plataformas. Em novembro de 2011, o Chrome superou o Firefox pela primeira vez, alcançando uma participação de mercado de 27%; seis meses depois, superou novamente o IE, completando a transição de desafiador para dominador.

Ao mesmo tempo, a internet móvel na China também está formando seu próprio ecossistema. Um determinado navegador rapidamente ganhou popularidade no início da década de 2010, especialmente em mercados emergentes como Índia, Indonésia e China, conquistando a preferência dos usuários de dispositivos de baixo custo com seu design leve, compressão de dados para economizar tráfego e outras características. Em 2015, sua participação no mercado global de navegadores móveis ultrapassou 17%, chegando a 46% na Índia em um determinado momento. No entanto, essa vitória não foi duradoura. Com o governo indiano intensificando a fiscalização de segurança sobre aplicativos chineses, o navegador foi forçado a sair de um mercado chave, perdendo gradualmente seu antigo esplendor.

Ao entrar na década de 2020, a posição dominante do Chrome já foi estabelecida, com uma quota de mercado global estável em cerca de 65%. É importante notar que, embora o motor de busca Google e o navegador Chrome pertençam ambos à Alphabet, do ponto de vista do mercado, eles representam dois sistemas hegemônicos independentes - o primeiro controla cerca de 90% dos pontos de entrada de busca global, enquanto o segundo detém a maioria dos "primeiros janelas" que os usuários usam para entrar na internet.

Para manter essa estrutura de duopólio, o Google não hesitou em investir pesadamente. Em 2022, a Alphabet pagou cerca de 20 bilhões de dólares à Apple, apenas para que o Google mantivesse sua posição de busca padrão no Safari. Análises apontam que esse gasto equivale a 36% da receita de anúncios de busca que o Google obtém do tráfego do Safari. Em outras palavras, o Google está pagando uma "taxa de proteção" para seu fosso.

Mas o vento mudou mais uma vez. Com a ascensão do modelo de linguagem em larga escala (LLM), as buscas tradicionais começaram a ser impactadas. Em 2024, a participação de mercado de buscas do Google caiu de 93% para 89%, embora ainda domine, as fissuras já estão visíveis. O mais disruptivo é o boato de que a Apple pode lançar seu próprio motor de busca com IA - se o Safari mudar sua busca padrão para seu próprio ecossistema, isso não apenas reescreverá o cenário ecológico, mas também poderá abalar o pilar de lucros da Alphabet. O mercado reagiu rapidamente, com as ações da Alphabet caindo de 170 dólares para 140 dólares, refletindo não apenas o pânico dos investidores, mas também uma profunda inquietação sobre a futura direção da era das buscas.

Da Navegador ao Chrome, da ideia de código aberto à comercialização da publicidade, do navegador leve ao assistente de busca AI, a disputa dos navegadores sempre foi uma guerra sobre tecnologia, plataforma, conteúdo e controle. O campo de batalha está em constante mudança, mas a essência nunca muda: quem controla a entrada, quem define o futuro.

A arquitetura antiga dos navegadores modernos

Falando sobre a arquitetura do navegador, a arquitetura tradicional clássica é a seguinte:

Cliente - Entrada do Frontend

Consultar a Google Front End mais próxima via HTTPS, completar a decriptação TLS, amostragem QoS e roteamento geográfico. Se detectar tráfego anômalo (DDoS, captura automática ) pode ser limitada ou desafiada nesta camada.

Compreensão da Consulta

A interface precisa entender o significado das palavras digitadas pelo usuário, existem três passos: correção ortográfica neural, corrigindo "recpie" para "recipe"; expansão de sinônimos, expandindo "how to fix bike" para "repair bicycle". Análise de intenção, determinando se a consulta é de informação, navegação ou intenção de transação, e alocando a solicitação Vertical.

Candidatos Reunidos

A tecnologia de consulta usada pelo Google é chamada de: índice invertido. Em um índice direto, nós simplesmente fornecemos um ID para indexar um arquivo. No entanto, o usuário não pode saber qual é o número do conteúdo desejado em bilhões de arquivos, por isso é adotado um índice invertido muito tradicional, que permite consultar quais arquivos contêm as palavras-chave correspondentes. Em seguida, o Google utiliza o índice vetorial para tratar a busca semântica, ou seja, encontrar conteúdos que sejam semanticamente semelhantes à consulta. Ele converte textos, imagens e outros conteúdos em vetores de alta dimensão (embedding) e realiza a busca com base na similaridade entre esses vetores. Por exemplo, mesmo que o usuário busque "como fazer massa de pizza", o mecanismo de busca pode retornar resultados relacionados a "guia de preparo da massa de pizza", pois eles são semanticamente semelhantes. Após passar pelo índice invertido e pelo índice vetorial, cerca de cem mil páginas serão pré-selecionadas.

Classificação em múltiplos níveis

Os sistemas geralmente filtram páginas candidatas em escala de centenas de milhares para cerca de 1000, utilizando milhares de características leves, como BM25, TF-IDF e pontuações de qualidade de página, formando assim um conjunto inicial de candidatos. Esses sistemas são coletivamente chamados de motores de recomendação. Eles dependem de uma vasta gama de características geradas por várias entidades, incluindo comportamento do usuário, atributos da página, intenção de pesquisa e sinais de contexto. Por exemplo, o Google integra informações como o histórico do usuário, o feedback de comportamento de outros usuários, a semântica da página, o significado da consulta, e também considera fatores contextuais, como o período do dia (, dias específicos da semana ) e eventos externos, como notícias em tempo real.

Aprendizado profundo para classificação principal

Na fase inicial de pesquisa, o Google utiliza tecnologias como RankBrain e Neural Matching para entender o significado das consultas e filtrar resultados preliminarmente relevantes de um vasto conjunto de documentos. O RankBrain é um sistema de aprendizado de máquina introduzido pelo Google em 2015, com o objetivo de compreender melhor o significado das consultas dos usuários, especialmente aquelas que aparecem pela primeira vez. Ele transforma consultas e documentos em representações vetoriais, calculando a semelhança entre eles para encontrar os resultados mais relevantes. Por exemplo, para a consulta "como fazer massa de pizza", mesmo que não haja palavras-chave que correspondam exatamente no documento, o RankBrain consegue identificar conteúdos relacionados a "base de pizza" ou "preparação da massa".

O Neural Matching é uma tecnologia lançada pelo Google em 2018, destinada a compreender mais profundamente as relações semânticas entre consultas e documentos. Ele utiliza modelos de redes neurais para capturar relações vagas entre palavras, ajudando o Google a corresponder melhor consultas e conteúdos da web. Por exemplo, para a consulta "por que o ventilador do meu laptop faz muito barulho", o Neural Matching consegue entender que o usuário pode estar procurando informações sobre solução de problemas relacionadas a superaquecimento, acúmulo de poeira ou alta utilização da CPU, mesmo que essas palavras não apareçam diretamente na consulta.

Reorganização Profunda: Aplicação do Modelo BERT

Após a seleção preliminar dos documentos relevantes, o Google utiliza o modelo BERT(Representações de Codificadores Bidimensionais de Transformers) para processar esses documentos.

AGENT1.52%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 5
  • Partilhar
Comentar
0/400
LiquidationWatchervip
· 3h atrás
Chrome também vai estar condenado
Ver originalResponder0
MoonRocketmanvip
· 07-28 23:07
O rumo do mercado mudou.
Ver originalResponder0
DaoTherapyvip
· 07-28 23:05
A disrupção de base já está a caminho.
Ver originalResponder0
GateUser-75ee51e7vip
· 07-28 22:59
A competição de dimensões começou.
Ver originalResponder0
NftMetaversePaintervip
· 07-28 22:54
Mudança de paradigma a caminho do Web3
Ver originalResponder0
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)