L'IA transforme les navigateurs : opportunités et défis de la troisième guerre des navigateurs

L'ère des navigateurs IA est arrivée : opportunités et défis de la troisième guerre des navigateurs

La troisième guerre des navigateurs est en train de se dérouler discrètement. Depuis Netscape et IE de Microsoft dans les années 90, jusqu'à l'esprit open source de Firefox et Chrome de Google, la lutte entre les navigateurs a toujours été une manifestation concentrée du contrôle de la plateforme et du changement de paradigme technologique. Chrome a conquis une position dominante grâce à sa rapidité de mise à jour et à son écosystème interconnecté, tandis que Google a formé un cercle fermé d'accès à l'information grâce à la structure "duopole" entre la recherche et le navigateur.

Mais aujourd'hui, ce schéma est en train de vaciller. L'essor des modèles de langage de grande taille (LLM) amène de plus en plus d'utilisateurs à accomplir des tâches sur la page de résultats de recherche avec des "zéro clic", réduisant ainsi les comportements de clic sur les pages web traditionnelles. Parallèlement, les rumeurs selon lesquelles Apple pourrait remplacer le moteur de recherche par défaut dans Safari menacent davantage les bénéfices d'Alphabet, et le marché commence à montrer des signes d'inquiétude vis-à-vis de la "doctrine de la recherche".

Le navigateur lui-même est également en train de se redéfinir. Il n'est pas seulement un outil d'affichage des pages web, mais aussi un conteneur regroupant diverses capacités telles que l'entrée de données, le comportement des utilisateurs, l'identité et la confidentialité. Bien que l'Agent IA soit puissant, pour réaliser des interactions complexes sur les pages, accéder aux données d'identité locales et contrôler les éléments des pages web, il doit encore s'appuyer sur les frontières de confiance et le bac à sable fonctionnel du navigateur. Le navigateur passe d'une interface humaine à une plateforme d'appels système pour les Agents.

Ce qui pourrait réellement briser l'actuel marché des navigateurs, ce n'est pas un "meilleur Chrome", mais plutôt une nouvelle structure d'interaction : ce n'est pas l'affichage d'informations, mais l'appel de tâches. Les navigateurs futurs doivent être conçus pour les agents IA - non seulement capables de lire, mais aussi d'écrire et d'exécuter. Des projets comme Browser Use tentent de sémantiser la structure des pages, transformant l'interface visuelle en texte structuré appelable par LLM, réalisant la cartographie des pages aux instructions, réduisant ainsi considérablement le coût d'interaction.

Les projets dominants sur le marché ont commencé à expérimenter : Perplexity construit un navigateur natif Comet, remplaçant les résultats de recherche traditionnels par de l'IA ; Brave allie protection de la vie privée et raisonnement local, utilisant des LLM pour améliorer les fonctionnalités de recherche et de blocage ; tandis que des projets natifs de Crypto comme Donut visent à créer une nouvelle entrée pour l'interaction entre l'IA et les actifs en chaîne. Ces projets ont en commun d'essayer de reconstruire l'interface d'entrée du navigateur, plutôt que d'embellir sa couche de sortie.

Pour les entrepreneurs, les opportunités se cachent dans la relation triangulaire entre l'entrée, la structure et l'agent. Le navigateur, en tant qu'interface d'appel du monde par les agents futurs, signifie que celui qui peut fournir des "blocs de capacité" structurés, appelables et dignes de confiance, peut devenir une partie intégrante de la nouvelle génération de plateformes. De l'SEO à l'AEO(Agent Engine Optimization), du trafic de page à l'appel de chaîne de tâches, la forme et la pensée de conception des produits sont en cours de reconstruction. La troisième guerre des navigateurs se déroule dans "l'entrée" plutôt que dans "l'affichage" ; ce qui détermine le gagnant n'est plus celui qui attire l'attention de l'utilisateur, mais celui qui gagne la confiance de l'agent et obtient l'entrée d'appel.

Histoire du développement des navigateurs

Au début des années 1990, lorsque l'Internet n'était pas encore devenu une partie intégrante de la vie quotidienne, Netscape Navigator a fait son apparition, tel un voilier ouvrant un nouveau continent, offrant à des millions d'utilisateurs l'accès à un monde numérique. Ce navigateur n'était pas le premier, mais c'était le premier produit à véritablement s'adresser au grand public et à façonner l'expérience Internet. À cette époque, les gens pouvaient enfin naviguer sur des pages Web avec une telle facilité grâce à une interface graphique, comme si le monde entier était soudainement à portée de main.

Cependant, la gloire est souvent éphémère. Microsoft a rapidement réalisé l'importance des navigateurs et a décidé de forcer Internet Explorer à être intégré dans le système d'exploitation Windows, le rendant ainsi le navigateur par défaut. Cette stratégie peut être qualifiée de "coup de grâce pour la plateforme", détruisant directement la position dominante de Netscape sur le marché. De nombreux utilisateurs n'ont pas choisi IE de leur propre gré, mais l'ont accepté simplement parce qu'il était par défaut dans le système. Grâce à la capacité de distribution de Windows, IE est rapidement devenu le leader du secteur, tandis que Netscape est tombé dans une spirale de déclin.

Dans l'adversité, les ingénieurs de Netscape ont choisi une voie radicale et idéaliste - ils ont rendu le code source du navigateur public, appelant la communauté open source. Cette décision, comme une "abandon macédonien" dans le monde technologique, annonçait la fin d'une époque et l'émergence de nouvelles forces. Ce code est ensuite devenu la base du projet de navigateur Mozilla, initialement nommé Phoenix(, signifiant la renaissance du phénix ), mais a été rebaptisé plusieurs fois en raison de problèmes de marque, avant d'être finalement nommé Firefox.

Firefox n'est pas une simple copie de Netscape, il a réalisé de nombreuses avancées en termes d'expérience utilisateur, d'écosystème de plugins et de sécurité. Sa naissance marque la victoire de l'esprit open source et insuffle une nouvelle vitalité à toute l'industrie. Certains décrivent Firefox comme le "héritier spirituel" de Netscape, tout comme l'Empire ottoman a hérité des derniers éclats de l'Empire byzantin. Bien que cette métaphore soit exagérée, elle est pleine de sens.

Mais quelques années avant la sortie officielle de Firefox, Microsoft avait déjà lancé six versions d'IE, profitant de l'avantage du temps et d'une stratégie de regroupement système, ce qui a fait que Firefox a commencé en position de rattrapage, rendant cette compétition inégale dès le départ.

En parallèle, un autre acteur précoce fait son apparition. En 1994, le navigateur Opera voit le jour, provenant de Norvège, au départ un projet expérimental. Mais à partir de la version 7.0 en 2003, il introduit le moteur Presto développé en interne, soutenant en premier lieu des technologies de pointe telles que CSS, la mise en page adaptative, le contrôle vocal et l'encodage Unicode. Bien que le nombre d'utilisateurs soit limité, il est resté à la pointe de la technologie dans l'industrie, devenant "le favori des geeks".

La même année, Apple a lancé le navigateur Safari. C'était un tournant plein de sens. À l'époque, Microsoft avait investi 150 millions de dollars dans Apple, alors au bord de la faillite, afin de maintenir une apparence de concurrence et d'éviter un examen antitrust. Bien que le moteur de recherche par défaut de Safari depuis sa création soit Google, cette histoire d'imbroglio avec Microsoft symbolise la relation complexe et subtile entre les géants de l'internet : coopération et concurrence sont toujours inséparables.

En 2007, IE7 a été lancé avec Windows Vista, mais les retours du marché ont été mitigés. En revanche, Firefox, grâce à un rythme de mise à jour plus rapide, un mécanisme d'extension plus convivial et un attrait naturel pour les développeurs, a vu sa part de marché augmenter régulièrement pour atteindre environ 20 %. Le règne d'IE s'affaiblit progressivement, le vent est en train de changer.

Google adopte une autre approche. Bien qu'elle ait commencé à concevoir son propre navigateur dès 2001, il a fallu six ans pour convaincre le PDG Eric Schmidt d'approuver ce projet. Chrome a été lancé en 2008, basé sur le projet open source Chromium et le moteur WebKit utilisé par Safari. Il a été qualifié de "navigateur encombrant", mais grâce à l'expertise de Google en matière de publicité et de construction de marque, il a rapidement émergé.

L'arme clé de Chrome n'est pas sa fonctionnalité, mais plutôt son rythme de mises à jour fréquentes ( toutes les six semaines ) offrant une expérience unifiée sur toutes les plateformes. En novembre 2011, Chrome a pour la première fois dépassé Firefox, atteignant une part de marché de 27 % ; six mois plus tard, il a de nouveau dépassé IE, complétant la transition de challenger à dominateur.

Dans le même temps, l'internet mobile en Chine est en train de former son propre écosystème. Un certain navigateur a rapidement gagné en popularité au début des années 2010, notamment sur les marchés émergents tels que l'Inde, l'Indonésie et la Chine, grâce à son design léger et à ses fonctionnalités de compression des données pour économiser de la bande passante, attirant ainsi les utilisateurs d'appareils bas de gamme. En 2015, sa part de marché mondiale des navigateurs mobiles a dépassé 17%, atteignant même 46% en Inde à un moment donné. Mais cette victoire n'a pas duré. Avec le renforcement par le gouvernement indien des contrôles de sécurité sur les applications chinoises, ce navigateur a été contraint de quitter un marché clé, perdant progressivement son ancienne gloire.

En entrant dans les années 2020, la position dominante de Chrome est déjà établie, avec une part de marché mondiale stable d'environ 65 %. Il convient de noter que, bien que le moteur de recherche Google et le navigateur Chrome appartiennent tous deux à Alphabet, ils représentent en réalité deux systèmes hégémoniques indépendants sur le plan du marché - le premier contrôle environ 90 % des points d'entrée de recherche dans le monde, tandis que le second détient la majorité des "premières fenêtres" par lesquelles les utilisateurs accèdent à Internet.

Pour maintenir cette structure de double monopole, Google n'hésite pas à débourser des sommes considérables. En 2022, Alphabet a versé environ 20 milliards de dollars à Apple, simplement pour que Google conserve son statut de moteur de recherche par défaut dans Safari. Selon certaines analyses, cette dépense représente 36 % des revenus publicitaires de recherche que Google tire du trafic de Safari. En d'autres termes, Google paie une "taxe de protection" pour sa muraille.

Mais le vent a encore une fois changé. Avec l'émergence des modèles de langage de grande taille (LLM), la recherche traditionnelle commence à être perturbée. En 2024, la part de marché de la recherche de Google est tombée de 93 % à 89 %. Bien qu'elle reste dominante, des fissures commencent à apparaître. Plus disruptif encore, des rumeurs circulent sur le fait qu'Apple pourrait lancer son propre moteur de recherche AI - si Safari changeait son moteur de recherche par défaut pour le sien, cela non seulement réécrirait l'écosystème, mais pourrait également ébranler le pilier des profits d'Alphabet. Le marché a réagi rapidement, le prix des actions d'Alphabet passant de 170 dollars à 140 dollars, reflétant non seulement la panique des investisseurs, mais aussi une profonde inquiétude quant à l'avenir de l'ère de la recherche.

De Navigator à Chrome, de l'idéal open source à la commercialisation de la publicité, des navigateurs légers aux assistants de recherche AI, la guerre des navigateurs est toujours une bataille concernant la technologie, les plateformes, le contenu et le contrôle. Le champ de bataille se déplace constamment, mais l'essence n'a jamais changé : celui qui contrôle l'entrée définit l'avenir.

L'architecture obsolète des navigateurs modernes

En ce qui concerne l'architecture des navigateurs, l'architecture traditionnelle classique est illustrée comme suit :

Client - Point d'entrée front-end

Recherchez le dernier Google Front End livré via HTTPS, effectuez le déchiffrement TLS, l'échantillonnage QoS et le routage géographique. Si un trafic anormal est détecté, ( DDoS, une capture automatique de ) peut être limitée ou contestée à ce niveau.

Compréhension de la requête

Le front-end doit comprendre le sens des mots saisis par l'utilisateur, en trois étapes : correction orthographique neuronale, corriger "recpie" en "recipe" ; expansion des synonymes, étendre "how to fix bike" à "repair bicycle". Analyse des intentions, déterminer si la requête est une intention d'information, de navigation ou de transaction, et attribuer la demande Vertical.

Rappel des candidats

La technologie de requête utilisée par Google est appelée : index inversé. Dans un index direct, nous pouvons indexer un fichier simplement en donnant un ID. Cependant, les utilisateurs ne peuvent pas connaître le numéro du contenu souhaité parmi des centaines de milliards de fichiers, c'est pourquoi ils ont recours à l'index inversé très traditionnel, qui permet de rechercher quels fichiers contiennent les mots-clés correspondants. Ensuite, Google utilise l'indexation vectorielle pour traiter la recherche sémantique, c'est-à-dire pour trouver des contenus similaires au sens de la requête. Il convertit des textes, des images et d'autres contenus en vecteurs de haute dimension (embedding), et effectue des recherches en fonction de la similarité entre ces vecteurs. Par exemple, même si un utilisateur recherche "comment faire une pâte à pizza", le moteur de recherche peut renvoyer des résultats liés à "guide de fabrication de pâte à pizza", car ils sont sémantiquement similaires. Après avoir passé par l'index inversé et l'indexation vectorielle, environ cent mille pages web seront pré-sélectionnées.

Tri multiniveau

Les systèmes filtrent généralement des millions de pages candidates, réduisant ainsi les cent mille pages à environ 1000, en utilisant des milliers de caractéristiques légères telles que BM25, TF-IDF et le score de qualité de la page, formant ainsi un ensemble de candidats préliminaire. Ces systèmes sont collectivement appelés moteurs de recommandation. Ils s'appuient sur une vaste quantité de caractéristiques générées par diverses entités, y compris le comportement des utilisateurs, les attributs des pages, les intentions de recherche et les signaux contextuels. Par exemple, Google prend en compte l'historique des utilisateurs, les retours d'autres utilisateurs, la sémantique des pages, la signification des requêtes, tout en considérant également des éléments contextuels tels que le moment de la journée (, le jour spécifique de la semaine ) et des événements externes comme les nouvelles en temps réel.

Apprentissage profond pour le tri principal

Dans la phase de recherche initiale, Google utilise des technologies telles que RankBrain et Neural Matching pour comprendre le sens des requêtes et filtrer les résultats pertinents parmi un grand nombre de documents. RankBrain est un système d'apprentissage machine introduit par Google en 2015, visant à mieux comprendre la signification des requêtes des utilisateurs, en particulier celles qui apparaissent pour la première fois. Il convertit les requêtes et les documents en représentations vectorielles, calculant leur similarité pour trouver les résultats les plus pertinents. Par exemple, pour la requête "comment faire une pâte à pizza", même si les mots-clés ne correspondent pas exactement dans le document, RankBrain peut identifier le contenu lié à "base de pizza" ou "préparation de la pâte".

Le Neural Matching est une autre technologie lancée par Google en 2018, visant à comprendre plus en profondeur la relation sémantique entre les requêtes et les documents. Il utilise des modèles de réseaux neuronaux pour capturer les relations floues entre les mots, aidant Google à mieux faire correspondre les requêtes et le contenu des pages web. Par exemple, pour la requête "Pourquoi le ventilateur de mon ordinateur portable fait-il beaucoup de bruit", le Neural Matching peut comprendre que l'utilisateur recherche probablement des informations de dépannage concernant la surchauffe, l'accumulation de poussière ou une utilisation élevée du CPU, même si ces mots ne figurent pas directement dans la requête.

Réagencement profond : Application du modèle BERT

Après avoir effectué une première sélection des documents pertinents, Google utilise le modèle BERT(Bidirectional Encoder Representations from Transformers) pour traiter ces documents.

AGENT1.52%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 5
  • Partager
Commentaire
0/400
LiquidationWatchervip
· Il y a 3h
Chrome va aussi être condamné.
Voir l'originalRépondre0
MoonRocketmanvip
· 07-28 23:07
Le marché a changé de cap.
Voir l'originalRépondre0
DaoTherapyvip
· 07-28 23:05
La disruption de la couche inférieure est en route.
Voir l'originalRépondre0
GateUser-75ee51e7vip
· 07-28 22:59
La compétition dimensionnelle a commencé.
Voir l'originalRépondre0
NftMetaversePaintervip
· 07-28 22:54
Changement de paradigme à venir Web3
Voir l'originalRépondre0
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)