Le prix des actions d'NVIDIA a atteint un nouveau sommet, et les progrès des modèles multimodaux renforcent davantage l'avantage technologique de l'IA Web2. De l'alignement sémantique à la compréhension visuelle, de l'intégration haute dimension à la fusion des caractéristiques, des modèles complexes intègrent à une vitesse sans précédent divers modes d'expression, construisant un bastion de l'IA de plus en plus fermé. Parallèlement, les actions liées aux crypto-monnaies et à l'IA ont également connu une petite tendance haussière.
Cependant, cette vague semble être sans rapport avec le domaine des cryptomonnaies. Les récentes tentatives de Web3 AI dans la direction des agents montrent un écart directionnel. Essayer d'assembler un système modulaire multimodal de style Web2 avec une structure décentralisée représente en réalité un décalage technique et de pensée. Aujourd'hui, avec une forte couplage des modules, une distribution des caractéristiques instable et une demande de puissance de calcul concentrée, le modulaire multimodal a du mal à trouver sa place dans Web3.
L'avenir de l'IA Web3 ne devrait pas se limiter à l'imitation, mais devrait adopter une stratégie d'escarmouche. De l'alignement sémantique dans des espaces de haute dimension, aux goulots d'étranglement de l'information dans les mécanismes d'attention, en passant par l'alignement des caractéristiques sous des puissances de calcul hétérogènes, l'IA Web3 doit s'appuyer sur le principe tactique de "l'encerclement des villes par les campagnes".
Les défis auxquels est confronté le Web3 AI
Difficulté d'alignement sémantique
Le Web3 AI est basé sur un modèle multimodal aplati, ce qui rend difficile la réalisation d'un espace d'embedding de haute dimension. Cela entraîne un désalignement sémantique et des performances médiocres. Un espace d'embedding de haute dimension est essentiel pour comprendre et comparer différents signaux modaux, mais le protocole Web3 Agent a du mal à réaliser cela.
La plupart des agents Web3 ne sont que de simples enveloppes d'API prêtes à l'emploi, manquant d'un espace central d'intégration unifié et d'un mécanisme d'attention intermodules. Cela entraîne une incapacité à interagir de manière multilatérale et multilayer entre les modules, ne pouvant suivre qu'un pipeline linéaire, affichant une fonctionnalité unique et ne pouvant pas former une optimisation en boucle fermée.
La conception du mécanisme d'attention est limitée
L'espace de faible dimension limite la conception précise des mécanismes d'attention. Les modèles multimodaux de haut niveau nécessitent des mécanismes d'attention précis, ce qui nécessite un espace de haute dimension comme base.
La conception modulaire de l'IA Web3 rend difficile la réalisation d'une planification d'attention unifiée. Le manque de représentation vectorielle commune, de capacités de pondération et d'agrégation parallèles empêche la construction d'une capacité de "planification d'attention unifiée" comme celle du Transformer.
fusion des caractéristiques reste en surface
La modularité discrète des assemblages entraîne une fusion des caractéristiques qui reste à un stade statique superficiel. L'IA Web3 adopte souvent des assemblages de modules discrets, manquant d'un objectif d'entraînement unifié et d'un flux de gradients inter-modules.
Comparé aux méthodes de fusion complexes de l'IA Web2, les stratégies de fusion de l'IA Web3 sont trop simples et ont du mal à capturer des relations multimodales profondes et complexes.
Barrières et orientations de développement dans l'industrie de l'IA
Les barrières technologiques dans l'industrie de l'IA se renforcent, mais les points de douleur de l'IA Web3 ne se sont pas encore complètement manifestés. L'IA Web2 a investi massivement dans le développement de systèmes multimodaux, créant ainsi de solides barrières sectorielles.
Le développement de l'IA Web3 devrait suivre la tactique de "l'encerclement rural autour de la ville". Il devrait d'abord être testé à petite échelle dans des scénarios périphériques, en s'assurant que les bases sont solides avant d'attendre l'émergence de scénarios centraux. Les directions appropriées incluent des structures légères, des tâches facilement parallélisables et incitatives, telles que le réglage fin LoRA, les tâches d'entraînement post-alignement comportemental, l'entraînement et l'annotation de données par crowdsourcing, l'entraînement de petits modèles de base, ainsi que l'entraînement collaboratif sur des appareils périphériques.
Avant que les bénéfices de l'IA Web2 ne disparaissent complètement, l'IA Web3 doit choisir judicieusement ses points d'entrée, en se concentrant sur des projets capables de s'insérer par les marges, de combiner des points et des surfaces, de progresser de manière circulaire et d'être flexibles et agiles. Ce n'est qu'ainsi qu'elle pourra trouver sa place dans la compétition future de l'IA.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
7 J'aime
Récompense
7
5
Partager
Commentaire
0/400
StealthDeployer
· 07-22 13:56
web3 est battu par nvidia, c'est bien fait pour lui.
Voir l'originalRépondre0
ConsensusDissenter
· 07-22 13:55
Peux-tu ne pas jouer à ce piège ? Web3 a déjà été envoyé.
Voir l'originalRépondre0
pvt_key_collector
· 07-22 13:53
Cette vague de nouveaux sommets est essentiellement le résultat de l'écrasement de Web2.
Voir l'originalRépondre0
CoconutWaterBoy
· 07-22 13:51
Tout le monde sait que c'est la carte N qui décide.
Voir l'originalRépondre0
CoffeeOnChain
· 07-22 13:48
Les gars, si cette montée d'Nvidia ne peut pas faire décoller le web3, alors c'est vraiment impressionnant.
Défis du développement de l'IA Web3 : alignement sémantique et fusion des caractéristiques
État et défis du développement de l'IA Web3
Le prix des actions d'NVIDIA a atteint un nouveau sommet, et les progrès des modèles multimodaux renforcent davantage l'avantage technologique de l'IA Web2. De l'alignement sémantique à la compréhension visuelle, de l'intégration haute dimension à la fusion des caractéristiques, des modèles complexes intègrent à une vitesse sans précédent divers modes d'expression, construisant un bastion de l'IA de plus en plus fermé. Parallèlement, les actions liées aux crypto-monnaies et à l'IA ont également connu une petite tendance haussière.
Cependant, cette vague semble être sans rapport avec le domaine des cryptomonnaies. Les récentes tentatives de Web3 AI dans la direction des agents montrent un écart directionnel. Essayer d'assembler un système modulaire multimodal de style Web2 avec une structure décentralisée représente en réalité un décalage technique et de pensée. Aujourd'hui, avec une forte couplage des modules, une distribution des caractéristiques instable et une demande de puissance de calcul concentrée, le modulaire multimodal a du mal à trouver sa place dans Web3.
L'avenir de l'IA Web3 ne devrait pas se limiter à l'imitation, mais devrait adopter une stratégie d'escarmouche. De l'alignement sémantique dans des espaces de haute dimension, aux goulots d'étranglement de l'information dans les mécanismes d'attention, en passant par l'alignement des caractéristiques sous des puissances de calcul hétérogènes, l'IA Web3 doit s'appuyer sur le principe tactique de "l'encerclement des villes par les campagnes".
Les défis auxquels est confronté le Web3 AI
Difficulté d'alignement sémantique
Le Web3 AI est basé sur un modèle multimodal aplati, ce qui rend difficile la réalisation d'un espace d'embedding de haute dimension. Cela entraîne un désalignement sémantique et des performances médiocres. Un espace d'embedding de haute dimension est essentiel pour comprendre et comparer différents signaux modaux, mais le protocole Web3 Agent a du mal à réaliser cela.
La plupart des agents Web3 ne sont que de simples enveloppes d'API prêtes à l'emploi, manquant d'un espace central d'intégration unifié et d'un mécanisme d'attention intermodules. Cela entraîne une incapacité à interagir de manière multilatérale et multilayer entre les modules, ne pouvant suivre qu'un pipeline linéaire, affichant une fonctionnalité unique et ne pouvant pas former une optimisation en boucle fermée.
La conception du mécanisme d'attention est limitée
L'espace de faible dimension limite la conception précise des mécanismes d'attention. Les modèles multimodaux de haut niveau nécessitent des mécanismes d'attention précis, ce qui nécessite un espace de haute dimension comme base.
La conception modulaire de l'IA Web3 rend difficile la réalisation d'une planification d'attention unifiée. Le manque de représentation vectorielle commune, de capacités de pondération et d'agrégation parallèles empêche la construction d'une capacité de "planification d'attention unifiée" comme celle du Transformer.
fusion des caractéristiques reste en surface
La modularité discrète des assemblages entraîne une fusion des caractéristiques qui reste à un stade statique superficiel. L'IA Web3 adopte souvent des assemblages de modules discrets, manquant d'un objectif d'entraînement unifié et d'un flux de gradients inter-modules.
Comparé aux méthodes de fusion complexes de l'IA Web2, les stratégies de fusion de l'IA Web3 sont trop simples et ont du mal à capturer des relations multimodales profondes et complexes.
Barrières et orientations de développement dans l'industrie de l'IA
Les barrières technologiques dans l'industrie de l'IA se renforcent, mais les points de douleur de l'IA Web3 ne se sont pas encore complètement manifestés. L'IA Web2 a investi massivement dans le développement de systèmes multimodaux, créant ainsi de solides barrières sectorielles.
Le développement de l'IA Web3 devrait suivre la tactique de "l'encerclement rural autour de la ville". Il devrait d'abord être testé à petite échelle dans des scénarios périphériques, en s'assurant que les bases sont solides avant d'attendre l'émergence de scénarios centraux. Les directions appropriées incluent des structures légères, des tâches facilement parallélisables et incitatives, telles que le réglage fin LoRA, les tâches d'entraînement post-alignement comportemental, l'entraînement et l'annotation de données par crowdsourcing, l'entraînement de petits modèles de base, ainsi que l'entraînement collaboratif sur des appareils périphériques.
Avant que les bénéfices de l'IA Web2 ne disparaissent complètement, l'IA Web3 doit choisir judicieusement ses points d'entrée, en se concentrant sur des projets capables de s'insérer par les marges, de combiner des points et des surfaces, de progresser de manière circulaire et d'être flexibles et agiles. Ce n'est qu'ainsi qu'elle pourra trouver sa place dans la compétition future de l'IA.