Résultats de la recherche pour "CODEX"
Aujourd'hui
06:31

DeepSeek réduit les prix de V4-Pro de 75 % et fait chuter les coûts de cache d’API à un dixième

Message de Gate News, 27 avril — DeepSeek a annoncé une réduction de 75 % sur son nouveau modèle V4-Pro pour les développeurs et a réduit les prix des caches de requêtes d’entrée sur l’ensemble de sa gamme d’API à un dixième des niveaux précédents. Le modèle V4, publié le 25 avril en versions Pro et Flash, a été optimisé pour les processeurs Ascend de Huawei. DeepSeek a déclaré que V4-Pro surpasse les autres modèles open source sur des benchmarks de connaissances mondiales et se classe deuxième seulement derrière Gemini-Pro-3.1, le modèle propriétaire de Google. La famille V4 est conçue spécifiquement pour les agents IA qui gèrent des tâches complexes au-delà des capacités d’un chatbot. Les coûts de l’API V4-Pro sont déjà inférieurs à ceux des principaux concurrents occidentaux : 3,48 $ pour un million de tokens de sortie, contre pour GPT-4.5 d’OpenAI. La tarification V4-Flash s’élève à 0,14 $ par million de tokens d’entrée et à 0,28 $ par million de tokens de sortie, ce qui pourrait permettre des applications rentables telles que l’examen de l’ensemble d’une base de code ou de documents réglementaires en une seule requête.
Plus
05:17

GPT-5.5 revient à la pointe du codage, mais OpenAI change de benchmarks après avoir perdu face à Opus 4.7

Message de Gate News, 27 avril — SemiAnalysis, un cabinet d’analyse de semi-conducteurs et d’IA, a publié un benchmark comparatif d’assistants de codage incluant GPT-5.5, Claude Opus 4.7 et DeepSeek V4. Le principal constat : GPT-5.5 marque le premier retour d’OpenAI à la pointe dans les modèles de codage en six mois, avec des ingénieurs de SemiAnalysis qui alternent désormais entre Codex et Claude Code après s’être auparavant appuyés presque exclusivement sur Claude. GPT-5.5 repose sur une nouvelle approche de préentraînement codée « Spud » et représente la première expansion de l’échelle de préentraînement d’OpenAI depuis GPT-4.5. Lors de tests pratiques, une division claire des tâches est apparue. Claude gère la planification de nouveaux projets et la configuration initiale, tandis que Codex excelle dans les corrections de bugs axées sur le raisonnement. Codex fait preuve d’une meilleure compréhension des structures de données et d’un raisonnement logique, mais a des difficultés à inférer l’intention utilisateur ambiguë. Sur une tâche à un seul tableau de bord, Claude a reproduit automatiquement la mise en page de la page de référence tout en fabriquant de grandes quantités de données, tandis que Codex a ignoré la mise en page mais a fourni des données nettement plus exactes. L’analyse révèle un détail de manipulation du benchmark : dans un billet de blog de février, OpenAI a exhorté l’industrie à adopter SWE-bench Pro comme nouveau standard pour les benchmarks de codage. Cependant, l’annonce de GPT-5.5 est passée à un nouveau benchmark appelé « Expert-SWE ». La raison, dissimulée dans les petits caractères, est que GPT-5.5 a été dépassé par Opus 4.7 sur SWE-bench Pro et a chuté de manière significative par rapport à Mythos non publié de l’Anthropic 77.8%. Concernant Opus 4.7, Anthropic a publié une analyse post-mortem une semaine après la sortie, reconnaissant trois bugs dans Claude Code qui ont persisté pendant plusieurs semaines de mars à avril, affectant près de tous les utilisateurs. Plusieurs ingénieurs avaient déjà signalé une dégradation des performances dans la version 4.6, mais ils avaient été écartés en tant qu’observations subjectives. De plus, le nouveau tokenizer d’Opus 4.7 augmente l’utilisation de tokens jusqu’à 35 %, qu’Anthropic a admis ouvertement — ce qui revient effectivement à une hausse de prix cachée. DeepSeek V4 a été évalué comme « tenant le rythme avec la frontière mais sans la mener », se positionnant comme l’alternative la moins coûteuse parmi les modèles à code source fermé. L’analyse a également noté que « Claude continue de surpasser DeepSeek V4 Pro sur des tâches d’écriture chinoises à haute difficulté », en commentant que « Claude a gagné contre le modèle chinois dans sa propre langue. » L’article présente un concept clé : le prix des modèles doit être évalué par « coût par tâche » plutôt que par « coût par token ». Le prix de GPT-5.5 est le double de celui de GPT-5.4 input $5, output par million de tokens, mais il accomplit les mêmes tâches en utilisant moins de tokens, ce qui ne rend pas nécessairement le coût réel plus élevé. Les données initiales de SemiAnalysis montrent que le ratio input-to-output de Codex est de 80:1, inférieur à celui de Claude Code à 100:1.
Plus
03:53

Le ministre des Affaires étrangères de Singapour déploie un assistant IA sur mesure sur Raspberry Pi avec Claude Code

Message de Gate News, 27 avril — Le ministre des Affaires étrangères de Singapour, Vivian Balakrishnan, a récemment annoncé qu’il a construit un système d’assistant IA sur mesure, qu’il appelle « le deuxième cerveau du diplomate », fonctionnant sur un Raspberry Pi 5 (un micro-ordinateur de la taille d’une carte de crédit). Le système s’intègre à ses comptes WhatsApp et
Plus
02:06

Telegram lance un outil de création de bots IA sans code

Message de Gate News, 27 avril — Telegram a lancé un outil de création de bots IA sans code qui permet aux utilisateurs de créer et de personnaliser des chatbots sans connaissances en programmation. Les utilisateurs peuvent interagir avec le bot LobsterFather afin d’obtenir une clé API, puis l’intégrer à des plateformes telles que Telewer, GPTBots ou Lazy AI pour configurer le comportement et les fonctionnalités du bot via des options en point-and-click. L’outil prend en charge plusieurs modèles IA, notamment GPT et Llama. Les utilisateurs peuvent choisir le modèle de leur choix et personnaliser le style de conversation et la fonctionnalité du bot. La plateforme permet de créer un Master Bot capable de gérer et de distribuer des tâches à des sous-bots, ce qui le rend adapté au traitement de plusieurs groupes de chat ou de scénarios de demandes clients. La fonctionnalité s’intègre à Telegram Business, permettant aux bots d’agir comme des assistants autonomes. Les bots peuvent accueillir les nouveaux membres 24/7, filtrer les messages indésirables et répondre aux questions fréquemment posées, aidant les communautés à rester organisées et réactives. Telegram a souligné que les utilisateurs doivent être conscients des risques de sécurité des données de tiers lors de l’utilisation de ces intégrations, car les données du bot peuvent être traitées par des plateformes externes.
Plus
12:15

Le responsable produit de Drift, Minh Don, prévoit une relance de l’échange dérivé en mai ou juin

Message de Gate News, 25 avril — Le responsable produit de Drift Protocol, Minh Don, a annoncé des projets visant à relancer l’échange dérivé en mai ou juin, selon une déclaration faite sur le serveur Discord officiel. L’équipe va passer plusieurs semaines à optimiser la base de code, en supprimant et ajoutant des fonctionnalités qui, bien que modestes, devraient avoir un impact significatif.
Plus
DRIFT-4,79%
11:15

Le Tennessee devient le deuxième État américain à interdire les distributeurs automatiques de crypto à l’échelle de l’État, en vigueur le 1er juillet

Message de Gate News, 25 avril — Le Tennessee est devenu le deuxième État américain à interdire les distributeurs automatiques de crypto-monnaies à l’échelle de l’État après que le gouverneur Bill Lee a promulgué le projet de loi House Bill 2505 le 13 avril. La loi, adoptée à l’unanimité par les deux chambres, a été officiellement intégrée au code jeudi et entrera en vigueur le 1er juillet. La législation pr
Plus
BTC-1,72%
12:48

Anthropic annule les changements de Claude Code après une baisse de qualité ; tous les correctifs sont terminés

Message des Gate News, le 24 avril — Anthropic a reconnu une récente baisse de la qualité de Claude Code et a confirmé que tous les problèmes liés ont été résolus grâce à des retours en arrière et à des correctifs. Les problèmes provenaient de trois ajustements de produit et d’invites effectués entre début et mi-avril. Le 4 mars, la
Plus
01:46

OpenAI lance GPT-5.5, conçu pour les tâches d’agent et les flux de travail complexes

Message de Gate News, 24 avril — OpenAI a officiellement publié GPT-5.5, un modèle d’IA de nouvelle génération conçu pour gérer des objectifs complexes, l’intégration d’outils, l’auto-vérification et l’exécution de tâches en plusieurs étapes. Le modèle excelle dans l’écriture et le débogage de code, la recherche en ligne, l’analyse de données, la création de documents
Plus
08:33

Anthropic lance /ultrareview pour Claude Code : revue de code multi-agents basée sur le cloud

Message de Gate News, 23 avril — Anthropic a introduit /ultrareview (research preview), une fonctionnalité de revue de code multi-agents basée sur le cloud pour Claude Code. Les utilisateurs peuvent taper /ultrareview dans le CLI pour lancer un groupe d’agents de revue dans un environnement sandbox distant qui fonctionnent en parallèle afin d’examiner les différences entre la
Plus
14:00

Lancement d’Aethir Claw V1 : déployez des agents IA sans code en moins de cinq minutes

Message de Gate News, 22 avril — Aethir, fournisseur d’infrastructure décentralisée de cloud GPU, a lancé aujourd’hui la version 1.0 d’Aethir Claw, sa plateforme d’hébergement d’agents IA. La plateforme permet aux utilisateurs sans bagage technique de déployer et configurer des agents IA entièrement dans leur navigateur en moins de cinq
Plus
ATH-4,36%
USDC0,03%