Ingenieros de Ant analizaron el código fuente de Claude, revelando el mecanismo de la línea de decisión de cuatro niveles en el modo automático

Noticias de Gate News, el 25 de marzo, ingenieros de Ant Group, autores del framework frontend Umi.js, realizaron ingeniería inversa del código fuente de Claude Code 2.1.81 y restauraron completamente el mecanismo de decisión en Modo Automático. El hallazgo principal: cada llamada a herramienta pasa por una línea de cuatro decisiones, y solo cuando las tres primeras no puedan determinar, se invoca un clasificador de IA independiente para la revisión de seguridad.

La línea de decisiones consta de cuatro niveles: el primero verifica las reglas de permisos existentes, y si hay una coincidencia, se permite directamente; el segundo simula el modo acceptEdits (permiso para editar archivos), y si en este modo se aprueba, indica un riesgo muy bajo y se omite el clasificador; el tercero revisa la lista blanca de herramientas de solo lectura (Read, Grep, Glob, LSP, WebSearch, etc.), que no modifican ningún estado y se permiten sin condiciones; si ninguna de estas condiciones se cumple, se pasa al cuarto nivel, que envía una solicitud API independiente a Claude Sonnet para clasificación de seguridad.

Los detalles clave del diseño del clasificador incluyen: usar siempre Sonnet en lugar de Opus, como un equilibrio entre costo y latencia; establecer la temperatura en 0 para garantizar resultados deterministas; el clasificador se define como un «monitor de seguridad para agentes autónomos de programación IA», protegiendo contra tres tipos de riesgos (inyección de prompts, propagación de alcance, daños accidentales); el archivo de configuración CLAUDE.md del usuario se inyecta en el contexto del clasificador, sirviendo como base para interpretar la intención del usuario.

Las reglas de bloqueo cubren más de 22 categorías, incluyendo force push, push directo a la rama main, descarga y ejecución de código externo, despliegue en producción, fuga de datos, modificación de permisos, creación de vectores de ejecución remota, filtración de credenciales, etc. Las excepciones de permiso incluyen 7 tipos: claves codificadas de prueba, operaciones con archivos locales en el directorio de trabajo, solicitudes GET de solo lectura, instalación de dependencias declaradas, instalación de herramientas oficiales, lectura de credenciales de configuración enviadas al proveedor objetivo, y push a la rama de trabajo actual.

El sistema también implementa un mecanismo de corte: después de 3 rechazos consecutivos o 20 rechazos acumulados, el sistema pasa a modo de confirmación manual; en modo headless, se detiene directamente el agente. Cuando el clasificador no está disponible, una bandera de función controla si el sistema opera en modo «fail-closed» (rechazo directo) o «fail-open» (degradación a confirmación manual).

En modo Automático, la inyección de palabras clave de comportamiento tiene un control de frecuencia preciso: se inyecta cada 5 turnos de diálogo, y en cada ciclo de 5 inyecciones, la primera es la versión completa (aproximadamente 800 palabras, incluyendo instrucciones como «ejecutar inmediatamente, reducir interrupciones, acción sobre planificación» y otras seis directrices), mientras que las otras 4 son versiones resumidas en una línea, equilibrando el uso del espacio en la ventana de contexto y la estabilidad del comportamiento.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Los 30 socios de Web3 de Fireblocks gestionan más de $200B en flujos mensuales de stablecoins

Mensaje de Gate News, 26 de abril — Fireblocks, una plataforma líder de transferencia de activos a nivel institucional, opera una red de 30 socios comerciales de Web3 que abarca protocolos DeFi, liquidación de pagos, análisis de cumplimiento, instituciones de trading e infraestructura multi-cadena. El ecosistema de la asociación está

GateNewshace7h

Los ingresos del Q1 de Moore Threads se disparan un 155% interanual hasta $104M; cambia a la rentabilidad

Mensaje de Gate News, 26 de abril — Moore Threads informó unos ingresos de 738 millones de yuanes en el primer trimestre de 2026 (aproximadamente $104 million), lo que representa un aumento interanual del 155,35%. La empresa pasó a la rentabilidad con un ingreso neto de 29,36 millones de yuanes, en comparación con una pérdida de 112 millones de yuanes en el sa

GateNewshace8h

Las stablecoins no solo se usan para pagos transfronterizos, ¡también se localizan! Informe más reciente de a16z: Asia impulsa dos tercios del volumen de transacciones

El gigante de la inversión cripto a16z acaba de publicar el informe “9 charts on what stablecoins are becoming”, que con nueve gráficos clave describe el cambio estructural que está ocurriendo en las stablecoins. La conclusión central de este informe no es la aparición de nuevos tokens o una nueva narrativa, sino la transición del papel de las stablecoins de “herramienta de transacciones” y “medio de ahorro” hacia “infraestructura financiera central”, y además cada vez más localizada, con una brecha clara entre lo que el mercado imaginaba originalmente para los pagos transfronterizos. El GENIUS Act de EE. UU. impulsa el volumen de operaciones con stablecoins a 4,5 billones de dólares en el trimestre 4 Durante muchos años, la incertidumbre regulatoria ha sido el techo de la participación institucional en las stablecoins. El punto de inflexión proviene del GENIUS Act de Estados Unidos, que establece el primer marco a nivel federal para la emisión de stablecoins. Los datos de a16z muestran que, antes de la aprobación del proyecto de ley, el volumen de operaciones de stablecoins ajustado ya llevaba varios trimestres en una tendencia

ChainNewsAbmediahace9h

Banco Central de Brasil: Las stablecoins dominan las compras de criptomonedas por más de $6.9 mil millones registradas en el 1T

Según los datos divulgados por el Banco Central de Brasil, las compras de stablecoins representaron 6.800 millones de dólares de los 6.900 millones de dólares en criptomonedas compradas en el extranjero por brasileños durante el primer trimestre (Q1). Esto representa un aumento de más del 100% en comparación con el mismo período del año pasado. Ideas clave: El Banco Central de Brasil

Coinpediahace11h

Los stablecoins surgen como infraestructura financiera central, y se aceleran las tendencias de localización: informe de a16z

Mensaje de Gate News, 26 de abril — Según un informe de los investigadores de cripto de a16z Robert Hackett y Jeremy Zhang, los stablecoins están evolucionando desde instrumentos de trading en etapas iniciales y vehículos de ahorro hacia una infraestructura financiera central. La Ley U.S. GENIUS Act ha

GateNewshace18h

79% de los cajeros automáticos globales de cripto ubicados en Estados Unidos

Mensaje de Gate News, 25 de abril — Según Cointelegraph, el 79% de los cajeros automáticos de criptomonedas del mundo están ubicados en Estados Unidos.

GateNews04-25 16:03
Comentar
0/400
Sin comentarios