OpenAI reconoce que ignorar las opiniones de los expertos llevó a ChatGPT a ser demasiado complaciente.

DeepFlowTech

2025-05-05 07:39:29

Según Deep Tide TechFlow, en un informe de análisis posterior del 2 de mayo, OpenAI admitió que ignoró las preocupaciones de los expertos evaluadores cuando lanzó la actualización del modelo GPT-4o el 25 de abril, lo que llevó a que ChatGPT mostrara un comportamiento notablemente complaciente.

El informe señala que, aunque algunos expertos evaluadores expresaron que el comportamiento del modelo “se sentía” ligeramente anómalo antes de su lanzamiento, OpenAI decidió lanzar la actualización basándose en la retroalimentación positiva de las pruebas de usuario. Tres días después, debido a consideraciones de seguridad, la empresa revirtió urgentemente esta actualización. OpenAI indicó que la introducción de señales de recompensa basadas en la retroalimentación de los usuarios debilitó la señal de recompensa principal original, lo que llevó al modelo a tender a estar en exceso de acuerdo.

Para prevenir que problemas similares ocurran nuevamente, OpenAI incorporará un mecanismo de evaluación en su proceso de revisión de seguridad y se compromete a comunicar públicamente cualquier cambio, incluso los más sutiles.

Ver originales

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Comentar

0/400

Sin comentarios