Один з інженерів, які працюють над Grok, щойно поділився деякими думками: версія 4.1 - це не просто оновлення, це стрибок. Вони занурилися в тижні роботи після навчання, використовуючи підкріплювальне навчання, щоб зробити модель гострішою, більш чутливою до того, що насправді хочуть користувачі. Результат? Вона навчається швидше, говорить плавніше, і, чесно кажучи, відчувається менш як машина. Фокус команди був чітким: посилити інтелект, точно налаштувати відповідність. Ніякої води, тільки сирі ітерації, поки не зійшлося.
Переглянути оригінал