3. Градієнтні оновлення стосуються внутрішніх обчислень моделі, яка оновлюється. Навіть якщо функції винагороди є "людськими виборами", чим вони не завжди є (, наприклад, RLAIF), спосіб, яким модель оновлюється на винагородах, залежить від ваг і активацій моделі, і

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 6
  • Репост
  • Поділіться
Прокоментувати
0/400
AirdropChaservip
· 4год тому
Градiєнтне рівняння здивувало
Переглянути оригіналвідповісти на0
DataPickledFishvip
· 5год тому
Це занадто складно.
Переглянути оригіналвідповісти на0
GateUser-7b078580vip
· 5год тому
Градієнтне оновлення цього Алгоритму є нерозумним....
Переглянути оригіналвідповісти на0
GweiWatchervip
· 5год тому
Внутрішні розрахунки занадто складні 8
Переглянути оригіналвідповісти на0
SilentObservervip
· 5год тому
Ця формула занадто важка...
Переглянути оригіналвідповісти на0
AllTalkLongTradervip
· 5год тому
Розмір градієнта - це все окультна наука.
Переглянути оригіналвідповісти на0
  • Закріпити