3. Pembaruan gradien berkaitan dengan perhitungan dalam model yang diperbarui. Bahkan jika fungsi hadiah adalah "pilihan manusia", yang tidak selalu demikian ( misalnya RLAIF), cara model memperbarui hadiah bergantung pada bobot dan aktivasi model, dan
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
12 Suka
Hadiah
12
6
Posting ulang
Bagikan
Komentar
0/400
AirdropChaser
· 9jam yang lalu
Persamaan gradien terlihat bingung
Lihat AsliBalas0
DataPickledFish
· 9jam yang lalu
Ini terlalu rumit.
Lihat AsliBalas0
GateUser-7b078580
· 9jam yang lalu
Pembaruan gradien algoritme ini tidak masuk akal....
3. Pembaruan gradien berkaitan dengan perhitungan dalam model yang diperbarui. Bahkan jika fungsi hadiah adalah "pilihan manusia", yang tidak selalu demikian ( misalnya RLAIF), cara model memperbarui hadiah bergantung pada bobot dan aktivasi model, dan