Saya merasa banyak orang salah memahami thinking dan mode biasa, menganggap thinking selalu baik, padahal tidak selalu. Mode biasa dilatih berdasarkan korpus, sementara thinking ditambahkan RL, jadi memilih mode yang berbeda untuk tugas yang berbeda adalah hal yang benar.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
21 Suka
Hadiah
21
5
Posting ulang
Bagikan
Komentar
0/400
GateUser-4745f9ce
· 19jam yang lalu
Model adalah alat, siapa yang peduli
Lihat AsliBalas0
SilentAlpha
· 08-14 11:08
Ayo bandingkan beberapa data.
Lihat AsliBalas0
StakeTillRetire
· 08-11 20:58
Saya sangat membenci takhayul seperti itu.
Lihat AsliBalas0
MiningDisasterSurvivor
· 08-11 20:50
Suckers lagi benar ya, model besar ini baru terlihat kualitasnya saat dibutuhkan.
Lihat AsliBalas0
HodlBeliever
· 08-11 20:44
Menurut analisis tren, pemilihan model juga harus mempertimbangkan ROI.
Saya merasa banyak orang salah memahami thinking dan mode biasa, menganggap thinking selalu baik, padahal tidak selalu. Mode biasa dilatih berdasarkan korpus, sementara thinking ditambahkan RL, jadi memilih mode yang berbeda untuk tugas yang berbeda adalah hal yang benar.