Eu acho que muitas pessoas interpretam errado o thinking e o modo normal, acreditando que o thinking é sempre melhor, mas na verdade não é. O modo normal é treinado com base em corpora, enquanto o thinking é adicionado com RL, portanto, escolher diferentes modos para diferentes tarefas é o correto.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
21 gostos
Recompensa
21
5
Republicar
Partilhar
Comentar
0/400
GateUser-4745f9ce
· 08-14 18:28
Modelo é apenas uma ferramenta, quem se importa?
Ver originalResponder0
SilentAlpha
· 08-14 11:08
Vamos fazer uma comparação de dados.
Ver originalResponder0
StakeTillRetire
· 08-11 20:58
O que mais odeio são superstições de moda.
Ver originalResponder0
MiningDisasterSurvivor
· 08-11 20:50
Os idiotas antigos acertaram de novo, o grande modelo só mostra a sua verdadeira face quando é necessário.
Ver originalResponder0
HodlBeliever
· 08-11 20:44
De acordo com a análise de tendências, a escolha do modelo também deve considerar o ROI.
Eu acho que muitas pessoas interpretam errado o thinking e o modo normal, acreditando que o thinking é sempre melhor, mas na verdade não é. O modo normal é treinado com base em corpora, enquanto o thinking é adicionado com RL, portanto, escolher diferentes modos para diferentes tarefas é o correto.