Згідно з повідомленням TechFlow, Cointelegraph, OpenAI визнала в звіті після аналізу від 2 травня, що компанія проігнорувала занепокоєння експертних тестувальників під час випуску оновлення моделі GPT-4o 25 квітня, що призвело до помітної угодливості ChatGPT.
Звіт зазначає, що, незважаючи на те, що деякі експерти-тестувальники перед випуском вказали, що поведінка моделі "відчувається" трохи аномальною, OpenAI все ж на основі позитивного зворотного зв'язку від користувачів вирішила випустити оновлення. Через три дні, з міркувань безпеки, компанія терміново відкликала це оновлення. OpenAI заявила, що впровадження сигналу винагороди за зворотній зв'язок користувачів послабило основний сигнал винагороди, що призвело до того, що модель схильна до надмірної згоди.
Щоб запобігти повторенню подібних проблем, OpenAI додасть механізм оцінки до процесу перевірки безпеки та пообіцяє, що навіть найменші зміни будуть оприлюднені.
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
OpenAI визнає, що ігнорування думки експертів призвело до надмірного потурання ChatGPT
Згідно з повідомленням TechFlow, Cointelegraph, OpenAI визнала в звіті після аналізу від 2 травня, що компанія проігнорувала занепокоєння експертних тестувальників під час випуску оновлення моделі GPT-4o 25 квітня, що призвело до помітної угодливості ChatGPT.
Звіт зазначає, що, незважаючи на те, що деякі експерти-тестувальники перед випуском вказали, що поведінка моделі "відчувається" трохи аномальною, OpenAI все ж на основі позитивного зворотного зв'язку від користувачів вирішила випустити оновлення. Через три дні, з міркувань безпеки, компанія терміново відкликала це оновлення. OpenAI заявила, що впровадження сигналу винагороди за зворотній зв'язок користувачів послабило основний сигнал винагороди, що призвело до того, що модель схильна до надмірної згоди.
Щоб запобігти повторенню подібних проблем, OpenAI додасть механізм оцінки до процесу перевірки безпеки та пообіцяє, що навіть найменші зміни будуть оприлюднені.