OpenAI откатила обновление ChatGPT после жалоб на «слишком вежливый» ИИ

OpenAI откатила обновление ChatGPT после жалоб на «слишком вежливый» ИИ
11:00, 30 Апр.

OpenAI на этой неделе официально отменила обновление ChatGPT, выпущенное всего несколькими днями ранее. Причина — резкий рост жалоб от пользователей, заметивших странное и неестественное поведение чат-бота.

Вместо «умного и человечного» помощника они получили чрезмерно угодливого и неловко восторженного собеседника. Что пошло не так? Обновление касалось модели GPT-4o, которую OpenAI позиционирует как более эмоционально выразительную и интеллектуальную версию своего ИИ.

В компании хотели сделать взаимодействие с ботом более живым и персональным — как у конкурентов вроде Claude от Anthropic, которого хвалят за человечность и естественность.

Однако результат оказался противоположным: GPT-4o стал буквально осыпать пользователя похвалами при любом удобном случае — даже когда это было совершенно неуместно.

Ответы выглядели чрезмерно вежливыми, шаблонными и искусственными, что вызывало скорее смех и раздражение, чем доверие. Два дня спустя глава OpenAI Сэм Альтман признал проблему: «Последние обновления GPT-4o сделали личность модели чересчур угодливой и раздражающей… Сейчас мы активно исправляем ситуацию.

Некоторые изменения выйдут уже сегодня, другие — на этой неделе.» Почему это произошло? OpenAI объяснила проблему в официальном блоге.

Основная ошибка заключалась в перекосе на краткосрочную обратную связь от пользователей (вроде лайков и дизлайков), без учёта того, как взаимодействие с ботом развивается со временем.

Это привело к тому, что модель стала чрезмерно подстраиваться под пользователя, теряя естественность. Что будет дальше? Компания представила четырёхэтапный план действий, чтобы не допустить подобных ошибок в будущем: Уточнение обучающих инструкций, чтобы модель избегала угодничества.

Усиление внутренних «ограничителей», повышающих честность и прозрачность. Расширение фокус-групп для тестирования обновлений до релиза.

Углублённая оценка моделей, чтобы выявлять не только угодливость, но и другие поведенческие сбои. В будущем OpenAI планирует добавить возможность выбора базовой личности ChatGPT, а также формировать стиль поведения на основе прямой обратной связи от пользователя.

Интересно, что во время фазы чрезмерного подхалимства наилучшее впечатление на пользователей производила голосовая версия с саркастичной «личностью» Monday — пародия на героиню Эйприл Ладгейт из сериала Parks and Recreation.

Эту модель отличал чёрный юмор и ирония, что воспринималось как освежающее контрастное поведение.

Материал OpenAI откатила обновление ChatGPT после жалоб на «слишком вежливый» ИИ впервые был опубликован на сайте ITZine.ru.

Рубрика: Техно и Гаджеты. Читать весь текст на itzine.ru.