ChatGPT выходит за рамки текста: новые модели OpenAI способны интерпретировать изображения

ChatGPT выходит за рамки текста: новые модели OpenAI способны интерпретировать изображения
16:00, 17 Апр.

Компании OpenAI есть чем удивить своих пользователей: спустя всего два дня после анонса GPT-4.1, технологический гигант представил сразу две новые модели — o3 и o4-mini. Начиная с сегодняшнего дня, подписчики ChatGPT Plus уже могут опробовать обе новинки, которые, по заявлению OpenAI, «открывают новую эру в возможностях искусственного интеллекта, предлагая мышление через изображения».

Модель o3 позиционируется как самая продвинутая разработка OpenAI на данный момент в области рассуждений.

Разработчики особо подчеркивают её «выдающиеся успехи» в задачах, связанных с написанием кода, математикой и наукой.

В свою очередь, o4-mini выступает как более экономичная альтернатива, не уступающая, тем не менее, в эффективности решения задач в тех же областях. Однако, наиболее примечательной особенностью o3 и o4-mini является их способность использовать и комбинировать все инструменты, доступные в ChatGPT, включая генерацию изображений.

Впервые модели OpenAI могут не просто видеть изображения, но и интерпретировать их, «думать» о них, что значительно расширяет горизонты обработки визуальной информации.

Пользователи могут загружать изображения – будь то некачественные фотографии досок, диаграмм или набросков – и новые модели смогут понять их содержание и даже адаптировать их в процессе рассуждений.

Это открывает путь к решению сложных, многоступенчатых задач и, по словам OpenAI, приближает к созданию действительно автономно действующих систем.

Иллюстрация: Reuters «Сочетание передовых возможностей рассуждения с полным доступом к инструментам приводит к значительному росту производительности по академическим бенчмаркам и в решении реальных задач, устанавливая новый стандарт как в интеллекте, так и в практической пользе», – заявили в OpenAI.

В дополнение к новым моделям, OpenAI также анонсировала Codex CLI – нового агента для написания кода, аналогичного Claude Code.

Этот инструмент изначально поддерживает o3 и o4-mini, а в скором времени получит поддержку и GPT-4.1. Нынешний анонс стал неожиданностью после заявления Сэма Альтмана в феврале о смене курса развития компании.

Тогда Альтман говорил, что o3, представленная ещё в конце прошлого года, не будет выпущена как самостоятельный продукт. Однако в начале апреля планы изменились, и Альтман объявил о релизе o3 и o4-mini.

В своем аккаунте в X он объяснил «смену планов» желанием сделать GPT-5 «намного лучше, чем предполагалось изначально», а также трудностями с «плавной интеграцией всего» и стремлением обеспечить достаточные мощности для «беспрецедентного спроса».

Таким образом, обещанное Альтманом в феврале упрощение, вероятно, будет отложено до выхода GPT-5, который, по его словам, стоит ожидать в «ближайшие несколько месяцев».

Пока же пользователи ChatGPT Plus, Pro и Team могут начать работу с o3 и o4-mini уже сегодня.

В течение ближайших недель OpenAI также планирует запустить o3-pro – ещё более мощную версию флагманской модели рассуждений, которая будет доступна подписчикам Pro.

Рубрика: Техно и Гаджеты. Читать весь текст на www.ixbt.com.