OpenAI представляет GPT-5: Революция в мире искусственного интеллекта с новыми возможностями

Компания OpenAI представила свою новую флагманскую модель ИИ, которая станет основой для следующего поколения ChatGPT.

GPT-5 доступна уже сегодня для всех пользователей.

https://t.co/rOcZ8J2btI pic.twitter.com/dk6zLTe04s

GPT-5 представляет собой первую “унифицированную” нейросеть, которая сочетает в себе режим последовательного рассуждения и быстрое реагирование, характерное для GPT. Уникальный маршрутизатор выбирает подходящий способ выполнения задачи: предоставить быстрый ответ или уделить больше времени на глубокое обдумывание для повышения качества результата.

В то время как GPT-4 могла отвечать на обширный спектр вопросов, GPT-5 уже способна выполнять задания от имени пользователя, такие как создание программного обеспечения, управление календарем или написание исследовательских отчетов.

Генеральный директор стартапа Сэм Альтман охарактеризовал GPT-5 как “лучший в мире модель” и “значительный шаг вперёд” на пути к разработке искусственного общего интеллекта, который может превзойти человека в трудозатратных областях.

Пользователи могут получить доступ к GPT-5 без подписки с определенными ограничениями. Для подписчиков Plus и Pro лимиты были увеличены.

На платформе API доступны три версии модели: GPT-5, GPT-5 mini и GPT-5 nano.

OpenAI позиционирует GPT-5 как лидера в различных сферах, и по многим показателям она превосходит технологии компаний Anthropic, Google DeepMind и xAI, хотя в некоторых направлениях уступает.

Одним из заметных достоинств новой модели является её способность к программированию. Она показала результат 74,9% в тесте SWE-bench Verified с первой попытки, обойдя Claude Opus 4.1 (74,5%) и Gemini 2.5 Pro (59,6%).

В одном из примеров GPT-5 создала интерактивный материал для объяснения сложных понятий, таких как эффект Бернулли, генерируя сотни строк кода всего за несколько минут. pic.twitter.com/cIU7O608TT

В другом случае модель разработала веб-приложение для изучения французского языка.

В тесте Humanity’s Last Exam, который оценивает способности ИИ в математике и гуманитарных науках, GPT-5 с расширенным мышлением (GPT-5 Pro) заработала 42%. Однако Grok 4 Heavy показал больший результат – 44,4%.

Илон Маск решил пошутить на тему OpenAI, написав:

“Суть в том, что Grok 4 Heavy был умнее две недели назад, чем GPT-5 сейчас, и G4H уже значительно лучше.” https://t.co/BrggsEwnuz

В тесте GPQA Diamond, состоящем из вопросов уровня докторантуры, GPT-5 Pro достигла 89,4% с первой попытки, обойдя Claude Opus 4.1 (80,9%) и Grok 4 Heavy (88,9%).

OpenAI утверждает, что GPT-5 лучше справляется с вопросами в области здравоохранения. Результаты в тесте HealthBench Hard Hallucinations показывают, что GPT-5 ошибается лишь в 1,6% случаев, что значительно меньше, чем у предыдущих версий GPT-4o и o3 (12,9% и 15,8% соответственно).

Компания также заявляет, что GPT-5 превосходит конкурентов в более субъективных и трудных для оценки областях, таких как креативный дизайн и написание текстов.

В общем, новая модель демонстрирует намного меньшую долю неправильных ответов – 4,8%. Это значительно ниже, чем у o3 и GPT-4o, которые “выдумывали” неверную информацию в 22% и 20,6% случаев соответственно.

В тесте Tau-bench, который оценивает способности ИИ в выполнении симулированных онлайн-задач, результаты GPT-5 оказались неоднозначными. В части теста, где требовалось перемещаться по сайту авиакомпании, модель показала 63,5%. У o3 результат составил 64,8%. В задаче по переходам между страницами розничных продавцов GPT-5 смогла добиться 81,1%, что ниже результата Claude Opus 4.1 (82,4%).

OpenAI отметила, что новая модель обладает повышенной безопасностью: она реже дает ложные ответы и лучше распознает потенциальных злоумышленников.

С релизом GPT-5 в ChatGPT появилась функция кастомизации, позволяющая настраивать стиль общения чат-бота. Теперь пользователи могут выбирать из предложенных типов личностей, таких как циник, робот, слушатель и ботаник, что автоматически влияет на формулировки ответов, устраняя необходимость каждый раз задавать желаемый тон общения вручную.

Среди других обновлений:

Напоминаем, что в августе OpenAI выпустила ИИ-модели с открытым исходным кодом, которые демонстрируют высокие показатели в ряде тестов и уже доступны для загрузки на Hugging Face.