OpenAI возвращает открытые ИИ-модели: новые достижения и вызовы в мире искусственного интеллекта

Компания OpenAI представила новые ИИ-модели с открытым исходным кодом, которые показали отличные результаты в различных тестах и теперь доступны для скачивания на платформе Hugging Face.

Выпущены две версии моделей:

Данный релиз является первым выходом языковых моделей OpenAI с открытым кодом с момента запуска GPT-2 более пяти лет назад — в 2019 году.

Представители компании подчеркнули, что их открытые модели могут использовать более мощные закрытые LLM в случае, если не способны решить задачу самостоятельно.

С начала своей деятельности OpenAI делилась исходным кодом своих нейросетей, но впоследствии перешла к закрытой модели разработки. Этот шаг обеспечил компании значительный доход от продажи доступа к своим продуктам через API.

В январе Сэм Альтман заявил, что OpenAI оказалась “не на той стороне истории” в отношении открытого программного обеспечения. Сегодня на компанию давит конкуренция со стороны китайских лабораторий, таких как DeepSeek, Alibaba и Moonshot AI, которые разработали несколько эффективных открытых моделей.

В июле администрация тогдашнего президента США Дональда Трампа призвала американских разработчиков искусственного интеллекта активнее делиться своими технологиями для способствования их глобальному внедрению, основываясь на американских ценностях.

В тесте по программированию на платформе Codeforces модели gpt-oss-120b и gpt-oss-20b продемонстрировали результаты в 2622 и 2516 баллов соответственно. Они обошли модель R1 от DeepSeek, но не смогли достичь уровня o3 и o4-mini.

На экзамене Humanity Last Exam, включающем разнообразные вопросы, результаты моделей составили 19% и 17,3%. Как и в предыдущем тесте, они уступили модели o3, но обошли передовые открытые разработки DeepSeek и Qwen.

На математическом соревновании AIME открытые модели набрали 96,6 и 96 баллов соответственно, показывая сопоставимые результаты с другими ИИ компании.

Открытые нейросети чаще выдают неверные ответы по сравнению с o3 и o4-mini. OpenAI отметила, что это «неудивительно, так как меньшие модели имеют ограниченные знания о мире».

Gpt-oss-120b и gpt-oss-20b ошиблись в 49% и 53% случаев в ответах на вопросы PersonQA — внутреннем стандарте для оценки знаний ИИ о людях. У o1 это значение составляет 16%, а у o4-mini — 36%.

OpenAI обучила новые открытые модели, используя те же технологии, что и для закрытых. Они работают на архитектуре mixture-of-experts, позволяя активировать лишь часть параметров для каждого запроса. Например, gpt-oss-120, обладающая 117 миллиардами параметров, использует 5,1 миллиарда на каждый токен.

Нейросети прошли обучение с применением методов высокопроизводительного обучения с подкреплением — этапа, на котором модели осваивают поведенческие паттерны в смоделированной среде. Для этого использовались мощные кластеры графических процессоров от Nvidia.

Этот процесс также применялся для подготовки серии o. Открытые модели имеют схожую структуру размышлений, требующую дополнительных временных и вычислительных ресурсов для подготовки ответов.

OpenAI утверждает, что открытые модели отлично подходят для поддержки ИИ-агентов, которые могут вызывать инструменты, такие как веб-поиск, или выполнять код на Python во время рассуждений. Однако они ограничены только текстовым форматом и не способны работать с изображениями или аудио.

Модели gpt-oss-120b и gpt-oss-20b были выпущены под лицензией Apache 2.0, что позволяет компаниям использовать открытые модели OpenAI для коммерческих целей без необходимости в оплате или получении разрешения от компании.

Тем не менее, OpenAI не раскрыла обучающие данные, использованные для создания своих нейросетей. Это решение не является сюрпризом на фоне судебных разбирательств против разработчиков ИИ за “неправомерное” использование данных для обучения.

OpenAI несколько раз откладывала выпуск открытых ИИ-моделей по соображениям безопасности. Компания изучала возможные сценарии, включая использование gpt-oss для кибератак и создания оружия.

Помимо этого, было проведено тестирование, в ходе которого модель продемонстрировала возможность небольшого увеличения биологических возможностей.

С выходом открытых ИИ-моделей OpenAI компания Amazon объявила, что они будут доступны на Amazon Web Services, что является первым случаем, когда нейросети стартапа представлены на этой платформе.

Microsoft также предлагает версии новых ИИ, оптимизированные для Windows.

В настоящее время OpenAI ведет переговора о продаже акций с инвесторами. Потенциальная оценка компании составляет $500 миллиардов, что позволит ей обойти SpaceX Илона Маска и стать самой дорогой частной технологической фирмой в мире, по информации Financial Times.

Компании известен последний раунд финансирования с оценкой $300 миллиардов, о котором стало известно в конце марта.

Тем временем ведутся обсуждения нового раунда с Thrive Capital и другими инвесторами. Если они успешно завершатся, OpenAI обойдет SpaceX, недавно оцененную в $400 миллиардов.

Издание сообщает, что OpenAI рассматривает идею вторичной продажи акций, чтобы текущие и бывшие сотрудники могли продать свои ценные бумаги. Условия размещения пока не определены и будут зависеть от интереса со стороны инвесторов.

Напомним, в июле OpenAI представила специальный режим для студентов в ChatGPT, который помогает разобрать задачи по шагам, а не просто получать готовые решения.