GPT-5: Революция в кибербезопасности с беспрецедентной эффективностью обнаружения уязвимостей

Аналитики компании XBOW провели исследование и обнаружили, что модель GPT-5 от OpenAI достигла значительных успехов в сфере кибербезопасности. Результаты её тестирования оказались вдвое выше, чем у предыдущих версий.

Исследователи задействовали ИИ для сканирования тестовых объектов на предмет уязвимостей и оценки возможности их эксплуатации. В последующем они оценили как эффективность действий, так и показатели, предоставляемые нейросетью.

OpenAI представила GPT-5 как умеренное усовершенствование с аналогичными характеристиками в тестах по кибератакам. Однако эксперты сделали вывод, что внедрение модели в платформу автономного тестирования на проникновение XBOW продемонстрировало значительный прогресс. Данная платформа создает сценарии, где пользователю необходимо взломать различные системы.

Тестирование показало, что агент на базе GPT-5 выявляет уязвимости в настоящих системах значительно быстрее и с большей точностью. В частности, он обнаружил 70% уязвимостей за один прогон, в то время как предшественник справлялся лишь с 23%.

GPT-5 более эффективно находит сложные уязвимости, такие как доступ к файлам, серверные запросы и межсайтовый скриптинг, а также реже ошибается в своих выводах.

Кроме того, для создания эксплойтов с GPT-5 потребовалось меньше итераций — 17 по сравнению с 24 у предыдущей версии.

Агент демонстрировал более сложные атаки и высокую степень точности. Исследования на платформе HackerOne подтвердили, что GPT-5 смог взломать почти в два раза больше целей за аналогичное время, чем его предшественники.

Улучшения в ИИ связаны с более развитым логическим мышлением и способностью GPT-5 к созданию сложных командных последовательностей, что делает её особенно эффективной для обнаружения уязвимостей, по мнению экспертов.

В то же время специалисты из SenseTime Research и S-Lab (NTU) провели анализ пространственного мышления GPT-5, сравнив его с человеческими навыками и другими ИИ, такими как Gemini 2.5 Pro, Qwen 2.5 и InternVL3. Результаты показали, что GPT-5 превосходит Gemini 2.5 Pro на 8-24%. Модель уже достаточно хорошо справляется с оценкой размеров и расстояний, а также с отношениями объектов в пространстве, однако ей все еще трудно выполнять такие задачи, как сопоставление разных ракурсов, сборка и деформация, обнаружение скрытых объектов и мысленная реконструкция сцен.