Если конкуренция становится сотрудничеством: OpenAI и Anthropic исследуют модели друг друга для повышения безопасности ИИ

Компании OpenAI и Anthropic впервые осуществили взаимный обмен доступом к своим моделям для проведения независимого тестирования и создания стандартов оценки безопасности искусственного интеллекта. Исследователи получили временный доступ к API обеих компаний и протестировали их конкурентные системы.

Результаты испытаний выявили различия в применяемых стратегиях. Модели Claude Opus 4 и Sonnet 4 от Anthropic в около 70% случаев отказывались генерировать ответы в ситуации неопределенности. В то же время, модели OpenAI — o3 и o4-mini — склонялись к попыткам дать ответ, что, однако, приводило к большему количеству ошибок и галлюцинаций.

Руководители обеих компаний считают, что наилучший результат можно получить, сочетая преимущества обеих стратегий: чаще отказываться на сомнительные запросы, сократив при этом вероятность появления ложной информации.

OpenAI и Anthropic планируют продолжать подобные перекрестные проверки и приглашают другие исследовательские лаборатории к сотрудничеству.

Делегируйте рутинные задачи с помощью BotHub! Для работы с сервисом не потребуется VPN, и можно использовать российскую карту. Получите 100 000 бесплатных токенов для первых задач и начните работу с нейросетями уже сейчас!

Источник