Google выводит технологии на новый уровень: обновленный Gemini Deep Think, ИИ для математических открытий и прорыв в дизайне лекарств

Компания Google объявила о модернизации режима размышлений Gemini 3 Deep Think. Этот инструмент задумывается как решение для сложных задач в области науки и инженерии.

В ходе проведенных тестов модель продемонстрировала лучшие результаты, чем GPT-5.2 от OpenAI и Claude Opus 4.6 от Anthropic, включая испытания на ARC-AGI-2 с визуальными головоломками, в MMMU-Pro для оценки мультимодальных навыков, Elo 3455 и «Финальном экзамене человечества».

«Мы обновили Gemini 3 Deep Think в тесном сотрудничестве с учеными и исследователями, чтобы эффективно справляться со сложными научными задачами, для которых часто нет четких рамок или единственно верного решения, а предоставленные данные могут быть неполными», — сообщается в блоге компании.

Gemini 3 Deep Think демонстрирует превосходные результаты в математике и программировании, а также «выдающиеся» достижения в естественных науках, таких как химия и физика. Обновленный инструмент способен решать задачи на уровне золотых медалистов международных олимпиад.

В рамках CMT-Benchmark модель показала результат 50,5%, подтверждая глубокие знания в теоретической физике.

«Помимо выдающихся результатов, Deep Think ориентирован на практическое использование: он помогает исследователям интерпретировать сложные данные и инженерам моделировать физические системы посредством кода», — отметили в Google.

Новая версия Deep Think теперь доступна в приложении Gemini для подписчиков Google AI Ultra, а также для некоторых разработчиков через Gemini API.

Подразделение Google DeepMind представило ИИ-агента Aletheia, который установил новый рекорд в бенчмарке IMO-ProofBench Advanced, решив 91,9% задач. Это испытание считается одним из самых сложных в математике.

Нейросеть построена на базе Gemini Deep Think и включает модуль верификации, который выявляет ошибки в черновиках решений и запускает итеративный процесс исправлений.

Ключевой особенностью агента является способность признавать, когда решение задачи невозможно, что помогает сэкономить время исследователей.

Aletheia применяет Google Search для поиска сложных научных материалов, снижая вероятность использования неверных ссылок и ошибок в вычислениях.

Среди достижений модели:

В DeepMind отметили, что успех Aletheia подтверждает актуальность законов масштабирования: в области доказательной математики качество продолжает улучшаться благодаря эффективному использованию агентов.

Дочерняя компания DeepMind — Isomorphic Labs — выпустила движок IsoDDE для разработки лекарств. В сложных тестах новинка продемонстрировала вдвое большую точность предсказаний по сравнению с AlphaFold 3.

AlphaFold 3 стал важным достижением, так как смог предсказывать трехмерные структуры белков и их взаимодействия с молекулами. IsoDDE же представляет собой совершенно новый уровень:

«IsoDDE предлагает масштабируемую платформу для ИИ-дизайна лекарств, обеспечивая необходимую точность предсказаний для работы с новыми биологическими системами», — говорится в блоге компании.

Напомним, в июле 2022 года алгоритм AlphaFold предсказал структуры более 200 миллионов белков, что является почти всем известным науке соединением, найденным в растениях, бактериях и животных.