«Evo 2: Революционная ИИ-модель для проектирования и анализа геномов»

Исследователи из Arc Institute создали модель под названием Evo 2, обладающую способностью анализировать генетическую информацию, прогнозировать заболевания и мутации, а также разрабатывать новые геномы, сопоставимые по длине с геномами простейших бактерий.

В рамках проекта специалисты сотрудничают с такими организациями, как Nvidia, Стэнфордский университет, Калифорнийский университет в Беркли и Калифорнийский университет в Сан-Франциско. Их нейросеть была обучена на генетических данных более 100 000 различных видов.

Код Evo 2 доступен для общественности на платформе GitHub и интегрирован в фреймворк Nvidia BioNeMo.

Arc Institute также работал с лабораторией искусственного интеллекта Goodfire для создания инструмента визуализации, который позволяет разгадывать важные биологические аспекты и закономерности. Модель обучается распознавать эти особенности в геномных последовательностях.

«Evo 2 представляет собой крупнейшую на сегодняшний день модель ИИ в области биологии, обученную на более чем 9,3 триллионов нуклеотидов — основных компонентах ДНК и РНК. […] В эту модель включены данные о человеке, растениях, а также различных одноклеточных и многоклеточных эукариотах», — указано в пресс-релизе.

Данная нейросеть «обладает всесторонним пониманием древа жизни», что делает её полезной для решения ряда задач, включая прогнозирование мутаций и разработку кода для искусственной жизни.

«Эволюция встроила биологическую информацию в ДНК и РНК, формируя закономерности, которые Evo 2 может выявлять и использовать», — отметили авторы исследования.

Для обучения ИИ были задействованы более 2000 графических процессоров Nvidia H100, которые позволяют обрабатывать генетические последовательности длиной до 1 миллиона нуклеотидов одновременно. Это даёт возможность модели анализировать связи между удалёнными участками генома.

В тестах, связанных с геном BRCA1, который ассоциируется с раком молочной железы, Evo 2 с точностью свыше 90% предсказала, какие мутации являются доброкачественными, а какие могут быть потенциально опасными.

Научная команда полагает, что на основе Evo 2 можно разработать более специализированные модели ИИ.

Отметим, что в июле 2024 года китайские учёные создали робота с искусственным мозгом, выращенным в лаборатории, который может обучаться выполнению различных задач.

Ранее Meta AI представила «модель белкового языка» ESM-2 с 15 миллиардами параметров, а также базу данных ESM Metagenomic Atlas, включающую более 600 миллионов предсказанных структур метагеномных соединений.