Ричард Саттон: Путь к истинному интеллекту требует возврата к основам ИИ

Ричард Саттон, один из пионеров обучения с подкреплением и лауреат премии Тьюринга, выразил мнение, что индустрия искусственного интеллекта утратила свои изначальные ориентиры.

«ИИ превратился в огромную отрасль, и в каком-то смысле заблудился», — делится своими размышлениями Саттон. По его словам, недавние успехи игнорируют базовые принципы, необходимые для создания подлинного интеллекта.

Учёный призывает вернуться к основам: «Что необходимо, чтобы вновь вернуться на путь к истинному разуму? Нам нужны агенты, которые способны на непрерывное обучение. Нам нужны модели мира и планирование. К тому же, необходимо обладать знаниями, которые можно осваивать на высоком уровне, а также умением учиться обобщать».

Саттон, работающий в Google DeepMind, поддерживает критику среди исследователей, выступающих против чрезмерной сосредоточенности на масштабировании больших языковых моделей (LLM). Он убеждён, что истинный интеллект формируется на основе личного опыта — через взаимодействие агента с окружающим его миром. Совместно с Дэвидом Сильвером он недавно выпустил статью, в которой утверждает, что ИИ должен обучаться через действия, а не просто обрабатывать бесконечные объемы текста.

По мнению Саттона, современные модели действуют противоречащим образом: знания внедряются на стадии разработки, а не возникают в процессе обучения. Он снова ссылается на свою известную «горькую истину»: победу в области ИИ одерживают масштабируемые общие методы, а не искусственно создаваемые знания.

Согласно его анализу, главной проблемой современных систем является их неспособность к непрерывному обучению. Они страдают от катастрофического забвения: новая информация вытесняет старую, что лишает модель способности к долговременному обучению.

Для решения этой проблемы Саттон предлагает архитектуру Oak (Options and Knowledge — “Опции и знания”), ориентированную на создание агентов, потенциально способных достичь сверхинтеллекта через опыт.

Oak основывается на трёх ключевых принципах: во‑первых, агент должен быть универсальным, без заранее заданного объёма знаний о мире; во-вторых, всё обучение должно осуществляться исключительно через опыт: через наблюдения, действия и получение вознаграждений; в-третьих, существует гипотеза вознаграждения: любую цель можно превратить в задачу максимизации простого сигнального ответа.

В центре Oak находится замкнутый цикл: агент формирует более высокоуровневые абстракции на основе полученной обратной связи. Эти свойства, способствующие планированию и решению задач, становятся основой для ещё более абстрактных знаний. Этот процесс открыт и теоретически безграничен, его ограничивает лишь вычислительная мощность. Саттон считает, что именно он может прокладывать путь к сверхразуму.

Однако на данный момент Oak остается лишь идеей. Всё упирается в отсутствие алгоритмов, позволяющих осуществлять непрерывное, стабильное обучение без потерь ранее приобретенных знаний. «Надёжное “вечное обучение” — это тот недостающий элемент, который необходим», — убеждён учёный. Полную техническую лекцию Саттона можно просмотреть здесь.

Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш телеграм: BotHub AI News.