«Будущее Интернета: Как ИИ-агенты Преобразуют Взаимодействие с Цифровым Пространством»

Искусственный интеллект может воплотить в жизнь видение британского информатика Тима Бернерс-Ли, согласно которому многие рутинные задачи будут выполнять ИИ-агенты. Об этом сообщает The Economist.

В 1999 году, всего через десять лет после создания всемирной паутины, Бернерс-Ли описал будущее, в котором «интеллектуальные агенты» возьмут на себя такие задачи, как составление планов и поиск информации, благодаря своему умению читать и интерпретировать данные.

С момента появления интернета он претерпел значительные изменения, однако взаимодействие с ним по-прежнему требует активного участия пользователя.

Современные большие языковые модели (LLM) способны менять эту картину. Они могут резюмировать документы, отвечать на вопросы, находить информацию и вести анализ. Тем не менее, им не хватает возможности самостоятельно выполнять действия.

По мнению технического директора Microsoft Кевина Скотта, создание полностью независимых цифровых помощников может произойти в ближайшем будущем. Основным препятствием на этом пути является необходимость в универсальном языке, позволяющем им взаимодействовать с онлайн-сервисами.

Веб-ресурсы обычно используют интерфейсы прикладного программирования (API) для взаимодействия с внешней средой, что может быть сложно для ИИ-агентов. Каждый API имеет свои особенности и требует изучения.

Чтобы ИИ-помощники могли действовать в интернете беспрепятственно, необходима стандартизация их коммуникаций. Протокол Model Context Protocol (MCP), разработанный ИИ-стартапом Anthropic, направлен на эту задачу.

По словам продуктового директора компании Майка Кригера, идея MCP возникла, когда они интегрировали Claude с Gmail и GitHub. Вместо индивидуальной интеграции каждого приложения компания стремилась создать универсальный свод правил.

Агент может запросить у сервера MCP информацию о действиях системы — например, бронирование билетов или отмену подписки, а затем выполнить запрашиваемое действие от имени пользователя.

Рассмотрим пример: пользователь решил организовать поездку из Лондона в Нью-Йорк. Для этого требуется координация, основанная на правилах, которые позволят цифровым помощникам идентифицировать друг друга, общаться и устанавливать доверие. Google предлагает протокол agent-to-agent (A2A) для таких взаимодействий.

В декабре Linux Foundation создала организацию Agentic AI Foundation (AAIF) для предотвращения фрагментации сектора ИИ-агентов на множество несовместимых продуктов.

Фонд будет служить нейтральной платформой для развития открытых проектов в области цифровых ассистентов. В его запуске активно участвовали компании как AWS, Bloomberg, Cloudflare, Google, так и множество других.

На текущий момент экосистема MCP охватывает свыше 10 000 активных публичных реестров.

Более 70% веб-сайтов, используемых агентами, разрабатывались для человеческого восприятия, где для поиска информации необходимо взаимодействовать с меню.

Microsoft разработала Natural Language Web (NLWeb), что упрощает доступ LLM к ресурсам.

Этот инструмент позволяет пользователям «разговаривать» с любым веб-ресурсом на естественном языке. Например, посетитель туристического сайта может задать вопрос о лучших вариантах отдыха для семьи с тремя детьми, и NLWeb предоставит ответ в привычной форме.

Каждый ресурс, подключённый к NLWeb, может функционировать как сервер MCP, предоставляя контент агентам, таким образом, связывая визуальный интернет с теми требованиями, которые необходимы ИИ-ассистентам.

С развитием ИИ-агентов возникает борьба платформ, которая напоминает конкуренцию браузеров в 1990-х годах. Тогда компании соперничали за контроль над доступом в интернет, а сейчас происходит новое переосмысление роли браузеров в свете интеграции цифровых помощников. OpenAI и Perplexity выпустили свои решения с ИИ-помощниками, которые могут отслеживать рейсы, анализировать документы и управлять почтой.

Их планы не ограничиваются лишь этим. OpenAI добавила возможность осуществления покупок через ChatGPT с некоторых сайтов и внедрила поддержку различных сервисов, таких как Spotify и Figma.

Такие шаги вызывают беспокойство у действующих игроков рынка. Amazon потребовала от Perplexity удалить браузер с интегрированным ИИ-агентом из своего магазина. Airbnb, в свою очередь, решила не сотрудничать с ChatGPT, так как «функция еще не готова».

Рынок рекламы также должен адаптироваться. Современный интернет строится на монетизации внимания пользователей, и такие гиганты, как Alphabet и Meta, являются главными выгодоприобретателями.

Дон Сонг, специалист по вычислительным системам из Калифорнийского университета в Беркли, предполагает, что маркетологи должны будут переключить фокус с пользователей на «внимание агентов». Методы могут остаться прежними: оптимизация рейтинг, таргетирование интересов и оплата размещения, но аудитория теперь станет алгоритмами.

Цифровые помощники могут значительно увеличить активность в интернете. Основатель стартапа Parallel Web Systems Параг Агравал подчеркивает, что интернет был создан для людей, читающих с характерной человеческой скоростью. У агентов таких ограничений нет: они способны сканировать тысячи страниц за секунды, переходить по ссылкам, которые могут упустить люди, и выполнять несколько задач одновременно.

Тем не менее существуют определённые риски. ИИ может совершать ошибки, как и человек, и могут возникнуть внешние угрозы, такие как вредоносные команды на веб-страницах.

Меры безопасности могут помочь минимизировать данные проблемы. Одна из таких мер включает ограничение доступа агентов лишь к надежным сервисам, а другая — установление жесткого ограниченного окружения для их действий. Для более чувствительных операций может потребоваться вмешательство человека.

Стоит напомнить, что в ноябре специалисты Microsoft устроили тестирование ИИ-агентов, выявив уязвимости, присущие современным цифровым помощникам.