Искусственный интеллект в поисковых системах: Как проблемы с атрибуцией подрывают доверие к новостям

Опубликовано: March 9, 2025

Новое исследование обнаружило серьезные недостатки в том, как искусственный интеллект обрабатывает новостные цитаты, даже при наличии официальных соглашений с издателями. Согласно последним данным, почти 25% американцев стали использовать AI-поисковые системы вместо традиционных, однако эти технологии зачастую не обеспечивают должной атрибуции источников. Исследование, проведенное Центром цифровой журналистики Колумбийского университета Tow, проверило восемь AI-поисковых систем, таких как ChatGPT, Perplexity и Google Gemini, прося их указать заголовки, источники, даты публикации и URL из случайных новостных статей.

Результаты исследования оказались неутешительными: более 60% запросов дали неверные ответы. Perplexity показал наименьшее количество ошибок — 37%, тогда как у Grok 3 было зафиксировано 94% неправильной атрибуции.

Интересно, что платные версии, такие как Perplexity Pro и Grok 3, оказались менее точными, чем их бесплатные соперники. Они старались ответить на большее количество запросов, но чаще предоставляли ошибочную информацию вместо того, чтобы признать собственное незнание.

Некоторые AI-системы игнорировали настройки протокола исключения, установленные издателями. К примеру, Perplexity имела доступ к контенту National Geographic, несмотря на явное блокирование краулеров со стороны издателя.

Даже наличие партнерств между издателями и AI-компаниями не устранило проблемы с атрибуцией. ChatGPT, несмотря на сотрудничество с Hearst, правильно указал лишь одну из десяти статей San Francisco Chronicle. Кроме того, Perplexity часто ссылался на синдицированные версии статей Texas Tribune, а не на оригиналы.

Исследование продемонстрировало, что AI-поисковые системы часто перенаправляют пользователей на платформы синдикации, такие как Yahoo News, вместо оригинальных источников. В более чем половине случаев Grok 3 и Google Gemini генерировали несуществующие URL-адреса.

Марк Ховард, главный операционный директор журнала Time, отметил, что компании, занимающиеся разработкой AI, работают над улучшением своих технологий, однако предостерегает от ожиданий идеальной точности от доступных бесплатных сервисов: «Если кто-то считает, что любой из этих бесплатных продуктов будет на 100% точным, то ему должно быть стыдно».

Отдельное исследование BBC, проведенное в начале этого года, также выявило аналогичные проблемы с AI-помощниками, обрабатывающими новостные запросы, включая фактические ошибки и недостаточную точность при выборе источников.