DeepSeek: китайский стартап изменяет правила игры в AI с доступными и мощными языковыми моделями

DeepSeek совершает настоящую революцию в сфере искусственного интеллекта, предлагая доступные языковые модели, которые, по заявлениям компании, могут составить конкуренцию решениям таких крупных игроков, как OpenAI и Meta. Этот китайский стартап утверждает, что его основная модель R1 показывает «производительность, аналогичную» модели от OpenAI, а их новая многомодальная модель Janus Pro якобы превышает такие системы, как Stable Diffusion и DALL-E 3.

Конкурирующий с ChatGPT продукт от DeepSeek стремительно поднялся на вершины App Store, а сам стартап уже оказывает влияние на финансовые рынки. В частности, акции Nvidia снизились на 17 процентов, что привело к убыткам почти в 600 миллиардов долларов по рыночной капитализации 27 января. По данным CNBC, это оказалось крупнейшим падением за один день в истории американских фондовых рынков.

AI-ассистент DeepSeek основан на модели DeepSeek-V3, что дает возможность пользователям задавать вопросы, планировать поездки, генерировать тексты и выполнять другие задания. С ростом числа загрузок приложения, компании пришлось временно ограничить регистрацию пользователей, сославшись на «вредоносные атаки».

С момента своего основания в 2023 году Лянем Вэньфэном, DeepSeek привлек внимание благодаря разработке открытых AI-моделей, требующих значительно меньших затрат и ресурсов, чем миллиарды, которые расходуют такие компании, как OpenAI, Meta, Google и Microsoft. Если все заявления DeepSeek о производительности справедливы, это может продемонстрировать, что стартап сумел создать мощные AI-модели, несмотря на жесткие ограничения экспорта США, которые затрудняют поставки высокопроизводительных графических процессоров, таких как производимые Nvidia, в Китай.

Источник