Cerebras расширяет горизонты AI, открывая шесть новых центров обработки данных в Северной Америке и Европе

Cerebras Systems намерена увеличить свои возможности в сфере искусственного интеллекта, строя новые центры обработки данных в Северной Америке и Европе.

Организация планирует сосредоточить 85% своих мощностей в США, где уже функционируют три объекта в Санта-Кларе, Стоктоне и Далласе. В ближайшие годы также откроются новые центры в Миннеаполисе (второй квартал 2025 года), Оклахома-Сити и Монреале (третий квартал), а также в Атланте и во Франции (четвертый квартал).

Эти центры будут использовать движки Cerebras wafer-scale, которые представляют собой специализированную архитектуру чипов, оптимизированную для задач, связанных с AI. По заявлению компании, их системы CS-3 способны обрабатывать до 40 миллионов токенов Llama-70B в секунду во время выполнения задач.

Центр в Оклахома-Сити будет включать свыше 300 систем CS-3. Он строится по стандартам уровня 3+, что обеспечивает защиту от торнадо и землетрясений, а также обеспечивает тройное резервирование электропитания. Ожидается, что его эксплуатация начнется в июне 2025 года.

Некоторые известные компании в области AI уже подписали контракты на использование инфраструктуры Cerebras, включая французский стартап Mistral с его помощником Le Chat и AI-мотором ответов Perplexity. HuggingFace и AlphaSense также выразили намерение работать с этой платформой.

Эта технология особенно полезна для рассуждающих моделей, таких как Deepseek-R1 и OpenAI o3, которые традиционно требуют значительного времени на вычисления и генерируют большое количество токенов во время своих процессов.

Расширение является частью обширной стратегии масштабирования Cerebras до 2025 года, при этом некоторые площадки будут работать совместно с эмиратской компанией G42. В Монреале дочерняя компания Bit Digital Enovum будет управлять объектом, который обещает в десять раз превышающую текущие графические процессоры скорость вывода, когда он заработает в июле 2025 года.

Cerebras Systems продолжает развивать уникальные чипы AI, основываясь на концепции использования целых пластин в качестве отдельных чипов, которые называются «Wafer Scale Engines». WSE-3 является третьим поколением данной технологии.

Системы уже применяются в таких учреждениях, как Аргоннская национальная лаборатория, Питтсбургский суперкомпьютерный центр и GlaxoSmithKline. Однако у них есть определенные ограничения: отсутствие поддержки нативной CUDA (стандарта Nvidia) и более низкая совместимость с серверами по сравнению с решениями от Nvidia.