Tenstorrent предлагает решения для генеративного искусственного интеллекта по разумным ценам – комментарии главного инженера Вэй-хана Лиена

3 июня 2024

Генеративный искусственный интеллект (ГИИ) и другие высокопроизводительные вычисления (HPC) становятся все более востребованными, но при этом растут и расходы на оборудование, инфраструктуру и энергопотребление. Многим компаниям, включая OpenAI, становится все труднее оплачивать эти расходы.

Важно сдерживать рост эксплуатационных затрат на ГИИ-системы. Пока технология находится на ранней стадии, многие компании завышают цены на свои продукты. Но выиграет тот, кто сможет снизить издержки – это позволит предложить более доступные решения и выйти на открытый для новых игроков рынок.

Вей-Хан Лиен, ведущий инженер процессоров в канадской Tenstorrent, разрабатывающей решения для ИИ и чипов, считает, что спрос на вычислительные мощности для генеративного искусственного интеллекта (ГИИ) будет расти в долгосрочной перспективе. Однако сама Tenstorrent придерживается противоположной стратегии – компания стремится предлагать свои решения по разумным, доступным ценам.

В 2023 году генеральный директор OpenAI, Сэм Альтман, заявил инвесторам, что для создания производственных мощностей по выпуску чипов для ИИ требуется 7 триллионов долларов. В ответ на это Джим Келлер, генеральный директор и основатель компании Tenstorrent, предложил альтернативные варианты решения этой задачи за менее чем 1 триллион долларов.

По словам Вэй-хана Лиена, основные конкуренты Tenstorrent сосредоточены на разработке и производстве самых передовых и дорогостоящих продуктов для обучения и использования моделей искусственного интеллекта. Лиен проводит параллель с «гонкой рабочих станций» в начале 2000-х годов, когда рабочая станция Sun Microsystems стоила 20 000 долларов.

Но, когда Intel начала предлагать микропроцессоры Pentium по цене 3000-5000 долларов за единицу, ситуация на рынке кардинально изменилась. Теперь все конкуренты стремятся к разработке и производству самых передовых и дорогих продуктов для ИИ. Тем не менее, Джим Келлер отмечает, что такая бизнес-стратегия, ориентированная на выпуск высокобюджетных решений, является совершенно нерациональной.

Дешевые чипы для ИИ

Как отмечает Вэй-хан Лиен, при разработке чипов для ИИ важен прагматичный и экономически эффективный подход. Это обусловлено тем, что современные центры обработки данных требуют огромного количества графических процессоров – около 32 000 единиц. Такие ограничения по энергопотреблению и размерам вынуждают искать более рациональные технические решения.

«Мы фокусируемся на прагматизме и контроле над расходами, – говорит Лиен. – Наши продукты могут достигать даже большей вычислительной мощности, чем решения Nvidia, но при этом они реализованы в более экономичных конфигурациях. Это позволяет предложить клиентам более доступные решения с оптимальным соотношением цены и производительности».

Для обработки данных систем ИИ требуются высокопроизводительные процессоры. При этом возникает необходимость обеспечить быстродействие ИИ-систем на уровне не менее 5 операций в секунду, но при меньших затратах, чем сейчас. Системные интеграторы должны управлять расходами на всех этапах – от разработки микросхем до энергоэффективности и охлаждения готовых решений.

Несмотря на широкое использование генеративных моделей ИИ от компаний OpenAI, Google и Anthropic, растет спрос на создание собственных локальных ИИ-систем. Это обусловлено требованиями кибербезопасности и сохранения коммерческой тайны.

Согласно отчету DIGITIMES, средняя цена на 3-нанометровую технологию TSMC составляет $20 000 за пластину, а на 2-нанометровую – $25 000 за пластину.

Хотя Nvidia является лидером на рынке ИИ-оборудования, конкуренты вроде AMD, Cerebras, Graphcore и Tenstorrent разработали альтернативные решения для ИИ-вычислений. Разве этой конкуренции недостаточно для снижения стоимости?

Для работы ИИ-чипов требуются высокоскоростная память и другие компоненты, которые нужно интегрировать в систему. Это означает, что для поставок серверов для ИИ-центров обработки данных необходимо тесное сотрудничество в цепочке поставок.

Но производственные мощности Hynix по HBM в основном уже зарезервированы до конца 2025 года, а Nvidia и Apple также забронировали все передовые производственные мощности по 3-нм и 4-нм технологиям. Как небольшие конкуренты, такие как Tenstorrent, могут обеспечить поставки при стабильности цен?

Прагматичный подход к экономической эффективности

«Когда мы разрабатываем новую продукцию, мы убеждаемся, что наша цепочка поставок способна ее производить», – отмечает Лиен. Его менеджеры тщательно проверяют возможность изготовления продукта по предлагаемой цене. «Я не могу продавать чип за $10, если его реальная себестоимость $50».

Ожидается, что рынок чипов для искусственного интеллекта вырастет до $125-150 млрд к 2030 году (Deloitte прогнозирует $50 млрд к 2024 году). Для достижения таких объемов производства ИИ-чипов вся сопутствующая инфраструктура должна соответствовать этому огромному спросу.

По словам Лиена, если ожидаемый рост рынка чипов ИИ до $125-150 млрд реализуется, одной компании NVIDIA будет недостаточно, и TSMC придется значительно расширять мощности только для обслуживания одного этого клиента. «Если рост ИИ будет таким стремительным, вся цепочка поставок должна быть готова к этому. Мы – небольшая компания, и не можем предъявлять слишком высокие требования к нашим поставщикам, но должны быть уверены, что они смогут нас обеспечить».

Поэтому Tenstorrent решила сотрудничать с более стабильными и надежными в плане производственных услуг компаниями Samsung и Rapidus, считает Лиен. «Именно поэтому мы никогда не будем использовать слишком дорогие и экзотические технологии».

Помимо разработки ИИ-чипов, Tenstorrent также инвестирует в создание процессоров на базе RISC-V, чтобы иметь более гибкие вычислительные возможности для будущих моделей ИИ. «Наша технология масштабирования ИИ, ЦП, памяти и ввода-вывода Chiplet дает нам гибкость для создания оптимальных ИИ-систем под будущие потребности, ведь ИИ все еще находится на ранней стадии развития».

По словам Лиена, программные стеки Tenstorrent с открытым кодом TT-Buda и TT-Metalium также конкурируют с решениями CUDA от Nvidia. «Да, мы конкурируем не только на аппаратном и программном уровне, но и в цепочке поставок. Это очень конкурентный рынок, полный возможностей, но мы уверены, что однажды ситуация на рынке нормализуется».