7月1日、Hassan Mujtabaが「Etched Pulls 400+ Engineers From NVIDIA, TSMC & More to Build a New Frontier Inference Cluster For AI Which Is Already Worth $1B in Demand」と題した記事を公開した。AIスタートアップのEtchedが、NVIDIA・TSMCなど業界大手出身の400名超のエンジニアを擁してフロンティア推論クラスターを発表し、その核心にあるのが低電圧設計によるサーマルスロットリングの解消というアプローチだ。すでに10億ドル超の顧客需要を獲得しており、単なる技術発表にとどまらない実需に裏付けられた登場となっている。
背景:2023年創業、Transformer専用ASICから推論クラスターへ
Etchedは2023年創業のAIスタートアップだ。当初はTransformerに特化したASIC「Sorafix」路線で注目を集めたが、その後フロンティアモデル向けの推論インフラ全体を手がける方向へ戦略を転換している。推論アクセラレーター市場ではCerebrasやGroqといった専用チップベンダーがすでに存在感を示しており、EtchedはNVIDIA H100・B200系GPUが抱えるサーマルスロットリングと電力効率の課題を切り口に、差別化を図るポジションを取っている。
NVIDIA、Google、Broadcom、TSMC、SK Hynixなど半導体・AI業界の大手企業出身エンジニアを400名以上集め、チップ、ラック、ソフトウェア、先端製造手法を一体設計(co-design)するアプローチで「Frontier Inference Clusters」を発表した。
資金調達は4回の非公開ラウンドで合計8億ドルを調達しており、VentureTech Allianceからの戦略的出資も含まれる。今回の発表と同時に、TSMCのN4Pプロセス技術を使った最初のA0シリコンのテープアウト(設計データをファウンドリに送付し製造を開始するステップ)完了も明らかにされた。このテープアウトは今年前半に実施済みで、現時点はあくまでA0シリコン段階であり、ラックスケール製品の検証が進んでいる段階だ。
顧客からの需要はすでに10億ドル超に達している。
核心技術:2種類のカスタムチップ
Etchedのアーキテクチャの肝は、用途に応じて使い分ける2種類のチップにある。
LVI(低電圧推論)プロセッサ
高スループットワークロード向けのLow-Voltage Inference(LVI)チップは、既存のAIチップの半分の電圧で演算できる新アーキテクチャを採用している。
NVIDIA H100やB200のような既存のAIアクセラレーターはフル電圧動作時に消費電力が増大してサーマルスロットリング(熱による性能抑制)が発生し、ピークFLOPs(浮動小数点演算性能)の半分以下しか持続できないケースが多い。LVIはこの問題を低電圧設計で根本的に解消するアプローチを取っており、数兆パラメータ規模のスパースMoE(Mixture of Experts)モデルをサーマルスロットリングなしにピークFLOPsの80%で動作させることを実現したとEtchedは主張している。ただし現時点はA0シリコン段階であり、量産・実証を経た評価はこれからとなる。
CSM(クラスタースケールメモリ)
低レイテンシワークロード向けのCluster Scale Memory(CSM)は、HBM(高帯域幅メモリ)とSRAMのハイブリッド構成を採る共有メモリプールだ。
近年、デコード速度向上を目的に大容量SRAMブロックへの移行が進んでいるが、SRAMはFLOPsスループットやメモリ容量の面で劣るという課題がある。CSMはHBMの大容量とSRAM的な低レイテンシ特性を組み合わせた設計により、SRAM単体移行の欠点を補いつつ、コスト低減・高信頼性・歩留まり改善・熱特性の向上も実現したとEtchedは主張している。
2MWデータセンターと台湾工場を自社展開
インフラ面では、自社オフィスに2MWのデータセンターを構築済みで、台湾には24時間365日稼働のエンジニアリング工場も開設している。チップ、パッケージ、PCB、コールドプレート、インターコネクトまで一貫して自社開発・製造するという垂直統合型のアプローチだ。
今夏中に性能詳細とロードマップの追加情報を公開するとしており、早期顧客テストでは推論ワークロード全般でスループット・レイテンシ・電力効率においてSOTA(最先端)水準を達成したと述べている。
整理
| 項目 | 内容 |
|---|---|
| テープアウトプロセス | TSMC N4P |
| 調達総額 | 8億ドル(4回の非公開ラウンド) |
| 顧客需要 | 10億ドル超 |
| LVIの動作電圧 | 既存AIチップの約半分 |
| MoE持続性能 | ピークFLOPsの80%(スロットリングなし、同社主張) |
| 自社DC規模 | 2MW |
フロンティアモデルの推論コストと電力効率はAIインフラの最大課題の一つになっており、EtchedのアプローチはチップをGPUサーバーに差し替えるのではなく、チップからラック・ソフトウェアまでシステム全体を一体設計する点が差別化軸となっている。CerebrasやGroqとの競合も含め、推論専用チップ市場の構図がどう変化するか注目される。詳細はEtched Pulls 400+ Engineers From NVIDIA, TSMC & More to Build a New Frontier Inference Cluster For AI Which Is Already Worth $1B in Demandを参照していただきたい。