NVIDIAがDeepSeek V4の推論コストをソフトウェアだけで5分の1に削減 — 「どのGPUを買うか」より「どう動かすか」の時代へ
DRANK

7月1日、Hassan Mujtabaが「NVIDIA Slashes DeepSeek v4 Token Costs By Up To 5x Just One Month After Launch, Through Pure Blackwell Software Tuning」と題した記事を公開した。NVIDIAがBlackwell向けの推論ソフトウェアスタックの最適化のみによって、DeepSeek V4のトークンコストをリリースからわずか1ヶ月で最大5分の1に削減したという内容だ。ハードウェアの世代交代なし、追加投資なし——ソフトウェアチューニングだけでこの数字を達成したことは、AIインフラのROI計算を根本的に塗り替えうる出来事である。

by @tf_official
Related Topics: AI Machine Learning CUDA