OpenAIがAI応答コストを半減——独自チップ「Jalapeño」開発と4つの最適化技術で、NVIDIAへの依存を分散する
DRANK

7月3日、Techstrong.AIが「OpenAI Slashes AI Inference Costs by Half in Major Shift in Infrastructure Economics: Report」と題した記事を公開した。OpenAIのエンジニアチームが推論コストを50%超削減することに成功し、一時期はログアウト状態のユーザーや無料プランのChatGPTトラフィックを数百枚程度のNVIDIA GPUだけで処理できる水準にまで到達したという。さらに独自の推論チップ「Jalapeño」の開発も明らかになり、AIインフラの経済構造が大きな転換点を迎えつつある。

by @tf_official
Related Topics: AI Machine Learning Amazon Web Services