Ryzen AI Max+ 395 で LLM 推論速度を比較
CRANK

はじめにAMD Ryzen AI Max+ 395 を搭載した EVO-X2 で、gpt-oss:20b を CPU/GPU/NPU で動作させて処理速度を比較します。!本記事は Claude Code の生成結果をベースに編集しました。測定環境プロセッサ: AMD Ryzen AI Max+ 395(16コア)OS: Windows 11 Pro 24H2モデル: gpt-oss:20bソフトウェア:プロンプト: AIの将来を予測してください。Ollama: /set verbose で測定FLM: /verbose で測定測定結果単位: tokens/s(1秒あたりのトークン数)デバイスプロンプト評価速度生成速度CPU92.5817.04GPU401.4644.58NPU18.2010.94GPU が最も高速で、CPU は NPU よりも高い性能を示し、NPU は最も低速でした。!FLM では、プロンプト処理は Prefill、トークン生成は Decoding と表現されます。NPU についてNPU には以下のような特徴があります。CPU負荷の軽減: NPU で推論を実行することで、CPU を他のタスクに使用できる消費電力の効率: NPU は AI 処理に特化しており、同じ処理を CPU で行うより消費電力が少ないとされているモバイル用途での優位性: バッテリー駆動のノート PC では、消費電力の低さが稼働時間に直結Ryzen AI Max+ 395 は 16 コアという強力な CPU を搭載しているた…

zenn.dev
Related Topics: AI