メモリが潤沢ではないPCでローカルLLMにコーディング質問した結果

メモリが潤沢ではないPCでローカルLLMにコーディング質問した結果
BRANK

!同じ質問を異なるモデルに投げることで、モデルの得意な言語と不得意な言語、そして質問の仕方による回答品質の変化が明確に見えてきました。検証環境項目内容マシンMacBook Pro (2024, M3 Pro)チップApple M3 Proメモリ18GB (統合メモリ)OSmacOS TahoeOllama最新版エージェントgo-llm-agent (自作Goバイナリ)メモリ18GBの壁ローカルLLMを選ぶときにまず直面するのがメモリの制約です。Apple Siliconの統合メモリはCPUとGPUで共有されるため、モデルのサイズがそのまま使用可能メモリの上限に直結します。18GBのうちmacOS自体が3GB前後を使い、日常的なアプリケーションにも2〜3GBは必要です。つまりLLMに割けるメモリは実質12GB程度が上限です。実際に検証で確認したメモリの限界を以下にまとめます。モデルサイズ結果Qwen3.6:27b17GB他のアプリケーションが操作不能になり実用できませんでしたKimi K2.6最小量子化でも350GB以上1Tパラメータ(32Bアクティブ)のMoEモデルのため、18GBでは桁違いに足りません(クラウド経由の参考テスト結果は後述)Qwen3.6:27bは17GBのモデルを18GBのメモリに展開するため、macOSが使用するメモリとの競合でスワップが発生し、マウスカーソル…

zenn.dev 4 days ago

Open page

https://zenn.dev/okamyuji/articles/local-llm-ruby-pitfall-benchmark-18gb-mac