7月27日、NVIDIAはAWSのAmazon EC2 P5インスタンスでNVIDIA H100 GPUを利用可能になったことを発表しました。これにより、AWSユーザーは高性能なAIアプリケーションをスケーリングし、新しい生成AIのユースケースを開発することができるようになりました。
P5インスタンスはAIタスクに最適化
Amazon EC2 P5インスタンスは、AIのトレーニングや推論などの高度なタスクに最適なインスタンスです。
特に大規模な言語モデルやコンピュータビジョンモデルのトレーニングや推論に使用されます。
EC2 UltraClusterとの組み合わせで高性能な環境を構築
P5インスタンスは、高性能なコンピューティング、ネットワーキング、ストレージから構成されるEC2 UltraClusterと呼ばれるハイパースケールクラスタに展開することができます。
また、P5インスタンスは、AWS EFAによってパベットスケールのノンブロッキングネットワークを備えており、最大20,000のNVIDIA H100 GPUを使用することができます。
高いパフォーマンスとスケーラビリティの提供
P5インスタンスは、高度なAIアプリケーションの開発や展開において、高いパフォーマンスとスケーラビリティを提供します。
また、NVIDIA AI Enterpriseとの組み合わせにより、P5インスタンスの最適化と機能強化が可能で、セキュリティモニタリングやパッチ適用、エンタープライズサポートなども提供されます。
NVIDIA AI Enterprise ー P5インスタンスの最大限の活用を支援するソフトウェアスイート
NVIDIA AI Enterpriseは、P5インスタンスを最大限に活用するためのソフトウェアスイートです。
100以上のフレームワーク、事前学習済みモデル、AIワークフロー、AIインフラストラクチャの調整ツールを提供し、開発者はP5インスタンスのパフォーマンスを最大限に引き出し、効率的なAI開発を行うことができます。
既にAnthropic、Cohere、Hugging Face、Pinterestなどの顧客によってP5インスタンスが利用されており、次世代のLLMや関連製品の構築に必要なスケーラビリティと高いコストパフォーマンスを実現することが期待されています。
詳しい内容は以下のリンクを参照してください。
NVIDIA H100 GPUs Now Available on AWS Cloud