5月15日、Googleは新しいGemini 1.5 Proおよび1.5 Flashモデルを発表した。
昨年12月に初公開されたGemini 1.0モデルに続き、2月には1百万トークンのコンテキストウィンドウを備えたGemini 1.5 Proがリリースされ、さらなる機能拡張が行われてきた。今月は、Gemini 1.5 Proの改善に加えて、新しい1.5 Flashモデルが導入された。
Gemini 1.5 Proの改良と新しい1.5 Flashモデル
- Gemini 1.5 Pro: 翻訳、コーディング、推論などの主要な使用ケースにおいて一連の品質向上が行われ、より広範で複雑なタスクにも対応可能である。
- Gemini 1.5 Flash: この小型モデルは、応答時間が重要な高頻度タスクに最適化されている。
- 利用可能性: 両モデルはプレビュー版として本日より200以上の国と地域で利用可能であり、6月には一般提供される予定である。
- ネイティブなマルチモーダル対応: Gemini 1.5 Proおよび1.5 Flashは1百万トークンのコンテキストウィンドウを持ち、テキスト、画像、音声、ビデオを入力として組み合わせることができる。2百万トークンのコンテキストウィンドウを持つGemini 1.5 Proのプライベートプレビューにアクセスするには、Google AI StudioまたはVertex AIに参加する必要がある。
新しい開発者機能と価格オプション
- 新しい開発者機能: 開発者のフィードバックに基づき、ビデオフレーム抽出および並列関数呼び出しなどの新機能が追加された。6月にはGemini 1.5 Proにコンテキストキャッシングが追加される予定で、大きなファイルをモデルに一度だけ送信することで、長いコンテキストをより効果的かつ経済的に利用できるようになる。
- 価格: Google AI Studioで無料アクセスが提供される対象地域に加え、新しい従量課金制サービスのレート制限が引き上げられる。Google AI Studioの最新価格およびVertex AIの最新価格を確認することができる。
Gemmaファミリーの追加
Gemmaファミリーは、GoogleのGeminiモデルの研究と技術を基に作成されたモデル群であり、主に開発者や研究者向けに設計されている。これらのモデルは、多様なタスクに対応できるように最適化されており、高性能でありながら軽量で使いやすいのが特徴である。
- PaliGemma: 画像キャプション、ビジュアルQ&A、その他の画像ラベル付けタスクに最適化された最初のビジョン・言語オープンモデルであり、本日より利用可能である。PaliGemmaは、他の事前訓練されたGemmaバリアントであるCodeGemmaおよびRecurrentGemmaに加わる。
- Gemma 2: 6月にリリースされる次世代のGemmaは、より使いやすいサイズで業界トップのパフォーマンスを提供する。開発者や研究者が求める大きなモデルでありながら、効率的に動作するよう設計された新しいGemma 27Bモデルは、GPUや単一のTPUホストで効率的に実行できる。
これらのモデルは、開発者や研究者がより複雑なタスクに取り組む際のツールとして広く利用されている。Gemmaファミリーのモデルは、使いやすさと高性能を両立し、多様なニーズに対応できるよう設計されている。
初のGemini API開発者コンペティション
本日、初のGemini API開発者コンペティションが開始され、最も創造的で影響力のあるアプリケーションを募集している。プロジェクトの提出期限は8月12日であり、グランプリにはカスタムエレクトリックデロリアンが用意されている。
詳細はGemini 1.5 Pro updates, 1.5 Flash debut and 2 new Gemma modelsを参照していただきたい。