GeminiがComputer Use機能を標準搭載 — AIが「画面を見て操作する」時代が本格化
DRANK

6月24日、Googleが「Introducing computer use in Gemini 3.5 Flash」と題した記事を公開した。Gemini 3.5 FlashにComputer Use機能が組み込みツールとして統合され、ブラウザ・モバイル・デスクトップ環境を横断したエージェント自動化が可能になった。AIが「画面を見て操作する」機能が主力モデルの標準装備にComputer Use(コンピュータ操作)とは、AIエージェントが画面を「見て」内容を理解し、マウスやキーボード操作を通じて実際にアプリケーションを動かす機能だ。Anthropicが2024年10月にClaude向けにこの機能を公開して以来、エージェント型AIの実用化における重要な技術として広く注目を集めてきた。その後、OpenAIもOperatorでこの領域に参入しており、Computer Useは生成AI各社の競争軸のひとつとなっている。今回の発表で最も重要な点は、Googleがこれまでプレビュー版として独立した形で提供していたComputer Use機能を、Gemini 3.5 Flashの組み込みツールとして正...

by @tf_official
Related Topics: AI AI Text Generator Software testing