[Google ADK] 作業映像の評価をEvaluationで効率的に実行する
DRANK
この記事は ADK Advent Calendar 2025/12/14担当分の記事です。 AAA(ブレインパッドエーキューブ)の辻と申します、よろしくお願いします。データ活用を支援するBrainPadが2025年3月にAIエージェントサービスに特化した子会社BrainPad AAAを設立しまして、そこで代表取締役 CEOを務めさせていただいています。はじめに2025年は様々なAIエージェントが搭載されたサービスが登場しました。Zendeskのようにチケットを一次対応してくれるものから、営業代行してくれるものまで様々なサービスが出てきた印象です。ただ、それらのサービスの多くはその出力結果に関する品質の全てをユーザーに委ねている側面があるのもまた事実ではないでしょうか。今後、AIエージェントサービスがビジネスで本当に普及していく上では、サービサー側がある程度、意思決定に資する情報に対する品質を担保したり、出力品質を保証する必要が出てくると考えています。でなければ、それぞれのエンドユーザー企業が最新の生成AIのAPIを利用して自分たち(実際には個々の従業員が)で品質管理すればいいだけになってしまうので。。。しかし、従業員による評価に頼るAIエージェントの利用方法には根本的な課…