ネットサービス

OpenAIの元エンジニアが設立したAIスタートアップが第2世代チャットAIの「Claude 2」を発表、チャットでコードを記述させるデモ動画も公開中


話題のチャットAI「ChatGPT」を開発したOpenAIの元社員が設立したAIスタートアップのAnthropicは2023年3月、自社開発のチャットAI「Claude」を公開しました。新たに7月11日、AnthropicがClaudeの第2世代である「Claude 2」を発表し、チャットによる指示でコードを記述させるデモ動画も公開しています。


Anthropic Claude 2
https://www.anthropic.com/index/claude-2

Anthropic releases Claude 2, its second-gen AI chatbot | TechCrunch
https://techcrunch.com/2023/07/11/anthropic-releases-claude-2-the-second-generation-of-its-ai-chatbot/

Claudeは開発者コンソールのチャットインターフェイスにAPIを介してアクセスし、さまざまな会話やテキスト処理タスクを実行できるチャットAIです。実際にClaudeを使用したユーザーからは、その他のチャットAIよりも有害な応答を生成する可能性が低く、過去の会話をより長く記憶していると評価されています。


カリフォルニア大学やカーネギーメロン大学が設立した研究組織「Large Model Systems Org(LMSYS Org)」が5月に公開したチャットAIのベンチマークランキングでは、GPT-4ベースのChatGPTに次ぐ2位にClaudeがランクインしました。Claudeのユーザーはプロンプトに最大10万トークンのデータを入力することができるため、数百ページにわたる文献や書籍を一度に扱うことが可能な点も特徴です。

対話型チャットAIのベンチマーク番付で1位はGPT-4ベースのChatGPTで2位はClaude-v1、GoogleのPaLM 2もトップ10にランクイン - GIGAZINE


そして7月11日、AnthropicはClaudeの新しいモデルである「Claude 2」を発表しました。Anthropicは、「Claude 2はパフォーマンスが向上し、より長いレスポンスが可能になりました」「Claude 2は私たちのチャット体験を強化するものとなっており、アメリカとイギリスで一般提供されています。今後数カ月以内に、さらに多くの国々で利用できるように取り組んでいます」と述べています。

Cloude 2は、北米の大学院進学に必要なGraduate Record Examination(GRE)の読み書き試験で受験者の上位10%に入る点数を獲得したほか、USMLE Medical Exam(アメリカの医師免許試験)でも選択式問題で合格点を取ることができました。また、Multistate Bar Examination(全米共通司法試験)の選択式問題では前世代のCloudeが正答率73%だったのに対し、正答率が76.5%に達したとのことです。


さらに、Claude 2は前世代よりもコーディングスキルが大幅に向上しており、PythonのコーディングテストであるCodex HumanEvalで前世代が56%のスコアを記録したのに対し、Claude 2は71.2%のスコアを記録したとAnthropicは述べています。また、小学生レベルの算数問題であるGSM8kの正答率も、前世代の85.2%から88%に向上しているそうです。

実際にAnthropicは、Claude 2にインタラクティブマップのコードを記述させるデモムービーをTwitter上で公開しています。


「マップ上の国名にカーソルを合わせたらデータが表示されるようにしたい」と考えた場合、Claude 2にコーディングを指示することができます。


「データの視覚化を手伝ってほしい」とClaude 2に伝えると、どんなデータを処理したいのかを尋ねてきます。


データをアップロード。


すると、Claude 2は自動でデータを分析してくれます。


「マウスカーソルを合わせたら数値が表示されるコードを書いてほしい」と伝えると、Claude 2がコードを記述してくれました。


コードの要点についてもまとめてくれます。


このコードをコピー&ペーストして実行。


すると、マップ上でカーソルを国に合わせると数値が表示されるようになりました。


Claude 2はウェブと有料APIの両方で使用可能ですが、記事作成時点ではアメリカとイギリスのユーザーのみに展開されています。Anthropicの市場展開責任者であるSandy Banerjee氏はテクノロジー系メディアのTechCrunchに対し、「これらのシステムを市場に展開し、人々が実際にどのように使用しているかを理解することが重要だと考えています」と述べ、今後も継続的にパフォーマンスの向上に努めていくと主張しました。

この記事のタイトルとURLをコピーする

・関連記事
ChatGPT対抗のチャットAI「Claude」が公開、Googleが支援するOpenAIの元社員が設立したAIスタートアップが開発 - GIGAZINE

OpenAIの「ChatGPT」と元OpenAIエンジニアが開発した「Claude」の性能を比較した実験結果 - GIGAZINE

対話型チャットAIのベンチマーク番付で1位はGPT-4ベースのChatGPTで2位はClaude-v1、GoogleのPaLM 2もトップ10にランクイン - GIGAZINE

Anthropicのテキスト生成AI「Claude」がOpenAIのGPT-4の約3万2000トークンの3倍近い10万トークンに対応して長文の入力も可能に - GIGAZINE

ChatGPTに匹敵する性能の日本語対応チャットAI「Vicuna-13B」のデータが公開され一般家庭のPC上で動作可能に - GIGAZINE

ChatGPTなどのチャットAIがどんな風に文章をトークンとして認識しているのかが一目で分かる「Tokenizer」 - GIGAZINE

ChatGPT上でコードを実行してデータ分析やグラフ化が可能な「コードインタプリタ」機能が追加、「誰でもデータアナリストになれる」時代の到来か - GIGAZINE

OpenAIが「GPT-4」を一般公開し誰でも利用可能に、ChatGPT内でコードを実行する機能も正式リリース - GIGAZINE

in ソフトウェア,   ネットサービス,   動画, Posted by log1h_ik

You can read the machine translated English article here.