GPT-4oはどのように画像をエンコードしてトークンに分解しているのか?
ARANK

AIチャットサービス「ChatGPT」のモデルの1つ、GPT-4oは、人間から受け取ったテキストをまず「トークン」に処理した後、AIが扱いやすい数値ベクトルに変換して計算を行います。画像でも同様の処理を行いますが、その際にどのような処理をしているのか、プログラマーのオラン・ルーニー氏が推測しました。

gigazine.net
Related Topics: AI AI Text Generator