生成AIブームが「一言でいえば薄っぺらい」のはなぜか? AI研究者が語る「ChatGPTの10年前」

RTRMADP_3_HANS-LUCAS

Riccardo Milani / Hans Lucas via Reuters

2022年〜2023年にかけて起こった、画像生成AIやChatGPTを始めとする大規模言語モデルの日常化は、私たちのライフスタイルをどう変えていくのでしょうか?

AIの研究者でプログラマーの清水亮氏は、「生成AI」のような可能性を考えはじめたのは、生成AIブームのはるか前の約10年前からだと言います。

今のAIの最前線が興味深いのは、最先端の成果が「企業」から生まれるのではなく、AIで遊ぶ「趣味人(ホビイスト)」たちから、驚くような実例が出ていることだとも。

AI研究者が見ている現在のAIブームと、最前線の風景を聞きます。

※この記事は西田宗千佳氏の新書『生成AIの革新 新しい知といかに向き合うか』(9月11日発売)の発売に合わせ、筆者西田氏とAI研究者の清水亮氏の対談としてお届けします。

「一言でいえば、薄っぺらいブーム」

『生成AIの革新 新しい知といかに向き合うか』

撮影:伊藤有

西田 今の世の中での生成AIブームを、どう捉えていますか?

清水 今のブームはとても表層的なものなので、本質的に生成AIがなんなのかを理解しようともせずに、なんかすごいすごいって言ってる、一言でいえば「薄っぺらいブーム」だなと。

西田 確かに、生成AIも、これまであったディープラーニング系AI と比較した場合、技術的に見れば違わないわけで。清水さんが生成AIに注目し始めたのって、いつぐらいからですか。

清水 2013年、手書きタブレットである「enchantMOON」を作った直後から。

enchantMOONは手書きの文字を裏側で文字認識しています。ここにニューラルネットを使っていました。そこで検索とか機能の呼び出しとかをしているわけですよ。そう言えば、その頃に西田さんと知り合って、長崎の孤島までCM撮りに行きましたよね。

西田 そうでしたね。

清水 enchantMOONの開発を進めていた2012年末、すぐに北野さん(北野宏明氏、現ソニーグループ専務CTO、ソニーCSL所長)から連絡が来て、とにかく会いたいと。僕の方が忙しくて、やっと会えたのが半年後。で、「面白いことやってるじゃん」と言われたんです。

「手書きには、人間の思考のプロセスの多くが残されている。これを直接キャプチャーすると、他では採れないデータセットが集められるはず」と北野さんが言うわけです。

「人間の思考プロセスを丸ごと読み取って、次の行動を予測したり、人間の考えを拡張したりするようになるはずだ」と。

これは面白い話だなと直感的に思って。この話、2013年のことですよ。10年前です。

ソニー北野氏

現ソニーグループ専務CTOの北野宏明氏。ソニーCSL社長も務める(2020年撮影)。

撮影:伊藤有

西田 ペンの描線みたいなものから、ユーザーがこれから何を書こうとするかを認知する、ということですね。その先にある未来は、書いたものの続きを生成するようになるだろうっていう話を、2013年にしていた、と。

清水 僕はもともと、子供の頃から趣味でニューラルネットワークを作ってたんです。でも、生きてるうちにそれが実用化される日が来るとは思ってなかった。北野さんの話を聞いて、「え、今更? ニューラルネットですか」って思わず言ったことをすごく覚えてます。

それから、共同研究が始まった。

西田 2010年代の前半のニューラルネットの研究って、まだディープラーニングの初期段階で、画像や音声の認識とかですよね。要は、脳が何をどう認識してるかっていうところ。清水さんたちは認識にとどまらず、生成へとつながる研究をしていたということですか?

清水 (enchantMOONの発売後、次の検討を進めていた2015年頃は)「生成」ってキーワードはまだ僕らにはなくて、「思考拡張」っていうイメージでしたね。

本質的に「生成AI」は新しい概念じゃない

enchantMOON

清水氏が2013年当時経営していたITベンチャーで手がけた市販ペンタブレット型コンピューター「enchantMOON」。

撮影:伊藤有

西田 (手描き)認識からの拡張?

清水 そうです。人間が何かを書き始めようとした時に、途中まで書くと、関係する絵や類義語、キーワード等が、泡のように画面に浮かぶ「バブル」として表現されて、ふわふわって浮かんでくるOSを作ったんです。

ある日、試作機でなにか書いてみようと思って、「ヒューマンオーグメンテ—ション」って文字を書いた。すると、そこで出てきたバブルに「人間が猿から進化して、人間になって、その次、サイボーグになるという絵」が出てきた。それは結構びっくりして。

「そうか、僕が書いたものから僕の思考を拡張するってこういうことか」と思った。今ならそれは生成と呼ばれるものかも知れない。AIからのフィードバックによって人間の思考が拡張される状態。

西田 自分の中にはなかったアイデアがAIから提案され、それに刺激された自分がまた新しいアイデアを思いつく、みたいな。

清水 そこで本質的には「生成」になっていた。やっぱり、AIというのは結局、思考拡張するためのものなのであると。

西田 でも商品化はしなかった。

清水 (2018年前後までには)ハードウェアの試作もしたし、OSもそれなりのところまで作り込んでました。ただ、そこまで作ってからね。ちょっと待てよ、と。

この世界はもっと可能性がある。いやもっとディープラーニングというのを、腰を落ち着けて追求してから次のことを考えようと思って、後継ハードウェアを製品化するのは諦めました。

「手書き」ってジャーナリストとか科学者とかは日常的に使うんだけど、調査をすると、ほとんどの人は意外と使ってないんですよ。もっと、誰でも使えるものが作りたい。

AIというものを真摯に見つめ直して、それからこの先に何をやるべきか考えたいなと。そのために、実際にAIがなんの役に立つか確かめようと思ったわけです。

それで、お客様の悩みをAIで解決するジョイントベンチャーを作って事業化しました。共同研究を経て、2017年に事業会社になったわけです。

あの頃は全く、「途中から続きを書いてくれるAI」というのがどういうものか想像できなかった。今だったら、この話って誰にでもすごく分かると思うんですよ。だってGPT-3とかは、途中まで文章書くと続きを書いてくれますよね?

西田 今だから理解できるけど、当時はごくわずかな人しか想像できなかった。

清水 当時はそれを「生成AI」とは呼んでいなかった。本質的には、生成AIもそんなに新しいわけではなく、ただマシンの性能が上がっただけ。

画像を生成するAIは2018年から流行っていたし、文章生成するAIも同時期にFacebook(現在のメタ社)の研究所が作っていた。

2019年のヤン・ルカン(Facebook AI研究所のチーフAIサイエンティスト、当時)のLLMって、GPT-3くらいの性能があった。GPT-3にしても、話題になった時に既に3年ぐらい前の技術で、全く新しくない。WebのUIをつけて、誰でも触れるようにしただけでこんなにブームになるのか、と驚きました。

西田 基本的な話で言えば、(GPTのもとである)「Transformer」を作ったのはグーグルの研究者だったりするわけじゃないですか。

transformer

Transformerは深層学習のモデルの1つ。並列化処理できることが特徴で、非常に巨大なデータセットの学習に向いている(再掲)。

作成:清水亮

清水 そうです。しかも論文は学会に提出したけど却下された。グーグルはお金とガッツがあったから、1年後の2018年に「BERT」っていうのを作って、どうだ、すごいだろって公表した。

僕から見ると、そこにOpenAIがガンってお金を突っ込んで、GPTを作っちゃっただけじゃないか、と思ってます。

西田 僕の視点で面白いなと思うのは、確かに本質的には前からあったんだけど、「変化してるように見える」ってのは重要だと思うんです。その結果、世の中はそっちに引きずられる。その結果、お金も集まって、いろんな変化が生まれた。

清水 テクノロジーの「伝え方」って大事だなっていうことでしょうね。

AI技術は世界の「趣味人」の成果で急速に進歩しはじめた

stableLM

Stability.ai/REUTERS/Dado Ruvic/Illustration/File Photo

西田 生成AIは、現在もいろんな進化・変化をしてるわけですけど、清水さんが自分でAIをいじってて、楽しいと思うことってどこですか。

清水 僕は今、配信プラットフォーム「シラス」の「教養としてのAI講座」という有料チャンネルで、毎日「デイリーAIニュース」を配信してます。それくらいハイペースで配信しているのに、いまだに週に1回か2回は「マジかよ」って言葉が自然に出てくるような新しい技術が出てくる。

誰かのアイデアに他の誰かが乗っかる。これを世界的にやってるわけで、面白くないわけがない。24時間365日ずっと世界中でハッカソンをやってるみたいなものですから。

西田 あー、なるほど。

清水 こうした流れは、2022年に世界的にブームになった、画像生成AIの「Stable Diffusion」が契機だったと思います。元々はOpenAIが先に似たようなものを作っていました。僕も2021年からそういう、言葉から絵を描くWebサービスを作って公開しました。でも、OpenAIはなかなかそれを「オープン」にしてくれなかった。

西田 OpenAIっていう名前なのに……。

清水 世界中でフラストレーションが溜まっていた。

そこに2022年、ついにStable Diffusionが現れて、(画像生成AIの世界で)「敢えてオープンソースで行くんだ」って言った時に、全世界の「力のない人たち」に力を与えた。

それまでは、お金がたくさんあるとか、大企業のグループにいるとか、「閉ざされた玩具」だった生成AIが、誰でも自由に使って改造できるものになった。1977年のマイクロチップの革命と同じくらいのインパクトだと感じます。

西田 確かに、歴史的にはそれまで大企業しか持てなかったコンピューターが、マイクロチップが生まれたことでホビイストの手に入るようになった。だからスティーブ・ジョブズはウォズニアックとApple Computer社を作ることができた。

清水 学術会の人たちは、僕に言わせれば物凄くペースが遅い。学会があって、そこに合わせて論文を書くワケだから。論文投稿から学会まで半年くらいかかる。

でも、技術が世界のホビイストたちの手に渡ったことによって、「趣味人の研究」の方が速くなった。

彼らは仕事でやってるんじゃなくて「今自分が欲しいものをつくる」ことを目的としたハッカーだから、暇さえあれば研究するし、成果が出たら学会なんか待たずにすぐオープンソースにする。すると、また別のホビイストがそれに乗っかる。

その進歩の早さが、僕は面白いと思っているんです。

「生成AI禁止」が時代錯誤なのは歴史が証明している

unicorn

画像生成AIで作成した仮想の生物ユニコーン。

Business Insider Japan

西田 そういう話(今、水面下で起こっている話)と、世の中でニュースになってる「生成AI」って呼ばれるものってだいぶ違うじゃないですか。

両者のギャップが、清水さんの言う「薄い」っていう感想につながるんだと思うのです。一方で「どんなふうにルールを作るのか」「どう導入するのか」みたいな話も、それはそれで大切だったりします。

ここにもスピード感のギャップがあると思うんです。これをどう見てます?

清水 例えばいま「生成AIは使用禁止です」という大学ってあるじゃないですか。振り返れば’90年代って、今でいう巨大IT企業の中でも「インターネット禁止」って時代があったんですよ。Windows 95発売前は。どう考えても時代錯誤なんだけど。

西田 まったくその通りです。

清水 他にもいろんな大企業が、「うちはインターネット禁止」って言ってた。社内では使っちゃいけませんとか、インターネット禁止だった会社は、超あるわけです。すごい既視感がある。

新しい技術が出た時に、「やめましょう」という現象は常に起きていて、全て失敗してるわけです。今インターネットとスマホ禁止の会社なんて想像できないですよね。

西田 確かに。実は今回ちょっと面白いなと思うのは、そういう、ある種「やめましょう」的な流れがあるとはいえですよ、日本が過去に比べるとマシな対応をしてる気がするんですよ。

清水 そうですね。

西田 企業が導入して試してみるとか、政府内で使い方を検討するとかっていう話に関しても、そんな的外れなことはしてない。アメリカで話されてる議論と同じレベルでついていけてるような気がしていて。

それは珍しいことだなっていう気はしてるんですよね。

清水 歴史を振り返ると、インターネットが普及する初期段階で、日本は検索エンジンで、突然、世界から置き去りになったんです。

日本が検索エンジンを作れなかったわけじゃない。「千里眼」(国産検索エンジン)とか、いっぱいありましたから。

でも、常に「検索エンジンって著作権法違反じゃない?」っていう人たちが大企業にいて、そういう人が結果的にイノベーションの邪魔をしていた。

結局、検索エンジン戦争に負けたことが、日本国内にいわゆるネット企業が育たなかった原因とも言われている。

その反省から、著作権を見直そうと。機械学習では著作権法に例外が認められるっていう法律がかなり昔にできた。世界に先駆けて、おそらく唯一、日本しか持ってない法律です。

僕が2016年に内閣府の知財戦略本部の下部組織の委員になった時、そういう話を聞きました。

仮に我が国の法で禁止しても、インターネットは簡単に国境を越えてしまう。アメリカならフェアユースという考え方があるように、日本の著作権法が及ばない国や地域があり、日本だけ禁止しても、それって単純に我が国のAIの発展を阻害するだけでメリットがない。

ただ一方で、今までAIに興味がなかった日本のマスコミが今頃になって「俺たちの記事を学習するな」みたいなことを言い出し始めてもいる。

でも彼らが守りたいのは自分たちの権益だけであって、日本が生成AIで遅れをとることがどういう悲惨な未来を招くかということに全く興味がない。

生成AIの社会実装は良い意味で「日本らしくない」

IMG_2309

撮影:Business Insider Japan

清水 日本は法律で自由にAI開発ができるようにした。それとは無関係に当然、他者の著作物や他人の肖像権を侵害するものを作って発表してはダメなわけです。学習するのとは別です。「主体が人間でもAIでも同じこと」というのが今の日本の法律だと僕は理解しています。

西田 ちょっと面白いと思うのは、今回に関しては、そういう過剰な反応が、日本だけでなく海外にも目立つことですね。

従来は、特にアメリカだと「論理的に考えて、禁止はされてないことなんだから、とりあえず作ってみようぜ」っていう流れがあった。でも、今回の生成AIに関してはラッダイト運動的※な反応がアメリカや欧州でも起きていて、日本の方が「法律でとりあえず決まってるし、感情面はともかくとして、オーケーじゃない?」っていう流れになっている。これは面白い現象だなと思うんです。

※ラッダイト運動:19世紀初頭、産業革命期のイギリスで発生した機械打ち壊し運動

清水 なるほど。西田さんもおっしゃるように、「いつもの日本」らしくないかも。先進的な法整備がされていた。

西田 「責任を持つのは機械じゃなくて人間だよね」って話だけなので。それを考えれば、別にAIを作ること自体は自由だろうと、本音としては思いますよね。

清水さんは、AIで生成した作品のコンテストにも関わってますが、コンテストを通して見てその辺、どんな風に感じました?

清水 多分、みんなが懸念してることって、「他人の作風をそのままパクる」だとか、「成果を横取りする」だとかと思いますが、むしろコンテストではそんなことは起きないんですね。

そもそも他者の権利を侵害した作品は失格になる。

西田 そうでしょうね、うん。

絵を描く時「どんな絵を描くか」は、結局は人間が考えなきゃいけない。絵を描ける人は、我々が思ってる以上の精度で「自分が描きたい絵ってのはどういうものか」っていうことを理解していますよね。

具体的な内容を指示できない人は、生成AIでも独創性のある絵は描けない。

結局は、自分が何を求めてるのかを言語化する能力が必要だということだと思います。

だから誰もが生成AIをうまく使えるわけではない。

清水 だから生成AIで描くといっても、思い通りに描くのは相当難しい。こんな絵を生成AIで作るんでしょ、と言われて絵を何枚か描かされた時、「もっとこうしてくれ」とダメ出しされて。「じゃあお前がプロンプト作れ」とキレたことがあります。AIに絵を描かせるのは、そんな楽な話じゃない。

西田 ここは割と誤解されてると思うんですよね。

簡単にいい絵が出てくるかもしれないと思ってるかもしれないけど、実はそうでもない。

創造性を助けることはあっても、創造性そのものがいらないわけではない。

清水 もちろんそうです。

西田 検索して、どこかから引っ張ってくるんじゃなく、生成AIに作ってもらうっていうとなると、独創性が必要な部分とそうじゃない部分が別れるだろうな、とは考えています。

「AGI(汎用人工知能)」に不要論

illust08

画像生成AIで生成した「助手ロボット」のイメージ。

作成:Business Insider Japan

西田 ところで、いわゆる、AGI(汎用人工知能)※って必要だと思いますか?

聖杯みたいなものとして、「人間と同じように考えられるAIが必要」という主張が一部にある。

でも、人間がコミュニケーションできて、何か機械を使うだけなら、AGIまで行かなくてもいろんなことできるじゃないですか。そう考えた時に「究極の人工知能はAGIである」っていうテーゼ自身が、実は的外れなんじゃないか。

※AGI(汎用人工知能):あらゆる質問に対して、人間のように考え、回答したり解を示せる人工知能のこと。SF小説に登場する「AI」はAGIをイメージしていることが多い。

清水 実際、AGIがあってもなくても、僕の人生に影響ないんですよね。

西田 SF的に見ればね、「AGIができた」っていうとすごいなとは思う。でもAGIじゃなきゃできないことってなんだろう。と考えた時に、「いや、それ人間でいいのでは」と。

膨大なエネルギーを突っ込んでAGIを作れるかもしれないけど、そこまで苦労しても、やっと人間1人分なんですよね。

それよりは、今あるAIを、いろんなとこに、いろんな形で使った方が面白くないか、と。

もうちょっとスムーズに話ができるAIは必要かもしれないけど、それはAGIとは呼ばないよねっていう話ではありますよね。

清水 人間みたいな機械って、「どのぐらい人間的なのか」っていう話でもある。AGIに関してはそのレベル感が分からない。

西田 まあ、そうでしょうね。極論すると、「手」というものを完璧に再現することですら、今の人間のテクノロジーはできてないわけですよ。

そう考えた時に、AGIってなかなかやっぱり、難しい存在だよなって気がしちゃうんです。ソフトウェアは、今だって人間に対していろんなインタラクションをするじゃないですか。人間の親みたいにたくさんインタラクションされると、ソフトウェアでもウザいって感じる。なので、実は人間が求めてることは、「人間の空気を読め」ということであって。

清水 別にそれがAGIである必要全くない。

西田 そうすると、AGIではない、いろんなAIが世の中に拡散していくということの方がシナリオとしてはありうるし、それがどういう風に社会に浸透していくかを考える方が、ちょっと面白いかなっていう気はするんですよね。

清水 僕だったら、さっき言ったように、アシスタントをしてくれるAIで十分ですね。

クラウド不要で、自分のPCの中で動作する「Open Interpreter」みたいなAI(編注:問いかけるだけで、ネット検索を参照などしてコードを書いたり、調査して示したりするAIツール)。あれが音声で指示できるようになるだけで、相当便利だと思う。

西田 そうですね。(Business Insider Japanでも記事にした)ChatGPTのコードインタプリターが出てきた時に、自分で使ってて、「あ、これって、SFでよく見るやつだ」と思ったんですよ。

映画『ブレードランナー』とかに出てくる、コンピューターに命令して答えを見つけていくヤツ。

清水 それが欲しかったんだな、と。そういうのはすごい分かる。

実際問題、やっぱりマウスって、できれば人は使いたくないんだなという。『ブレードランナー』の世界には、マウスもタッチスクリーンもない。

西田 逆に言うと、言語をちゃんと理解してて、例えばコードだったりデータだったりを作ってくれるAIが出てきたことによって、ポインティングデバイスから離れられる可能性が出てきましたね。

清水 そうそう。iPhoneも登場してから16年経ってるわけで、「まだ使ってんの、この形のもの?」みたいな気がするじゃないですか。

実は最近、iPhoneよりiPadの方をメインで使ってるんですよ。iPhoneは予備。

西田 なるほど。ポイントはサイズ?

清水 結局、大きな画面の方が見やすいからですね。

西田 別に直接触らずに、ペラペラって喋ったらなんかやってくれる、良きに計らってくれるっていうUIが入ってくれば、それは新しいコンピューターのとの付き合い方になるってことですよね。

注:この記事のリンクを経由して製品を購入すると、アマゾンとのアフィリエイト契約により編集部が一定割合の利益を得ます。

Popular

あわせて読みたい

BUSINESS INSIDER JAPAN PRESS RELEASE - 取材の依頼などはこちらから送付して下さい

広告のお問い合わせ・媒体資料のお申し込み