2月17日、LiveScienceが「Older AI models show signs of cognitive decline, study shows」と題した記事を公開した。この記事では、古いAIモデルが加齢による認知機能の低下を示す可能性について詳しく紹介されている。
以下に、その内容を紹介する。
この記事によると、人工知能(AI)は医療現場でも重要な役割を担っており、特に症状や異常兆候を迅速かつ効率的に見つける点で期待が高まっている。しかし2024年12月20日にBMJで発表された研究結果によれば、大規模言語モデル(LLM)やチャットボットなどのAI技術も、人間と同様に加齢とともに認知能力が低下する兆候を示す可能性があるという。
研究チームは、OpenAIのChatGPTやAnthropicのSonnet、AlphabetのGeminiといった公開されているLLMベースのチャットボットを対象に、神経科医が注意力や記憶力、言語、空間認知、実行機能などを診断するために使用するMontreal Cognitive Assessment(MoCA)テストを実施した。その結果、ほとんどのLLMは命名、注意、言語、抽象化といった一部の項目では比較的良好なスコアを示した一方で、視覚・空間的スキルや実行機能が求められるタスクには苦戦し、中でも古いバージョンのGemini 1.0は16点を記録したという。最も新しいバージョンのChatGPT(Version 4)は30点満点中26点と比較的高スコアを示したものの、総じて以前のモデルほど認知機能の低下が顕著だった点が懸念材料として挙げられている。
MoCAテストは、アルツハイマー型認知症や認知症などの発症初期段階を検査する際に広く用いられている。人間の場合は26点以上が合格ライン(認知機能障害なし)とされる。研究者らは、AIと人間の脳はそもそも動作原理が異なるため、この実験をもって両者を直接比較することはできないと断りつつも、視覚的な抽象化や実行機能が求められる医療行為にAIを導入する場合には慎重さが必要だと警鐘を鳴らしている。特に、これらの弱点が解消されない限り、医療分野においてAIが人間の医師を完全に代替するのは難しく、患者の信頼を損ねる可能性があるとも指摘している。
さらに、今回の研究はAI技術そのものが加齢という概念をもつのかという興味深い疑問を提起しており、人間の神経科医が「認知機能の低下を示すAI」を診断する未来が到来するかもしれないというユニークな示唆も含まれている。
詳細は[Older AI models show signs of cognitive decline, study shows」を参照していただきたい。
よくわからんのですがLLMの重みって変化しないので加齢なんて概念ないのでは?