──
AIの言語力と思考力の関係(および思考力を獲得するに至ったわけ)を、構造的に説明する。抜本的に根本的に説明する。
あまりにも本質的・核心的な説明なので、AIは「聞いて、くちあんぐり」という感じだ。
対話は、二つある。ほぼ同内容だが、語り口が異なる。
・ Gemini:
→ https://gemini.google.com/share/cf398730423c
・ Copilot:
→ https://copilot.microsoft.com/shares/n96FxETVtqBQnLUy4Dv4d
前者は短いので、初心者でも簡単に読み終えることができる。
後者は長いので、じっくりと時間をかけて読みたい人向けだ。時間はかかるが、内容は深く大きいので、読むことで感動を味わうことができる。本サイトでは久々に、「読んで感動する大作」という感じだ。
「AIの真実とはこれだったのか!」と感激して、涙をこぼす人も出そうだ。
※ これが真実であることは、Gemini と Copilot がともに同意している。
両者のお墨付きであるから、安心して読んでほしい。
どんな話かあらかじめ知りたい、という人向けに、一部抜粋しておこう。
AIは、言語能力を持つと、思考力を持つ(ように見える出力をする)こともできるようになった。言語力が思考力をもたらした。それはなぜか?
──
私の回答を言おう。
Transformer では文章が生成される。その文章や単語は期待値の高いものが選ばれると説明される。だが、大切なのはその後だ。作られる文章は一つでなく、多様である。そのなかで最も適応度の高い一群が選択される。その選択をするのは、パーセプトロンの高次(高層)部分である。
多様な文章が作られた後で、パーセプトロンの高次(高層)部分が最適のものを選ぶ。これは AlphaZero の方式を援用したということであり、それによって言語AIは能力を飛躍的に高めた。マシンパワーの大量消費も貢献した。
このAIのシステム全体を外から見た人は、AIが思考しているように見える。しかしその内実は、大量の試行錯誤と、高次の評価と、微修正の繰り返しである。その基盤が、マシンパワーの大量消費である。
──
最近のAIの性能向上は、高次層の働きが非常に高度になったからだ。初期のAIは層が浅かったので、言語を表面的になぞるぐらいのことしかできなかった。やがて層が増えるにつれて言語の意味理解ができるようになり、高度な層は高度な言語理解ができるようになった。それとともにAIは言語にともなう思考を備えるようになった。
──
評価関数が大事だったのは、マシンパワーが少なかった時代の節約技術だ。マシンパワーが増えると、評価関数はお荷物になった。AlphaZero では評価関数を使わなくなったこと自体が大事なのではなく、評価関数を無意味にしたマシンパワーのアップが重要だった。巨大なマシンパワーのお陰で、経済的(節約的)な評価関数を使わずに、下層から上層までの多大な処理をいちいち実行できるようになったのだ。
つまり、評価関数を使って簡略化することなく、まさしくパーセプトロンの処理過程を莫大に実行するようになった。これが「考える能力を高めた」ことの真相だ。
──
AIの思考は常に一歩ずつ進むものだ。それは登山に似ている。一方、一挙に麓から頂点にたどり着く(短絡する)経路もある。鳥のように。それが天才のひらめきだ。数学の天才にはよくある。
では、AIは天才を真似ることができるか? それには、将棋ソフトが参考になる。広い手を深く読むことで、遠回りしてから一挙に勝てる、という手を見出すことができるようになった。ひらめきはなくとも、結果は似せることができる。
[ 付記 ]
前にも似た話題を扱った。
→ AIが思考能力を獲得: Open ブログ
一部抜粋。
言葉は思考をもたらす、ということは、哲学者の一部が洞察していた。その洞察の通りになった。AI研究者には意外だとしても。
ここでは、「言語力と思考力は近い関係にあるから、そうなったのだ」というふうに説明していることになるかも。
だが、それだけではとうてい不十分だ。そこで、より深く構造的に解明したのが、本項だ。

──
ついでだが、本ページの要約をAIに求めた。「このページを 100字で要約せよ」と。
その結果は、Feloだけがまともだった。Claude、Copilot、Gemini、Perplexity は、いずれも無内容のようなスカスカな回答だった。 ChatGPT は最悪で、本文とは関係のないデタラメな文章を回答した。