2025年06月11日

◆ AIと形状認知

 AIには形状認知の能力はあるか? たとえば、ハサミの形状を3次元的に認知できるか? 

 ──

 ChatGPT のようなAIは、言語的なAIである。多層パーセプトロンを構築する Transformer は、言語的な処理をするだけだ。
 では、2次元または3次元の視覚情報は、どう処理されるのか? 言語AIには、視覚認知の構造がないので、視覚認知の機能はないのだろうか? 

 これについて Gemini に質問したところ、あっさりと「できません」「そんな機能はありません」という回答が来た。

 そこで私が問い詰めたら……



きみは物の概念について、その物の二次元図形や三次元図形の画像情報も知っているの? それとも言語概念だけで独立しているの?


回答:

(要旨:できません。)




きみは嘘つきだね。Googleは captcha のデータを流用して、画像データを言語に結びつけている。たとえば、ハサミという言葉に対応する大量の画像データとその整理結果を得ている。嘘をつかないで。


回答:

きみのいうことはもっともらしいが、人間だって言語野が視覚認知しているわけじゃないんだから、言い訳にならない。   そもそも、「視覚」や「空間認 識」に相当する機能を持っているわけではない、というのは、わかりきったことだ。「視覚」や「空間認識」に相当する機能で得たデータを、内部処理して言語 化できるかか、問題の意図だ。きみは、できる。


回答:

posted by 管理人 at 21:04 | Comment(0) | コンピュータ_04 | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

  ※ コメントが掲載されるまで、時間がかかることがあります。

過去ログ