ディープラーニングでは、脳を模したモデルを作ることが大切だ。では、脳を模したモデルとは、どのようなものか?
以下では、専門分野の話を、かみくだいて示す。
この話は、AI そのものよりは、脳科学の分野に属する。その知識を示そう。
(1) 1次視覚野
網膜から視神経を通じて脳の後頭葉に情報が伝わる。この脳の後頭葉が、1次視覚野だ。
→ 視覚野 - Wikipedia
1次視覚野の表層では単に信号を受けて感知するだけだが、深層では情報処理をする。これは「輪郭を抽出する」というような処理だ。
その構造はきわめて簡単で、ある細胞について、次のことが起こる。
・ その細胞では、励起状態となる。
・ その細胞の両隣の細胞では、逆に、抑制状態となる。
具体的には、右のような図で示される。
( 中央は励起状態で、その両側が抑制状態。)
このような機能が細胞にあると、次のようなことが起こる。
「黒地に白線が描かれている図形を見ると、白線だけが際立って見える。一方、白線のすぐそばは、黒がいっそう黒く見える」
こうして、白線だけがきわめて明瞭に感知されるようになる。
同様に、白地に黒線が描かれた図形でも、黒線ばかりがくっきりと感知されて、その両側は白っぽく感じられる。
いずれにせよ、「線をくっきりと見せる」という機能がある。
以上のような機能があると、どうなるか? 普通の白黒の文字を見ている限りは、特に差は感じられないだろう。
しかしながら、白黒が曖昧である図形(にじんだ図形・ピンぼけの図形)を見ると、はっきりと差が付く。たとえば、こんな図形だ。
→ 例1 、 例2
こういう図形を見たとき、上記の機能があると、線の部分だけがくっきりと見えて、にじんだ部分が抑制される効果がある。
現実世界にあるものは、くっきりと見えるものばかりだとは限らない。近視で像がにじむこともあるし、遠くのものが煙や霧で霞んで見えることもある。だから、上記のように「くっきりと見える」という機能は、視覚においてはとても大切だ。
さらに大切なのは、この機能によって、「物の輪郭が与えられる」ということだ。
次の三つの図を見てほしい。(上・中・下)
まず、黒と白の領域がある。(灰色の部分は無視していい。)
これの明るさを、「黒は0、白は1」というふうにして、グラフを書くと、中央の図のようになる。これは機械的に測定されるグラフでもある。
一方、下の図は、視覚野で感じられる数値だ。つまり、先の「くっきりと見える」という機能をもたらす細胞の性質(中央が励起され、その両側が抑止されるという性質)があると、白黒の境界領域では、下の図のように感じられる。つまり、境界のそばでは、黒はいっそう黒く感じられ、白はいっそう白く感じられる。
このことから、「物の輪郭が与えられる」という効果が生じる。たとえば、 ● のような図形を見ると、その境界の部分で、輪郭線だけがくっきりと浮かび上がって、 ○ のような輪郭線の形状が浮き上がるのだ。
このように物体を輪郭でとらえるというのは、漫画やアニメでよく見られる。現実の物体は、3Dアニメのようになだらかな会長のある色彩で示されるのだが、2Dの漫画やアニメでは、人物や物体は輪郭線で描かれる。このことから桃わかるように、人間が物体を認識しているときには、輪郭線を強調するようにして認識する。
これはまた、現実の物体の情報を簡略化するということでもある。このことが、1次視覚野でなされるわけだ。
( ※ このような効果は、脳科学の分野で、「特徴抽出」と呼ばれることがある。)
(2) 2次視覚野
1次視覚野でくっきりとした線や輪郭を得たあとで、この情報は2次視覚野(視覚連合野)に送られる。これは側頭葉にある。
→ 解説図
2次視覚野には、「特定の図形に反応する細胞」というのがまとまって並んでいる。たとえば、次のような図形だ。
┛ ┗ + * / \
このようにさまざまな図形があって、その図形に対応する細胞が、似た図形に対応する細胞がひとまとまりになる感じで並んでいる。似ていない図形なら、それらに対応する細胞は別々のところにある。
1次視覚野で得られた情報は、2次視覚野の全体に送られる。すると、2次視覚野のうちの特定の細胞だけが反応する。たとえば、円形の図形を見たら、円形の図形に対応する細胞だけが反応する。
一方、 A のような図形を見ると、これにはいくつかの特徴図形があるので、それに対応する細胞がいっせいに反応する。
このことを、モデル化すると、次のようになる。
この図の2番目では、いくつかの特徴図形の細胞がいっせいに反応している。そのあと、これらの細胞の反応がまとめられて、3番目のようになる。さらにそれがまとめられると、4番目のようになる。ここで、A という図形が一つの細胞で認識されたことになる。
上の図形は、「ネオコグニトロン」という脳のモデルだ。これは脳の構造をそのままモデル化したものだと見てよい。
このモデルを、そっくりそのまま、AI に適用することができる。その意義は、次のことだ。
・ 輪郭の抽出 (1次視覚野)
・ 特徴図形の細胞の励起
・ その励起した細胞をまとめる。
・ それをさらに高度にまとめて、ひとつに集約する。
このうち、2番目は「視覚的なパターン認識」に近いが、2番目と4番目は「視覚的なパターン認識」とは違う。それは、視覚に対する作用ではなくて、細胞に対する作用だ。はっきり言えば、それは、「パターンのパターン」を得ることだ。
2番目では部分的なパターンを得る。その後、3番目では、部分的なパターンを得た細胞についてのパターンを得る。4番目では、3番目の細胞についてのパターンを得る。
つまり、3番目と4番目では、「図形についてのパターン」のかわりに「細胞についてのパターン」をとらえようとしている。これがつまりは「パターンのパターン」を得るということだ。
このような仕組みを取ることが、AI のディープラーニングでは決定的に重要となる。
ディープラーニングではない場合には、視覚情報だけを操作する。ソフトウェアがいちいち処理するわけであるから、人間がいちいち具体的な処理方法を教える必要がある。ものすごく大量の指示を与える必要がある。
一方、「パターンのパターン」という方法を取ると、「間違いをした場合にはエラーと見なして捨てて、間違いをしなかった場合には正解と見なして記憶する」という学習が可能となる。この学習によって、AI が自律的に機能を高めていくことが可能となる。
それを実現したのが、ゲーム学習における DeepMind だ。
何度も学習することで、AI が自律的に
ゲーム能力を高めて、人間以上となる。
人間の脳を模するという方法を取ると、これほどにも AI の能力を高めることができるのだ。
囲碁の場合はどうか? 以下は推測だが、たぶん、次のようにしているのだろう。
・ ケイマやコスミやツケなどを特徴図形として得る。
・ その特徴図形というパターンに対して、パターンのパターンを得る。
・ さらにそれに対して、パターンのパターンを得る。
このような過程で、戦略を得るのだろう。ちょうど、文字を認識するように。要するに、文字を認識する過程も、囲碁で戦略(手)を得る過程も、基本的には同一であろう。
つまり、さまざまな文字を認識して文章を認識するように、さまざまな戦略(手)を認識して方針(読み筋)を判定するのだろう。
そして、その原理は、「パターンのパターンを得る」ということだ。ここに、ディープラーニングの本質がある。
──
さて。以上のようにすることで、視覚やゲームに AI を適用できる。これらの AI は、大量に処理する場合もあるが、一つだけを処理することもできる。その場合、たいして時間はかからないだろう。
一方で、短時間で処理することが必要になることもある。それは、動画の認識の場合だ。特に、自動車の自動運転では、前方を確認する複数のカメラに対して、毎秒数十コマの認識が必要となるので、高速処理が必要となる。
その実例は、下記に見られる。
→ 自動運転カーを実現する開発ユニット「NVIDIA Drive PX 2」
ここでは、ディープラーニングの高速処理で、画像認識がなされる。
ともあれ、ディープラーニングはこんな形でも進行している。このような方針を取るのは、Google の自動運転と、NVIDIA の自動運転だ。いずれも、ディープラーニングによる自動運転だ。記事によれば、BMW、トヨタ、フォードなどもNVIDIAプラットフォームを利用して自動運転技術の開発を進めているということだ。これらの自動車会社は、Google に頼るかわりに、NVIDIAに頼る形で、ディープラーニングを進めている。特にトヨタは、米国の優秀な技術者(ギル・プラット)と契約して、大々的な開発に邁進している。
→ トヨタ、人工知能技術の研究拠点を米国に設立
→ Toyota Research Institute, Inc. 自動運転車開発メンバーを新規採用
→ トヨタ、自動運転技術の米企業から全従業員を採用
トヨタは、自動運転の分野ではかなり遅れていたのだが、米国の最先端の会社を買収する形で、一挙に世界トップレベルの技術を得るに至った。Google 、NVIDIA 、トヨタが、世界の3強となりそうだ。
一方、日産、ホンダ、ベンツという会社は、自社開発にこだわりながらも、ディープラーニングという最先端技術が抜けている。
数年後に自動運転が実用化したとき、日産、ホンダ、ベンツという会社は、今日のシャープと同様の運命になりそうだ。「自動運転の自社開発」という方針にこだわる限り、これらの会社は、いずれもシャープと同じ運命になるだろう。
( ※ 現実には、その前に、Google か NVIDIA から技術を買うのだろうが、そのころには、トヨタには2周も3周も引き離されて、ただの田舎の弱小企業に成り下がりそうだ。)
( ※ ついでだが、自動ブレーキというのも、自動運転の初歩技術となる。ところが、その自動ブレーキの認識技術[日立製]を、スバルとスズキ以外の会社はまともに導入しない。ひどいものだ。この件は、先に述べた。→ 自動車の自動ブレーキ )
【 関連サイト 】
(1) AI の知識については、下記のスライドショーがちょっと役立つ。
→ 人工知能研究のための視覚情報処理
※ この 58頁から、本項の図のひとつを拝借した。
(2) AI の現状については、NHK の番組でも報道された。その案内情報。
→ 驚異のAI技術「ディープラーニング」とは? | NHK BS1
(3) DeepMind の開発者の紹介。
→ AlphaGoをつくった「4億ドルの超知能」はいかにして生まれたのか
※ これについての感想は、前項のコメント欄に記した。
(4) 開発の現状。
現状の研究開発体制についての記事。
2015年の時点で、ディープラーニングシステムを開発できる研究者は非常に少なく、一説によると50人程度、それも多くは大学院生であるとされている。
( → ディープラーニング - Wikipedia )
ほんとかね、という気もするが、「システムをいじれる」でなく「システムを開発できる」となると、確かに少なそうだ。
- 日本企業はなぜやらないか?
本来ならば、富士通や NEC がやるべきだが、これらの会社は赤字でつぶれそうだし、ソニーもひところは赤字だったし、ソニーの社長は技術のことを理解できずにソニーを崩壊させているだけだったし、キヤノンは独裁社長がボケていているし、何か、日本の電子関係の企業は馬鹿ばかりという感じだ。ドワンゴみたいなブラック企業がのさばることからして、もう「日本オワタ」みたいな状況だ。かろうじて頑張っているのはトヨタだが、開発者は米国人ばかりで、丸投げだ。「日本死ね」と言われなくても、勝手に死につつある感じだ。
まあ、本項を読んで理解できる人なら、現状のひどさも理解できるだろうが。理解できる人がいても、対策が取られないのが、日本の悲しさか。やれることはせいぜい、ドワンゴが大ボラを吹くことだけ。
そもそも、日本企業は、「独創的な人材を処遇する」という人材システムは存在せず、「全員一律に処遇する」という人材システムがあるだけだから、独創的な人材が来るはずがない。独創的な人材を採用するとしたら、(海外の)社外に研究所を作るしかない。トヨタがやったように。
というわけで、日本企業が日本で自社内で独創的な研究をすることは、根源的に不可能だ、ということになる。経営組織がもともとそうなっているのだ。
シリーズはこれで終了です。(全5回)
※ オマケでもう一つ、次項 があります。
http://www.nikkei.com/article/DGXMZO98496540W6A310C1000000/
まあそれでも事故の総数が減れば良いという気もしますが。
ソースは日経テクノロジー。URLは後ほど
http://business.nikkeibp.co.jp/article/report/20140313/261058/
日産自動車は、昆虫や魚をモデルにするというが、実は、これは鳥をモデルにして、同様の研究がずっと前になされていた。
→ http://members.jcom.home.ne.jp/ibot/boid.html
→ https://en.wikipedia.org/wiki/Boids
→ https://www.youtube.com/watch?v=rN8DzlgMt3M
→ https://www.youtube.com/watch?v=g0LwS4ysGbE
1987年(30年前)になされた研究の二番煎じを、なぜ今ごろになってやっているのか? 日産は分けわからん状態だね。
http://techon.nikkeibp.co.jp/atcl/column/15/021200032/031000009/?rt=nocnt
日産ではなく東京大学先端科学技術研究センター の研究応用例のようです。
情報、ありがとうございました。