2016年03月12日

◆ AI とディープラーニング 2

 前項の続き。囲碁で AI が人間に勝つことができた原理。
  ※ いよいよ話の本題を示す。 ──

 前項では、AI の歴史を示した。人間の脳を模するパーセプトロンというモデルを使うことで、AI は画像認識で人間をしのぐまでの能力をもつようになった、と示した。
 このあとは、囲碁に移る。

 ──

 囲碁とは何か? 陣取りゲームである。具体的な例は、今回の棋譜を見るといい。
  → 第1局 , 第2局 , 第3局  (棋譜再生のリンクあり)
  → 第1局と第2局 , 第3局 (棋譜再生)

 さて。この陣取りゲームで、どうやって勝利するか?
 すでに示したように、石の打ち方はあまりにも膨大である。10の 200乗とかいうような打ち方がある。そのすべてを考慮することはできない。シラミつぶしで調べるわけには行かない。では、どうやって対処するか?
 ここで人間は考えた。複雑な場合分けを単純化するという方法だ。それは「思考」と言ってもいい。
 具体的には、「部分的な勢力圏を作ってから、その勢力圏を拡張する」という方法だ。最もわかりやすいのは、「端から3線目に石を置く」という打ち方だ。こうすると、端に近いので、石と端との中間との領域を、自分の勢力圏に置きやすい。特に有益なのは、四隅の3線目だ。だから囲碁では最初にこの四つの隅の3線目を奪い合う。要衝の場となるからだ。
 ともあれ、人間は、部分的な勢力圏を作ろうとする。相手が人間なら、相手はこちらが勢力圏を作ろうとするのを妨害しながら自らの勢力圏を作ろうとする。こうして、それぞれが自分の勢力圏を拡大しようとする。

 AI はどうか? 基本的には人間と同じ打ち方をするが、部分的には人間にはない打ち方をする。それは、「部分的な勢力圏を作ってから、その勢力圏を拡張する」という方法を越えた方法だ。具体的に言うと、「最終的な勝利のみをめざして、途中で勢力圏を構築することを意図しない」という方法だ。
 人間は、とにかく自分の領域を部分的に確保したがる。「ここはおれの領域だ」というのを確保したがる。そうして自分の領域を確保してから、その確保した領域をどんどん拡大したがる。部分的な勝利を得てから、部分的な勝利の数を増やそうとする。そのことで最終的な勝利を取ろうとする。
 AI は違う。部分的な勝利にこだわらない。もちろん、敗北を許容するわけではないのだが、勝利だか敗北だかわからないような曖昧な領域をたくさん作っていく。人間はせっせと自分の部分的な勝利を積み重ねていくのだが、その間、AI はちっとも部分的な勝利の数を増やさない。それを見て、人間は「こっちはこれほどにも部分的な勝利を積み重ねたぞ。こっちが圧倒的に有利だ」と思い込む。「それにしても AI はなぜ、あんなわけのわからない曖昧な石を打っているのだろう」と疑問に思う。しかし、手が進むにつれて、AI が打った曖昧な石は、実は重要な意味を持つとわかってくる。人間が部分的な勝利をめざしている間に、AI は最終的な全体勝利をめざして、せっせと石を置いてきたのだ。そして、人間が気がついたときには、AI の置いた石の多くが急に意味を持ち始めて、一挙に AI の全体的な勝利に至る。
 結局、人間がめざしたのは部分的な勝利の蓄積であり、AI のめざしたのは最終的な勝利だった、という違いがあるわけだ。

 ──

 では、どうしてこういう違いが生じたのか? 
 人間の取ったのは、「複雑さを単純化する」という方法だった。部分的な勝利は、(領域が狭いがゆえに)手がわかりやすい。また、石の打ち方のパターンもわかりやすい。たいていは、第2線〜第5線のあたりで、打ち方に何らかのパターンがある。そのパターンを感覚的に理解することが、囲碁が上達するということだ。また、そのパターンをたくさん知っている人が、囲碁の高段者だということだ。

 AI も、最初はその方法を学んだ。まずは、人間の打った莫大な棋譜を取り寄せて、そこにある打ち方のパターンを学んだ。このパターン認識においては、前項のディープラーニングの方法(パーセプトロンと特徴抽出)が取り入れられて、AI の棋力は飛躍的に向上した。こうして AI の能力はほとんど人間と同レベルにまで達した。(画像認識の能力が人間と同レベルになるのと同様だ。AI の能力が十分になれば、人間と同程度のパターン認識をなすようになる。)

 その後、AI は独自の道を進んだ。それは、次の二点だ。
  ・ AI 同士で対戦する
  ・ モンテカルロ法を使う

 ここで、モンテカルロ法とは、「乱数を使って、定跡にはない意外な手を出す」ということだ。もちろん、乱数であるから、そのほとんどすべては悪手だ。とはいえ、悪手であれば、数手先までの進み方を調べて「悪手だ」と評価されて切り捨てられるから、問題ない。(実際に石を置くのではなく、読みのなかで手を調べるだけだから問題ない。)
 AI の有利な点は、「高速処理するので莫大な場合の数を調べることができる」ということだ。人間ならば、思考の節約のために、馬鹿馬鹿しい手は最初から考慮しない。しかるに AI は馬鹿馬鹿しい手をいちいち調べることができる。すると、乱数によって生じた莫大な手のうち、99.9%は悪手だとしても、まれに 0.1% ぐらいの好手が見つかることがある。そういう好手が出ると、それをパターンとして認識することができるようになる。しかも、それは、従来の思考法(人間の思考法)からは出なかった手だ。

 具体的に言おう。人間が差す手は、第2線〜第5線のあたりにある手であり、かつ、それぞれの石の置き方には図形的なパターンがある。「直線」とか、「一つ置き」とか、「コスミ」とか、「ケイマ」とか、「ハザマ」とか。さらには、さまざまな用語も、手筋もある。
( ※ 上記のリンク先を見て、Wikipedia のページの一番下を見ると、さまざまな用語が列挙されている。)
 以上のようないろいろな用語や手筋があるが、そのすべては「部分的な勢力圏を作る」という目的に従うものであり、また、石の置き方には図形的にわかりやすいパターンがある。

 AI はどうか? もちろん、人間と同じような打ち方もする。一方で、人間にはない打ち方もする。それは、「部分的な勢力圏から離れたところに打つ」という打ち方だ。この場合には、従来の人間の知っている図形的なパターンにはない打ち方となる。部分的な勢力圏からはずっと離れているので、もはや図形というような意味もなさなくなる。
 比喩的に言えば、人間の打ち方には、図形的な模様が見えるのだが、AI の打ち方には図形的な模様のない散在的な打ち方が含まれるのだ。このような打ち方で置かれた石は、図形的な意味を持たないので、人間には何が何だかさっぱり理解できない。ぽつぽつと離れた点が意味もなく置かれているように見えるだけだ。とはいえ、そのような打ち方ををすると、最終的には勝利に至るということが、モンテカルロ法でその手を探し出した AI には理解されているのだ。そして、そのような散在的なパターンを、(図形的なレベルでなく)抽象的な数値のレベルで、AI はパターン認識によって見出しているのだ。

 ──

 ここで注意すべきことがある。AI はこのとき、人間の調べる範囲を超えた範囲で好手を見出しているが、それは、AI が人間の思考力を越えた思考力を持っている、ということではない。では何か? AI は、思考によってパターン認識するのでなく、計算力によってパターン認識をする。人間が思考によって見出すことを、AI は計算力によって見出す。
 だから、結果的には同じような手を打つとしても、その過程は異なる。人間は思考し、AI は計算する。やっていることはまったく別だ。だから、見かけ上は AI は思考しているように見えても、実際には AI はまったく思考をしてない。単に計算しているだけだ。

 ここで問題が生じる。AIはどうやってパターンを見出すか、ということだ。最初は、人間の棋譜を調べるだけだったから、その量は大したことがなかった。また、人間の打ち方はだいたい同じようなものだから、そこにおいてパターンを見出すのも容易だった。
 一方、モンテカルロ法で好手のパターンを見出すとなる、とても容易ではない。まず、99.9%が悪手となるというふうに、好手そのものがとても少ない。また、たとえ好手が見つかったとしても、それは、図形的なパターンをなさないので、抽象的なパターンを発見しにくい。
( ※ 比喩的に言うと、四角や円のような図形ならばパターンを見出しやすいが、散在した点のような図形ならばたとえパターンがあったとしても、パターンは見出しにくい。)
 このような AI 独自の新たなパターンを見出すには、AI 同士で膨大な対戦をする必要がある。そのためには、ものすごく莫大な計算リソースが必要となっただろう。実際、そうだったこととは、前項のリンクで開発者が語っている。
 Googleの役割はとても重要でした。AlphaGoはプレイ中は特別優秀なハードウェアが必要ということはありませんが、AlphaGoを"鍛える"ためには多くのハードウェアが必要でした。さまざまな異なるバージョンを開発して、それぞれをクラウド上でトーナメント形式で対決させました。Googleのバックアップとさまざまなハードウェアのおかげで効果的な開発ができたのであり、そのようなリソースを持たない私たち単独ではこのような短いスパンでAlphaGoを進化させることはできなかったでしょう。
( → 「AlphaGo」を作った天才デミス・ハサビスが人工知能を語る

 ここでは、AI が対戦の前に大量の計算処理をなしたことが示されている。これこそが AI の強さの秘密だった。AI は決して、人間以上の思考能力を獲得したのではない。人間が思考でなすことを、計算によってなしたのであり、しかも、その計算量は途轍もなく膨大なものだった。その膨大な計算量によって、人間には見出し得ないものを見出したのだ。

( ※ ここで、計算量は、パターン認識をするために使われた、というのがポイントである。やみくもに計算量を増やしても意味がないので、勘違いしないように。計算量はパターン認識のために使われたという点が核心なのだ。しかも、パターン認識には、ディープラーニングの技術が使われている。ここをきちんと理解してほしい。……当然、本項は前項を引き継いでいる。)



 [ 付記1 ]
 関連するページがある。
  → 神秘の領域、中央の「厚み」・・・アルファ碁は計算した

 人間は端のあたりばかりを考えて、中央のあたりは「神秘の領域」として考えなかったが、AI は中央のあたりの領域まで計算に含めた……という話。
 ここで記されている話は、本項の趣旨ともだいたい合致する。特に、次の話は、興味深い。
 中央の部分はたいてい感覚だけに依存する上に、隅や辺が整理された後に置かれる一種の共同区域だった。だがアルファ碁は序盤から気兼ねなく中央の部分をしっかりと占めて、いつのまにか後半にはこれを徐々に眼へと脱皮させていった。どこにも使い道のない石はなかった。まるで初めから設計図を描いておいて1つずつパズルを合わせていくようだった。

 これは、本項で私も書こうと思ったことだったが、同じことを先に書かれてしまった。しかも、私が書こうと思っていたよりも、うまく上手に書かれている。
 私は囲碁についてはほとんど何も知らないので、「たぶんこうなのだろう」というふうに推測して書くつもりだったのだが、それと同じことを、いっそうはっきりと書かれてしまった。
 ここでは、上記の見解を紹介するに留める。
 ただ、上記のような見解が生じるのはどうしてかということが、本項を読めばきちんと理解できるだろう。
 
 [ 付記2 ]
 ただ、上記の記事にも、おかしな点はある。中央の「厚み」という言葉があるが、これはおかしい。
 「厚み」というのは、おおむね、「部分勢力圏」というのに等しい。
 囲碁における厚みとは盤上において影響力を及ぼすことのできる、しっかりと連絡して眼形の心配もない強力な石の集団である。「厚味」とも表記する。
( → 厚み (囲碁) - Wikipedia

 しかしながら、本項で示したように、中央部分にはそもそも「部分勢力圏」のような確固たる領域を築きにくい。中央にできるのは、確固たる自己の勢力圏ではなくて、「たまたま最終的には自己の勢力圏となった領域」であるにすぎない。
 AI においては、「部分勢力圏」のような確固たる領域を築くことは目的となっていないのだ。「僅差でいいからとにかく自己の勢力圏になった」という領域をなるべく広げることが目的なのだ。つまり、厚みを得ることが目的なのではなく、勝敗に勝つことが目的なのだ。
 どうも、人間の側は、目的と手段を混同してしまった人が多いようだ。ある意味、やむを得ないことかも知れないが。

 [ 付記3 ]
 twitter の面白い情報が集められている。
  → 囲碁界お通夜ムード、Googleの人工知能「アルファ碁」の神がかり的な強さの前に

 いくつかを抜粋する。











 ※ 次項 に続きます。




 次項へのリンクは、本項の冒頭にあります。(PC版)

 本サイト内の一覧は
   → サイト内 検索
posted by 管理人 at 23:56| Comment(1) | 一般(雑学)3 | 更新情報をチェックする
この記事へのコメント
 面白い記事があったので紹介する。(引用)

> 中国プロ棋士の樊麾(ファン・フイ)二段は「AlphaGoの手は『こことあそこに陣地を作ろう』というものではなく、最も使い勝手のいい場所に碁石を置こうとするものです。『どこに陣地を作りたいか?』ではなく『どうすれば全ての碁石の全ポテンシャルを引き出せるか?』というのが根本的な理論なのです」と語っています。
 http://gigazine.net/news/20170524-alphago-china-champion/

 ──

 これは、本項で述べた「勢力圏」云々の話と、ほぼ同じだ。
 私が書いたあと、1年あまりを経て、最高峰のプロもほぼ同じ認識をするわけだ。

 ※ 「勢力圏」云々の話は、次項でも少し述べている。

 
Posted by 管理人 at 2017年05月24日 17:57
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

  ※ コメントが掲載されるまで、時間がかかることがあります。

過去ログ