──
三浦九段の問題で、調査委が報告書を出した。この件については、前にも論じた。
→ 三浦九段に「推定無罪」
このときは、時間もなくて、ざっと目を通しただけだったが、改めて報告書を読み直してみた。下記で入手できる。
→ 将棋ニュース 第三者調査委員会からの結果報告書の開示
この PDF を見ると、気になる点が二つあったので、記す。
(1) 序盤と終盤
一致率を調べるときには、序盤と終盤を除くべきだ……と私は書いた。
→ 技巧だけとの一致率 [ 付記 ]
これに関して、「調査委はそうしていない」というふうに思ってきて、そう書いてきたが、それは私の誤認だった。報告書には、次の記述がある。
別紙4に記載した合計9パターン(以下「本件9パターン」という。)のデータ分析を行った。その結果、例えば、「F前半40手、後半10手を除く」パターンの一致率 ……
こういうふうに、「F前半40手、後半10手を除く」というパターンで調査したこともあるわけだ。
したがって、「調査委はそうしていない」(序盤と終盤を除いていない)というふうに見なした私の認識は、間違いだったことになる。
「必ずちゃんと序盤と終盤を除いた」とまでは言えないにしても、「ちゃんと序盤と終盤を除いた場合についても、(いくらかは)考慮した」と見なすのが妥当であるようだ。
この意味で、私の認識は間違っていた。お詫びして、訂正します。
(2) データの非公開
上記引用部では「別紙4に記載した」という記述がある。そこで、別紙4 というのを見ようと思ったのだが、文書を検索すると、次の記述が見つかるだけだ。
ただし別紙1〜別紙4は非公表とする。
呆れる。肝心のデータ(別紙4)が非公表なのだ。これではあまりにも滅茶苦茶だ。
これは、科学論文で言えば、実験データを隠すようなものだ。実験データを何ら示さずに、「データから判明しました」とだけ言って、結論だけを出すようなものだ。根拠不明なので、まったく信頼性がない。
データを公開ないで結論を出すなんて、滅茶苦茶すぎる。そもそも、プライバシーでも何でもないデータを隠蔽するなんて、意味がないだろう。ただの隠蔽だ。悪質である。
これがなぜ問題か? それは、調査委の論証のデタラメさを指摘するのに役立つからだ。(数字は一致率)
例えば、「F前半40手、後半10手を除く」パターンの一致率のかい離についてみると、渡辺戦における一致率は、最大で80.95%となったものの、最小で61.90%となっており、同一条件での分析であるにもかかわらず、19.05%ものかい離が生じた。同様に、……
《 以下、事例多数 》
……同一条件の下での分析であるにもかかわらず相当のかい離が最大値と最小値の間で生じたといえる。
当委員会は、FRONTEOの分析を踏まえ、本件9パターンの全てについて同様の分析を行ったが、やはり相当のかい離が最大値と最小値の間で確認された。このように一致率等は同一条件にて分析を行ったとしても、その分析結果が分析ごとにかなりのばらつきを示す指標であることが明らかになった。
したがって、本件4対局の一致率等の高低を論じたり、三浦棋士の他の対局や他の棋士の対局との一致率等を比較するにしても、その数値自体が相当にばらつくものである以上、かかる安定性の低い数値との比較等の結果を、三浦棋士が本件不正行為を行ったか否かを調査することに用いることは著しく困難であるといわざるを得ない。
これが調査委の結論である。つまり、(一致率の)データにはバラツキがある。最大値と最小値の差は大きい。だから、一致率という数字は安定的に得られないので、まったく信頼できない数値だ……という結論だ。
これを読んで、「なるほど。もっともだ」と思う人も多いだろう。たとえば、
「最大で80.95%、最小で61.90%」
というデータを見れば、
「まともな一致率の数値なんてないんだな」
と思うだろう。
しかし、ここには、数字のペテンがある。
ここには、最大値と最小値しか記していない。他の中間的な値がどうなったか、まったく記していない。常識的に考えれば、正規分布になったと推定できる。そして、正規分布だとすれば、バラツキのある最大値と最小値については、カットしてしまってもいいのだ。
たとえば、
「最大で80.95%、最小で61.90%」
というデータが得られたとしても、残りの9割ぐらいが 75% の近辺だとすれば、「一致率は 75% であると推定していい」というふうになる。
ここで得られる 75% という数値は、明らかに意味のある数値であって、無視できるようなものではないのだ。
なのに調査委は、最大値と最小値という、無視してもいいような数値にばかりこだわって、その数値の乖離の大きさばかりを重視する。
これでは、例外的な数値ばかりに着目して、肝心の有意義な数値を無視するようなものだ。
具体的に示そう。

この図では、点の分布に、バラツキがある。
二つの点が、密集領域からはずれていて、最大値と最小値を(縦横とも)与えている。しかし、他の大部分は、ほぼ一定の狭い範囲に収まっている。
とすれば、ここでは、重要なのは、密集した狭い領域に分布しているものだ。
一方、最大値と最小値を与える2点は、例外的なものであり、無視していい。
これが統計的な認識というものだ。
ところが、調査委は、無視するべき2点(最大値と最小値を与えるもの)ばかりを重視する。そして、「最大値と最小値の差が大きいから、この統計分布には意味がない」と結論する。
呆れる。デタラメの詭弁としか言いようがない。統計のことをまったく理解できていないか、理解していてゴマ化しているか、どちらかだろう。
そして、そのどちらであるかは、推定が付く。
ただし別紙1〜別紙4は非公表とする。
これによって調査委の意図は明らかだ。生のデータを出すと都合が悪いから、隠蔽しているわけだ。
これはもう、ほとんど捏造と同様である。正しい結論を出すためのデータを隠蔽して、データをデタラメに解釈して、事実とは正反対の結論を出す。
たぶん本当は、こうなるはずだ。
「一致率の分布は、75% の近辺に集中していたので、この数値を一致率と見なしていい」
なのに調査委は、正反対の結論を出した。
「最大で80.95%となったものの、最小で61.90%となっており、同一条件での分析であるにもかかわらず、19.05%ものかい離が生じた」
というふうに、最大値と最小値の差の大きさ(本来は無視するべき例外的な数値についての値)ばかりを重視した。
換言すれば、データのうち、正しいデータについては隠蔽し、捨てるべきデータばかりを採用した。
これはもう、捏造も同然だろう。
そして、その捏造ふうの行為を隠蔽するために、「別紙4を非公開」というふうにしたわけだ。
かくて、世間の人々は、みんなだまされた。
調査委は、STAP 事件の主導者よりも、はるかに巧妙に世間をだました、と言える。
おまけに、多額の調査料を頂戴したのだから、もはや、詐欺も同然だな。
( ※ 最低限、別紙4 を公開するべきだね。そうすれば、彼らの論理の欠陥が、赤裸々に暴露されるはずだ。)
[ 付記 ]
一般に、統計的に意味があるかどうかを調べるには、「分散」という値を計算する。
分散が小さければ、バラツキが少なくて、統計の意味がある。
分散が大きければ、バラツキが大きくて、統計の意味がない。
ところが調査委は、分散を調べるかわりに、最大値と最小値の差(乖離)を調べて、「この値が大きいから統計的に無意味だ」と結論した。
統計学のイロハも理解できていない、というしかないね。
最小値と最大値のみが外れているとなぜ言えるのかな?
上で”正規分布となったと推定できる”と明確に述べておきながら、”あえて”最小値と
最大値のみが外れている図を示してペテン師呼ばわりする根拠はどこから来るかな?
もしかして持論展開のための願望が含まれていない??
正規分布のはずだと推定し統計的な認識としながら、最大値と最小値を無視できる
更には
>「一致率の分布は、75% の近辺に集中していたので、この数値を一致率と見なしていい」
というのは統計学から見るとかなり乱暴だとどら猫は思うよ。
せめて
『調査委員会からの報告では一致率結果は正規分布を取り、3σが取りうる値の最大値と最小値
XXXと・・・』
程度の詳細分析は公表しなければ、「データから判明しました」とだけ言って、結論だけを
出すようなものだ。根拠不明なので、まったく信頼性がない。
といった論陣を張ってほしかったな
あくまで、正規分布(ガウス分布)にこだわるならだけどね〜〜
いずれ、左メニューの「最近のコメント」がこの話題のコメントで占領されて、他の記事のコメントを参照することができなくなりますので、適当な時期に閉じてください。
正確にはおっしゃる通りなんだけど、そんなに厳密性にこだわると、難しくて理解できなくなる人が続出するでしょう。だから、あえて単純化しました。
だいたい、話の対象は、「統計学を理解できない人」ですよ。「統計学を理解できない人」に説明するのに、統計学の話を持ち出したら、チンプンカンプンでしょう。
あなたの話を理解できる人なら、そもそも最初から間違えません。
──
本項最後に [ 付記 ] を加筆しました。
仮に統計がおっしゃるとおりだとしても、それでクロとするには遥かに遠いということを第三者委は言ってるのだと思います。
たぶん調査委は、そのつもりなんでしょうね。統計学というものを根本的に誤解している。
統計学というのは、「確からしさ」がどのくらいであるかを、数値で示すものだ。なのに調査委は、そういう数値化をしないで、「信頼できるか、できないか」という二者択一になってしまっている。そのために、数値を隠蔽する。
数字に弱い文系の人ばかりだと、こういうことになる。弁護士だから、白黒しか判断できないのだろう。中間値を数値化するという発想が根本的にない。要するに、非科学的。
数字ばっかりで法律的、社会的素養があるに欠けるからそんな風に捻じ曲がった考えになる。
いや、数字ばっかりというよりも、単に歪んだ自尊心との持主というだけですね。
もう少しちゃんとしたブログかと思ったのですが、残念。
それは処分の話でしょ。本サイトでは処分の是非の話はしない、と何度言ったらわかるんだか。人の話を読めないのか?
罰するかどうかは白黒の二択だが、本サイトはそれについては言及しない。不正があったかどうかについて統計的・論理的に推測する。それが目的だ。
百回言ってもわからないような人は、対話能力・読解能力がないので、本サイトには来ないでください。
科学的実験ならば実験条件を揃えることで一定の結果に近づくものだろうというふうに理解していますが、この件では実験条件の考慮はされていない(露骨に言うと使い方の多少次第で変化する)のではないでしょうか
そんなの見てないですから。
このブログでも自分の都合のいいところしか読まずにやってるでしょう。それと同じです
しかし、そうであれば、第三者委の先生方から、「前提において失当」と言われてオシマイですね。その主張は。
つまり。その辺の検証はハナからする必要性がないから第三者委はしていないだけじゃないかなということです。
FRONTEOは行動情報データ解析の専門会社です。
そのFRONTEOによって一致率にはバラつきが大きいとの分析結果を示されたから、調査委員会は念のためそれを確認したうえで、一致率からの証拠認定が困難であると結論したわけだ。
つまり解析の専門会社が一致率からの統計的に意味のある解析結果は出せないと結論しているはずなんですよ。
にもかかわらずそれができると言うのなら、管理人はその分析方法とやらを公表してくれませんかね?
私だってそう主張していますよ。あなた、私の主張を全然読んでいないんだね。人の話を読んでから書きましょう。特に、勝局・敗局の話。
> 管理人はその分析方法とやらを公表してくれませんかね?
公表済み。あなたが読んでいないだけ。というか、読んでもみんな忘れちゃったんでしょ。
私は分析をしたのは分析のプロである専門会社だと主張しているんだよ。
そのプロが、一致率から有意な証拠認定はできないと報告したわけだ。プロの目から見て無理ということだ。
で管理人の以前示した手法なるものは具体的にどれのことですか?
曖昧ものでなく、具体的な手法を説明しなければ、分析方法を公表したとは言えないですよ?
以前たいして時間もかからない手法であると答えておられたので、それくらいなら書けますよね?
私の言う具体的というのは、〇〇の対局の棋譜を〇回、〇〇のソフトで〇手から〇手まで解析して、〇〇と比較する。という説明を求めているんですが。
でなければ確認のしようがない。
それじゃ駄目だ、と何度言ったらわかるんだ。将棋のアマじゃ駄目なんだよ。セミプロクラスでないと。
あとね。その会社がプロであろうと何であろうと、統計的なデータ(特に分散)を示していないのであれば、(調査委などに)隠蔽体質があることになる。
本項の核心は、その指摘だよ。「おれは利口だからわかっている」と威張っても駄目なんだ。「他人に理解させる」ことが必要であり、そのためには、数値の公開が必要なんだよ。わかるかな? あなたには理解できないか。
> 私の言う具体的というのは、〇〇の対局の棋譜を〇回、〇〇のソフトで〇手から〇手まで解析して、〇〇と比較する。という説明を求めているんですが
私はセミプロクラスじゃないので、私はそれにはふさわしくない。ふさわしい人は別に掲げた。
http://openblog.seesaa.net/article/443034310.html
私は「こういう方針を取れ」と言っただけだ。私が実際に分析するわけじゃない。そんなことを要求するのは、弁護士に分析させるのと同様だ。筋違い。
筋違いのことを要求するあなたは、もう支離滅裂。
管理人が分析するわけじゃいということはつまり、管理人は具体的な分析方法を示せないということだね。
分析方法を示せない人間が、どうして正しい分析方法が存在すると主張できるのか?
ちなみに、山本一成氏は三浦事件についてこれまでコメントしていないが、
2番手Aperyの平岡氏はかなり早い段階から三浦冤罪と述べておられましたよ。
ま、ここいらでやめますわ。
世間的にはもう決着ついてますし。
それ、弁護士に言えば? あなたの説だと、調査委の調査は無意味になるね。
> 管理人は具体的な分析方法を示せないということだね。
基本は示している。あなたは日本語を読めないだけ。
管理人さんの手法は
@6月以降については技巧とだけの一致率を見ればよい。(他ソフトとの手との照合)
A6月以前の対局については『桜花(ボナンザ)との一致率を見るべきだったのだ。
の2本立てで良いのかな?
各々の場合について検証範囲は
・序盤と終盤を除く
・勝局のみ
・他ソフトについては調査する人の設定次第
とか突っ込みどことろ満載だけどね〜
ちなみに管理人さんに対してどら猫が一番疑問に思っていることは、
ttp://openblog.seesaa.net/article/445399232.html#more
のコメントにも書いたけど
『統計』という言葉を極めて恣意的に使用していることなんだな。
例としてだけど
『対局中に長時間の離席等の異常行為が認められなかった』ことに対して
管理人さんの主張は
> 十時間以上に及ぶ対局のすべてを録画していた、とは書いてない。録画された分については異常行為が見つからなかった、と書いてあるだけだ。
> 結局、ここでも「調査不十分」「証拠不十分」があるだけだ。「証拠が見つからなかったこと」は「シロであることが証明されたこと」とは違う。
> 十時間以上に及ぶ対局のすべてを録画していて、それを漏れなくチェックした、というのならば話は別だが、そんなことはどこにも書いてない。だから、そうではないはずだ。
だった。
これだって、統計的には
母集団として全体局時間 :対局全体
抽出したサンプリング(標本)時間:ビデオで確認した時間
としてとらえ、十分な近似が得られれば良いはずだけどね〜〜
つまり、
自分の都合のいい案件にはすべてを調べなくても統計学で推定されると強引に決めつける
都合な悪い案件には全てをチェック出来なければ無効と主張する
というのはかっこ悪いと思うんだな〜〜
前にも書いたけど、どら猫はこの件について白黒自体に興味ないし、一致率の検証結果
にも興味ないよ
大体、一致率一致率と連呼しているけど、標準誤差の大きさすら検討できない(自らばらつきが大きいと言っている)状況で
数%の中央値の差を有意な差としてとらえているところが滑稽なのさ〜〜
> 都合な悪い案件には全てをチェック出来なければ無効と主張する
全然違うよ。
(1) すべてを調べる必要がある。勝局だけでなく、敗局も見るべきだ。そして、勝局と敗局の一致率の乖離を見るべきだ。
(2) 「全てをチェック出来なければ無効」とは言っていない。「そうでない可能性も残るから、正しいとは言い切れない」ということ。真っ白ではないと言っているだけで、白を否定しているわけじゃない。クロだと決めつけているわけでもない。「まだ不明」「証拠不十分」と言っているだけだ。そして、その理由は、報告書には生データがないことだ。「長時間の離席がない」というが、長時間ってどれだけだ? 5分間でも足りるかもしれないぞ。
とにかく、報告書は、公開データが不足している。そして、その理由は、「非公開」という決定だ。ここが駄目なんだよ。何でデータを非公開にするんだ? 私は隠蔽体質を批判している。(本項で。)
>「そうでない可能性も残るから、正しいとは言い切れない」
一致率云々の主張の時の様に統計的に****と判断できる
といった使い方はしないんだ〜〜〜
ちなみに今回の場合、標準誤差はどの程度だと見積(推定)もってる???
あ、標準誤差はSEのほうね、SEMのほうじゃなくて
ちなみにどら猫は報告書の隠ぺい体質とやらはどうでもいいと思っているからね!
所詮全体の重要度からしたら枝葉末節程度だと思っているしね
ビデオで確認しているのは「ソフトウエアを利用できる時間が有ったか」じゃあないよ
確認対象は
『某棋士が言った、不自然な離席の存在』
のはずだよ
意図的に確認目的を捻じ曲げないでほしいな〜〜
ブログ内の将棋の記事を参照させていただきましたが、もう三浦九段関連の記事をアップしない方がいいと思います。いくらアクセス数が稼げるとはいえ。
電脳戦第5局の記事で、(http://openblog.seesaa.net/article/435849895.html#more)
> 管理人さんは生放送をしっかりご覧になっているのでしょうか?
見ていませんよ。もちろん。私は将棋オタクじゃないし。そんな暇ないし。本局も、棋譜を見て、原稿を書くので、全部で1時間もかかっていない。
本サイトが将棋のことを書くのは、コンピュータと人間の戦いが話題になったときだけです。将棋ファンのサイトじゃないし。下手の横好きでちょっと口を出しただけ。
将棋ってのは、実際に指しているときよりは、ヘボのくせに岡目八目のつもりで、はたからギャーギャー喚いているときが楽しいんです。
実際に戦えば、負けることが多くて、ちっとも面白くない。
と書かれています。
下手の横好きで口を出すには、ちょっとアクセス数が集まりすぎて、全く将棋を知らずにググってきた人に勘違いを与える印象を記事を見ていて感じます。
自分の好きなことを好きに書きたい気持ちは理解致しますが、「記者会見を見る」とか「雑誌を読む」とか「対局動画を見る」とか一次情報を得ずに、ネットサーフィンだけの情報を元に記事をアップするには、ちょっと影響がありすぎるアクセス数だと思います。
長文失礼しました。
弁護士とはいえ、元々は検察出身…
そこらへんの考慮はあまりないですか?
(1) 弁護士だから、「白」にするのが商売。「金を出した人に有利にする」のではなく、「今後金を出してくれる人向けに、白にするのが有利だとアピールする」のが優先。「クロにするのが商売だ」と思われたくない。
契約済みの相手には、損をさせてもいい。どうせ金はぶんどれる。それより、今後契約してくれそうな客向けにアピールするのが大事。
(2) 捜査官という手足がなくて、頭だけの検察官がいても、無意味。具体的には、将棋の知識のある人が皆無。法律屋と統計屋がいるだけ。
それでも今一度。
弁護士は依頼人の利益よりも、依頼人に不利益になっても白の結論を出すほうが、今後の商売に繋がるという考え方ですか?
弁護士は依頼人の利益にした方が商売じゃないかなあ
契約済の依頼人には損させても構わないなんて弁護士と誰も契約しないでしょ。
弁護士だから白でも黒でも依頼人に有利にする方が商売だと思うのですが、管理人さんは違う考えということですね。
そんなことに興味はないとか言ってしまうのだろうけど、ネチネチブログで不満を綴るより生産的だとおもいます。
私としては三浦九段の6月以降の勝局6局、1局あたり約100手だとして序盤40手終盤10手を除いた50手の全150手で黒だと断定できる証拠は出せないと思いますが。
私は黒だとは断定していない。「調べなさい」と言っているだけです。お間違えなく。
調べもしないで結論を出しているのが調査委だ。実を言うと、何通りかのうち、ほんの少しのケースでは、「序盤40手終盤10手を除いた50手」を調べたこともある。しかしそれはあくまで例外的だ。
だから私は「すべての手でそういうふうに調べろ」と言っているわけ。「序盤も終盤も含めた全手数で調べた(という)調査委の調査は無効だ」と言っているわけ。
私は「ちゃんと調べろ」と言っているのに、あなたは「調査委はちゃんと調べないでいいから、かわりに管理人さんが調べなさい」と言っている。
だったら、私に莫大な調査費を下さい。とりあえず、2000万円を請求します。さっさと私に払ってね。払えないのなら、黙っていて。
この記事の一番の間違いは、調査の不備が明確な意図をもって行われたとしか捉えようとせず、一意的な解釈のもとに執筆されている点にありますな
三浦九段の白黒には興味ないんですよ。ここを間違えちゃあいけない。(断言)
管理人さんは、三浦九段とその他の棋士と、将棋ソフトの示す手の比較をして
『ほら三浦九段とその他の棋士の間には一致率に差があるでしょう』
と言いたいだけなんですよぉ〜
そのために、勝局のみとか、終盤を除くとか差が出やすいと思われる標本化の
方法を提示しているんですよね。
当たってる?
当たってます。
というか、その趣旨でもう何十回も書いたんだが、いまだに理解できずに誤解して、「クロだと決めつけるな」と文句を言ってくる人が続出する。枚挙に暇がない。
そろそろ呆れてきたので、コメント欄を閉じます。