Googleが「CAPTCHA」を改良して、入力しやすくした。
Googleは、ロボットによる登録などの不正利用を防止するための“CAPTCHA”認証機能を改良。以前は読みにくく加工されたアルファベットの写真が利用されていたが、新方式ではアクセスしたのが人間かそうでないかを判断し、人間と判断された場合は読みやすい数字のみの画像が、それ以外は数字ではなくより複雑な画像が表示されるようになった。
( → 週刊アスキー )
→ 関連ページ(画像あり)
以前のひどい CAPTCHA に悩まされていた人にとっては、朗報と思えるだろう。しかし、よく考えてみると、これはまだまだ愚劣である。
というのは、CAPTCHA を使う場面は、私の場合には、次のページしかない。
「Google :サイトの登録」
Google のクロールは、ときどき漏れが生じる。私のブログのページも、ときどき登録されないで、いつまでも無登録の状態になることがある。そこで、私が手動で登録する。
そのとき、上の CAPTCHA の数字入力を求められる。
しかし、ここで CAPTCHA を要求することは、もともと必要ないのだ! なぜか? それによってユーザーは、何も利益を得られないからだ。
これが、「Google のアカウントを一つ入手する」というようなことであれば、ユーザーは認証されたことで、利益を得る。
一方、上記のようにサイトを登録することは、ユーザーにとって何ら利益にならない。
- あらゆるページはもともと Google にクロールされているはずである。
- すでにクロールされたページを再登録しても、何も変わらない。
- クロールされていないページを登録しても、ユーザーにとっては、メリットは生じない。(デメリットが消えるだけだ。)
- 仮に検索ランキングが上位になったとしても、それは検索結果の表示の問題であり、クロールの問題ではない。
というわけで、このページで CAPTCHA を要求することは、もともと必要ないのだ。
ま、どうしても「機械によるアクセスを防ぎたい」というのであれば、機械を対象とした制限をすればいいだけだ。(例。時間制限による DDoS 対策)
一方、人間に対して、15ケタぐらいの数字の入力を求める必要など、まったくない。せいぜい、4ケタでいいはずだ。
というわけで、Google は利口であるように見えて、あまりにもお馬鹿なのである。「人間と機械を区別するアルゴリズムを見つけたぞ! だからこれまでよりずっと簡単にできたぞ!」と威張っている。
しかし、いくら簡単にできたとしても、現状でもまだまだ、必要以上に複雑すぎるのだ。自分のなし遂げたことは過大評価するくせに、自分がなし遂げていないことについてはまったく気づかない。自分の利口さについては自惚れているくせに、自分の愚かさにはまったく自覚ができていない。
自称秀才には、よくあることだが。
( as is often the case with 〜 )
[ 付記1 ]
Google のお馬鹿なところは、別のところにもある。これ。
→ ベーカリーのパンは不潔だ - Google 検索
ヒットしたページの登録日付が問題だ。現在では直っていて、灰色の文字で「2013/12/01」と表示されている。(上の検索ページの左上のあたり。)
しかし、当初の2日間ぐらいは、日付が「1996/01/11」になっていた。2013年12月01日の記事なのに。(2013年12月03日 ごろまで、そうなっていた。Google の 登録日付のエラー。)
どうしてこういう馬鹿げた登録日付になったのか? 調べたら、わかった。ページのファイル名が、
19960111.html
なのだ。これを見て、1996/01/11 という日付を与えたわけ。馬鹿ですね。
( ※ ブログのソースには <h2 class="date">2013年12月01日</h2> と記してあるのだから、こっちが日付だとわかりそうなものなのに。というか、そもそも、Google に登録申請した日が 2013年12月01日 なのだから、クロールした日付はその日付にすればいいのに。バグですね。)
[ 付記2 ]
Google の検索ロボットは、しばしばクロールをサボるようになった。私のページの登録漏れを、しばしば起こすようになった。(数分間隔で二つのページを公開すると、そのうち古い方だけを登録しない、というふうな例。明らかなクロール・エラー。)
そこで、登録ページに行って、何度か登録した。するとそのうち、数字の入力を拒否して、読みにくい英字の入力を要求するようになった。たとえば、こういうの。

まともに読めませんよね。腹が立つ。
馬鹿にしている。そもそも最初から不要なチェックなのに。(本文で述べた通り。)
そもそも、「ちゃんと直した」という冒頭の宣伝は、何だ。ちっとも直っていないぞ!
( ※ 事情は、ログインした個人ごとに違うので、再現性はあまりありません。あなたの環境では、大丈夫かも。)
あなたの利益なんか知ったこっちゃなくて、Google側の都合といえばそのとおりですが、あなたの都合だけで無意味と断ずるほどのものでもないかと。
だったらアクセスをうまく制限する方法はいくらでもある。
→ 「DDoS 対策」で検索
そもそも DDoS が心配なら、Google のすべての対象に対して、奇妙な CAPTCHA を導入するべきだろう。「これを入力しないと、Google 検索結果を利用できません」というふうに。(馬鹿げているが。)
ひるがえって、ページ漏れの登録画面でだけ CAPTCHA を導入しても、 DDoS 対策としては何の効果もない。比喩的に言うと、広い草原のなかに1箇所だけ鍵をかけるようなもの。0.0001% だけに鍵をかけても、何の効果もない。
> 昔から検索エンジンのサイト(URL)登録ページはCAPTCHAを導入するのが一般的です。これしないと数百万ものURL送信を試みるウェブスパムが横行しちゃうのです
https://twitter.com/takahwata/status/409478201359204352
──
それは、登録漏れがたくさんあった昔にあっただけで、現在では違うと思う。
とはいえ、そのようなスパムだったら、通常の DDoS 対策で容易にブロックできる。例。「時間制限をかけて、連続登録はできないようにする」
ただし、もっとうまい方法がある。
「大量の登録申請があったページの検索ランキングを少し下げる」
こうすれば、登録申請をすればするほど逆効果になるので、登録申請を阻止する効果がある。
※ ライバル会社の邪魔をするという逆効果を狙うイヤガラセがあるかもしれない。そこで、検索ランキングを下げる効果は、少しだけにしておけばいい。これなら、イヤガラセの効果も少ししかないから、いくら手間暇かけても、邪魔の意味がほとんどなくなる。