2009年01月27日

◆ 検索エンジンの技術

 検索エンジンの技術は、進化したように見えるが、まだ難点があるようだ。 ──

 検索エンジンの技術は、進化したように見える。だが、実際に使っていると、いろいろと不便を感じることも多い。その一方で、意外な便利さを感じることも多い。
 技術的な点に絞って、改善策を述べよう。

 ──

 (1) Google

 Google の検索で最も腹が立つのは、とんでもないノイズが入っていることだ。「広告」みたいなデカいノイズが検索結果の上位に入る。それは、
   Amazon の書籍ページ

 である。こいつがしばしば、上位に来る。しかも、該当ページと関連ページとの二本立てだ。
 まったく、困ったものだ。たまにあるならば仕方ないが、しばしば起こるのだからタチが悪い。
(書名検索したい人向けは、書名と完全一致の場合のみ表示すればいい。ただの単語ぐらいにいちいち反応するのは、邪魔。)

 なるほど、Amazon のサイトを見たい人もいるだろう。だが、そういう人はもともと Google じゃなくて Amazon に行けばいい。あるいは、検索語に Amazon と入力すればいい。
 一方、大多数の人は、そうではないのだから、Amazon の検索結果がトップ付近に来るのは、腹立たしい。何だっていちいち Amazon の広告を読まなくてはならないんだ?
 もしかして、Google は Amazon から金をもらっているのだろうか? 利用者を虐待して、Amazon という顧客を優先して、検索結果に広告をまぎれこませる……というタイプ。
 それなら、わかる。しかし、それならそれで、そう告知するべきだろう。卑怯千万なり。

 実際には違うのかもしれないが、もし違うのだとすれば、Amazon みたいな広告のような検索結果は、ランクを大幅に下げるべきだ。(他の通販についても同様。通販サイトはすべてまとめて、ランクを下げる。下げすぎる必要もないが、トップ 7 には入らないことが好ましい。)

 (2) Yahoo

 一方、Yahoo には、また別の難点がある。検索結果が、あまりにも役立たずなのだ。ゴミみたいな情報のページばかりが、やたらと上位に来る。真に役立つ情報が上位に来ない。
 これは、どうしてかというと、Yahoo が馬鹿であるというよりは、Google が優れているせいだろう。その優れた点を、Yahoo は見習っていないのだろう。
 そこで、お馬鹿な Yahoo のために、改善法を教えておこう。検索エンジンをお利口にする方法。

 (a)サイト全体の評価

 Google では、ページごとの評価ではなく、サイト全体の評価をしている。有益なサイトのページのランクは高くなる。下らないサイトのページはランクが低くなる。
 このせいで、結果的に、「優れたサイトの優れた情報」が生き残るようになる。「ゴミみたいなサイトのゴミみたいな情報」はランクが下がる。
 これはどういうことかというと、「情報の内容の質を評価する」ということだ。検索語に対して、単に関連度が高いページが来るのではなくて、多くの人々が「有益だ」と感じるページがくるということだ。
 この「サイト全体の評価」という方針は、とても頭がいい。さすがに Google は、検索のプロだ。常に進化している。
( ※ Google のこの方針は、1年ぐらい前に実行された。正式にアナウンスされているはず。)

 (b)クリックの評価
 
 ゴミみたいなページを除くためには、次の方法もある。
 「検索結果に対して、ユーザーがクリックしなかったページのランクを下げる」
 一般に、検索すると、検索結果がずらりと並ぶ。そこにはダイジェストの文章もいくらか掲載される。それを見て、「これは不要な情報だな」と思う人は、そのページをクリックしない。そういうクリックの情報を集めることで、ゴミ情報を排除できる。
 たとえば、「バラ」という単語で検索する。そこには、花の「バラ」のほかに、肉の「バラ肉」の「バラ」という結果も出るかもしれない。その検索結果は、利用者の求める結果ではない。人々はそのページをクリックしない。そのせいで、バラ肉のページは「バラ」という検索に対してはランクが下がる。(これは架空の例である。現実には当てはまらない。)
 こういうふうに「ユーザーのクリックを調査する」ということは、長い時間を経て、少しずつ修正されていく。時間がたてば立つほど、検索結果はユーザーの求めるものに近くなっていく。
 以上のこと((b)として述べたこと)は、私の想像である。ただし、このことは、Google では実際になされている、と推定できる。一方、Yahoo の方では、このことはあまりなされていないようだ。そのせいで、Yahoo の検索では、下らないページがやたらとヒットする。

 Yahoo の方は、もっと検索結果を上手に決めてほしいものだ。ユーザーの望んでいる情報がなかなか得られないからだ。現状のまま放置すると、Yahooはそのうちユーザーから見放されるだろう。そして、そうなったら、もはや二度と立ち直ることはできまい。
( ※ Yahoo の方が Google よりも多く利用されているのは、日本ぐらいのものだ。ユーザーにおける過去のしがらみのせいだろう。しかし、現実には、Yahoo の検索の方がはるかに劣る。そのことが広く知られたら、Yahoo は業績が大幅に悪化するはずだ。Yahoo の株をもっている人は、今のうちに売っておいた方がいいかも。)



 [ 付記1 ]
 本項で述べたことには、裏付けがある。私のサイトの検索結果だ。私のサイトは、Google ではかなり上位に来ることが多いのに、Yahoo では上位に来ないことが多い。そのせいで、ネット検索を通じて私のサイトに来る人のほとんどは、Google の検索経由だ。
 これほどにも差があるのは、本来はあってはならないことだろう。どちらもまともな検索エンジンであれば、どちらも似たような結果になっていいはずだからだ。
 Yahoo ちゃん、もっとしっかりして! すてきな人に気づかないほど鈍感だと、そのうちあなたがみんなに嫌われちゃいますよ。

 [ 付記2 ]
 Yahoo にはもう一つ、致命的な欠陥が一つある。次のことだ。
 「ブログ検索の結果が、通常のウェブ検索の結果に、なかなか反映されない」

 Yahoo には、「ブログ検索」という検索エンジンがある。そこで検索すると、私のサイトの内容は、比較的短期間ですぐに反映される。しかしながら、通常の「ウェブ検索」では、ブログの検索結果がなかなか反映されないのだ。
 たとえば、私が「諏訪内晶子の被害」というページを nando ブログに書いた。そのことは、Google ではすぐに反映された。Yahoo でも 「ブログ検索」では比較的短期間で反映された。しかるに、Yahoo のネット検索では、まったく検索されない状態がしばらく続いた。「諏訪内晶子の被害」という言葉で検索すると、「検索結果なし」という状態がしばらく続いた。(それでも Yahoo の「ブログ検索」ではちゃんとヒットした。)
 Yahoo では、ブログ検索の結果が、ウェブ検索から完全に切り離されている。Google も、ちょっとはその傾向があって、ブログ検索を使った方が正確な情報を得られることが多いのだが、その差(ギャップないし遅れ)は最小限に留められている。なのに、Yahoo はそういうことがない。

 一般的に言って、Yahoo の検索技術は、Google に比べて大幅に劣っている。特許がどうのこうのということではなく、技術レベルそのものが大幅に低すぎる。基本ができていない。
 もうちょっと本腰を入れた方がいいですよ。……さもなくば、昔みたいに、Google のエンジンをそっくりそのまま借用した方がいいかも。途中でやめて、インクトミのエンジンに乗り換えたけど。失敗でしたね。

 [ 付記3 ]
 インクトミは、Yahoo に買収された会社。今では子会社。Yahoo がインクトミのエンジンを使っているということは、「Google 製のエンジンをやめて、子会社製のエンジンにすることで、経費を浮かせる」という意味がある。
 しかし、そのせいで、性能は大幅に低下したわけだ。
 その結果は? ユーザーの不便。
 さらに、もう一つ。MSNも、インクトミのエンジンを使っていたが、とうとう愛想をつかしたらしい。最近のニュース。
  → 米MSNがYahooの検索エンジンに三行半?
 そのうち全ユーザーに三行半を突きつけられるかも。株は暴落か?
posted by 管理人 at 18:24 | Comment(2) | コンピュータ_02 | 更新情報をチェックする
この記事へのコメント
「ショッピングサイト除外検索」で検索してみて下さい。
きっとあなたの人生が少しだけ楽しくなると思います。
Posted by 黒猫屋 at 2009年01月28日 22:30
情報、ありがとうございます。
 だけど、完全に除外するのも困りもの。書名を探せなくなってしまうので。単語で検索した際のランクを下げるだけでいいのだが。

 また、それを検索オプションにしてくれればいいのだが。
 独自の検索ページを使うのでは、あまり意味がない。
Posted by 管理人 at 2009年01月28日 22:47
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。
  ※ コメントが掲載されるまで、時間がかかることがあります。

過去ログ