日別アーカイブ: 2010/07/04

Yahoo! JAPAN のサイト情報収集システム

Yahoo! JAPAN のサイト情報収集システム (サイトを見回っているボットを含めて) って、欠陥品なんじゃないですかねぇ 🙁

ブログの記事を Yahoo! JAPAN にインデックスさせようと奮闘した方の記録があります。

そこに書いてあるのは、次のようなことです。

  • Yahoo! 推奨の Ping の送り先 URL に送っても、クロールはしにきてくれますが、feed を読みにきてくれないため、インデックスはされません。(検証済み)
  • Yahoo! 推奨には書かれていない方法だとインデックスされる
  • クローラー (サイトを見に来るボット) が RSS 2.0 を (自分から) 拾って行くくせに RSS 1.0 形式のものしか処理しない

実際、このブログも Google にはインデックスされているけど、 Yahoo! JAPAN にはインデックスされていません 😡

この奮闘された方は、上記の欠陥に対応させようとプラグインの改造を行っていますけど、これって話が逆でしょう?

情報が欲しくて検索サイトで検索する人の立場で考えると分かりやすくなると思います (そもそも検索エンジンというのは情報が欲しくて検索する人のためのものですよね)。

  • Yahoo! 推奨の Ping の送り先が機能していない (情報入手の入り口部分で母集合から漏れてしまっているサイトがある  (それもサイト運営者は Yahoo! JAPAN の推奨方法どおりの手順を行っているのに : 検索者は、情報があっても見つけることができない))
  • RSS の最新規格に対応していないだけでなく、両者を並存させていても、先にある RSS しか読まない。というか、対応していない RSS  2.0 をなぜわざわざ読む?(同上、Yahoo! JAPAN には RSS 2.0 非対応は書かれていない)

Yahoo! JAPAN は日本国内で一番使われている検索エンジンだと豪語・自慢していますけど、システム的にはまったくお粗末だと言わざるを得ません 😕

利用者には関係ないので、ここには詳しく書きませんが、「サイトエクスプローラー(サイト管理者向けツール) – Yahoo!検索」のシステムもお粗末なものでした (情報を削除しようとしても削除できなかった。Google では同じことがごくスムーズにできたのに!)。

Yahoo! JAPAN のシステムが早急に改善されるといいのですが。。。でないと、Google を使うように周りに周知しないと。。。ってことになってしまう 😕