忘れる前に覚書。優しい文章を目指します。
ザ・覚書 ザ・覚書
出来るだけ子供にも、わかりやすいように書いて行きたいと思います。

PCバージョンでサイトを表示しています。
【ザ・覚書 3クリックアンケート実施中】
暑さの一番の原因はなんだと思いますか?
あなたの支持する政党はどの党ですか?
ザ・覚書のトップページに戻る今のページの関連ページのリストへ

ページにBingのBingBotが大量にクロールして来た場合

☆ページにBingのBingBotが大量にクロールして来た場合

マイクロソフトさんが、運営するサーチエンジンのBingが
検索結果の表示の為に、ホームページを見に来る事をクロールとかいいますが、
それが私の管理する別のサイトに同じ日に数万件もクロールするという事がありました。

このクロールをしているプログラムの名前をボット(Bot)とかいうようです。

Bingの場合は、BingBotというのが来ます。

サーチエンジンの検索で、ページを表示してもらう為には大事な機能なんですが、
これが今回、問題になりました。

きっかけは、レンタルサーバーさんから負荷が酷いから調べてと連絡を受けました。
調べてみると、Bingからのアクセス。
どうやらこのBingBotが暴走して、何回も同じページをみたりして、
ページのあるサーバーに負荷をかけているようでした。
で、マイクロソフトさんにもログを提出し、確認してもらいました。

サーバーにあるrobot.txtというファイルに、ボットのクロールの間隔をかけるんですが、
これは書いていませんでした。

で、追加しようとしたんですが、どうやって書くかというと、
普通、



 User-agent: ボット名
 Crawl-delay: 間隔(秒)




だと思っていて、他のボットには、
 Crawl-delay: 60
とか書いていたんですが、

BingBotの場合、問い合わせて聞いた結果、どうも値が違うようで
Crawl-delay は、最大30。
31以上は、正常に読めないとの事らしいです。

Crawl-delayは、ボットによって秒とは限らないようです。

今は、


 User-agent: BingBot
 Crawl-delay: 10



としておきました。


この数値の意味も聞いていたんですが、
どうも問い合わせの質問に対する答えをなかなか返して頂けないので、
疲れて言われた通りの値にしておきました。

英語のページとかみていたら、もしかして、これ?
1: Slow
5: Very slow
10: Extremely slow

あと、過去BingBotは、msnbot だったんですが、
User-agent: msnbot
Crawl-delay: なにか
の部分は、消しておいてととも言われました。


忘れない為にも、Bingさんのクローラが異常に来て困っている方の参考にも書いておきます。

また、時間が経てば仕様が変わるかも知れませんが。


どうもBingはまだ説明などの日本語対応が進んでいないようでちょっとわかりにくいです。
こういう所をまず良くしないと、Bingさんのサーチエンジンの日本でのシェアは増えないかも。
マイクロソフトさんの製品(Windowsとか)の説明書等の日本語もいつも難しいですね。

Bing Web マスター ツールという、サイト管理者用のWebツールも随分日本語化になって来ましたが、
このサイトは登録していませんでした。
ここでもクロール速度の設定が出来るのですが、数値を入力するのではないので、ちょっとハッキリしないです。



記載:2013年01月頃





Twitter Facebook Google+ はてな Pocket LINE




一言掲示板です。なにかありましたら以下に書いて書き込みボタンを押して下さい。
管理人による書き込みの確認後、荒らし書き込みでない場合に表示させていただきます。
悪意ある書き込みや挑発的な書き込みと思われる内容は、表示させません。
その為、ちょっと書き込みから表示までに時間がかかってしまいます。ご了承下さい。

お名前

コメント




【ザ・覚書 3クリックアンケート実施中】
暑さの一番の原因はなんだと思いますか?
あなたの支持する政党はどの党ですか?

今のページの関連ページのリストへ
ザ・覚書のトップページに戻る
全ページのリストへ