あなたのブログが継続してGoogleにインデックスされているかを調べる方法
ずっと背後でいろいろとブログをいじくっています。その一つが「より検索エンジンを意識したサイト作り」です。
いかにツイッターやFacebook、Google+といったソーシャルメディアが大切になったといっても、ウェブサイトやブログにトラフィックを運んでくれる大きな「土台」は検索エンジンです。
当ブログでも、24時間いつでも約50%のトラフィックは検索経由となっていて、瞬間的にアクセスが増える人気記事があったとしても、時間で積分した場合は検索経由に敵いません。
でも自分のブログで毎日書いている記事がちゃんとGoogleにインデックスされているのか、誰もが気になるところだと思います。こうした情報を確認するために使うのがGoogleの提供している「ウェブマスターツール」ですが、とりわけ大切な、「Googleにいくつのページがインデックスされているか」という情報を一覧表示できる「インデックス・ステータス」について Google Webmaster Central Blog で紹介されていました。### インデックス・ステータス = Googleが登録しているページ数
インデックス・ステータスを確認するには、まずウェブサイトをウェブマスター・ツールで利用できるように登録しなければいけません。すでに登録されているなら:
-
- ウェブマスター・ツールにログイン、目的のサイトを選ぶ
-
- 左タブの「健全性」をクリック
-
- メニューの「インデックス・ステータス」をクリック
の手順でインデックス・ステータスを表示します。すると、以下のようなグラフが表示されます。ウェブマスター・ツールに以前から登録しているなら、過去一年にわたってのグラフが表示されています。
これはGoogleからみてインデックスされているページの総数です。ブログの場合、これが記事数に一致しないのはアーカイブのページや、個別のタグのページなどもすべて含んでいるためです。
細かい変動はさておき、このグラフが右肩上がりであれば、毎日の記事がちゃんとインデックスされているということになります。このグラフの場合、あるときインデックス数が急に増えていますが、それはちゃんと過去記事のアーカイブを作成してトップページから辿れるように調整したときに対応しています。
もう少し深くみてみる
総数が変な数字だったり、ブロックされているページがある疑いがある場合は、「詳細」のタブをクリックして詳細なグラフを表示します。
ここでは先ほどのインデックス・ステータスのグラフに加えて、「クロール済み」「未選択」「ロボットによりブロック済み」のページ数が表示されます。
これらは以下のような意味をもっています。
-
クロール済み: サイト内で Google がこれまでにクロールした URL の累計。ただし、重複、noindex、canonicalではないなどの理由で、このすべてがインデックスされるわけではありません
-
未選択: 他のページに類似している、リダイレクトになっているなどの理由でインデックスされていないページ数です。
-
ブロック済み: robots.txt によって禁止されているためにインデックスできなかったページ数です
普通、インデックスされたページ数はクロールされているページ数を大きく下回ります。
グラフを活用してみる
これらの数字は、急激な変化や異常な数値に着目することで利用します。
たとえば、毎日せっせと記事を書いているのにインデックス数が増えていない場合は noindex などを間違って使っていないか、システムに問題があってアクセスできないページがないかといったチェックを行います。また、サイトのURL構造を変えてしまった場合などには「未選択」が急に増えることもあるようです。
インデックス・ステータスの数値はあくまで総数なので、問題がありそうな場合は同じくウェブマスター・ツールの「クロールエラー」の欄などを参考に、Googleからみたあなたのサイトが健全かどうかを確かめましょう。
苦労して書いているのだから、せめて自動で行きかうGoogleのボットにはちゃんと捕捉されてほしいものですよね!