Googleのインデックスとは?インデックスされない原因・対処法も解説


「Googleインデックスとはどのようなもの?」
「SEO対策上で意識すべき理由について知りたい」
「インデックスされるための対策方法やポイントにはどのようなものがある?」
企業の経営者やマーケティング部門の担当者、Webサイトの運営者の中には、このような疑問やお悩みをお持ちの方もいらっしゃるかと思います。
世界的にインターネットが普及・浸透した中で、情報の検索と収集を行う上で検索エンジンは必須のものとなっており、そのシェアは拡大の一途をたどっています。
我が国の検索エンジンのシェアでは、Google社がトップを誇り、そのシェア率は80%を超えています。
そのため、検索エンジンを通じたWeb施策やマーケティングに取り組むことは、事業規模や収益の拡大のためにも重要といえるでしょう。
しかし、WebマーケティングやSEO対策を進める上では、Google社の検索エンジンの仕組みと「インデックス」と呼ばれる概念を理解することが大前提となります。
本記事では、Googleのインデックスの意味や検索エンジンの仕組み、インデックスが与える影響などについて解説します。
また、インデックスがされない原因と対処法についても合わせて解説します。
Webマーケティング施策やSEO対策に本格的に着手される方はもちろん、基礎的な知識を獲得して今後の施策を検討されたい方の参考となれば幸いです。
1.Googleのインデックスの概要
Googleのインデックスとは、検索エンジンの1つの機能であるといえます。
検索エンジンでは、一定のアルゴリズムに従って、入力されたキーワードやクエリに対して情報を提供します。
インデックスとは、この情報を提供する場面に関わる概念です。
そのため、検索結果の表示にも深く関わるものであり、自社のWebサイトやコンテンツが検索ユーザーの目に触れるためにも把握しておくことが重要といえるでしょう。
以下では、Googleのインデックスに関して押さえておきたい項目について順次解説します。
- インデックスとは
- 検索結果に表示されるための必要条件
- インデックスの対象となるページの判断基準
それぞれについて、見ていきましょう。
(1)インデックスとは
インデックスとは、Webサイトの情報が検索エンジンのデータベースに登録されることをいいます。
検索エンジンは、入力されたキーワードやクエリに基づいて情報を提供・表示します。
このとき、表示される情報は、検索エンジンにインデックスされている情報を対象としているのです。
つまり、インデックスされていない情報については、検索結果に表示されないことになります。
例えば、検索エンジンを図書館、検索ユーザーを利用者になぞらえてみましょう。
利用者(=検索ユーザー)は、目的の本を借りる(=欲しい情報を得る)ために図書館(=検索エンジン)を利用します。
しかし、図書館が利用者に貸し出しを行うことができる本は、図書館の中に配架されている本(=インデックスされている情報)に限定されます。
そのため、図書館は配架されていない本を貸し出す(=インデックスされていない情報を提供する)ことはできないのです。
このように、インデックスは検索エンジンが提供する情報量に関わる概念ということができるでしょう。
(2)検索結果に表示されるための必要条件
上記で述べたように、検索エンジンはインデックスされた情報のみを検索ユーザーに提供・表示します。
そして、この情報はインターネット上から収集されます。
具体的には、クローラーと呼ばれるプログラムがインターネット上のWebサイトを巡回することで情報が取得されます。
クローラーは自律的にインターネット上を巡回(クロール)することから、「ロボット」あるいは「ボット」とも表現されます。
クローラーは過去に収集したWebサイトを起点として、そのリンク(URL)をたどり、情報を取得していくのです。
そして、クローラーが取得した情報がインデックスされます。
また、クローラーが取得した情報のすべてがインデックスの対象となるわけではないことに注意が必要です。
そのため、検索結果に自社のWebサイトが表示されるためには、クローラーの巡回(クロール)とインデックスの両方が必要不可欠であることを押さえておきましょう。
なお、クローラーがWebサイトにアクセスし、その情報についてインデックスが行われるまでには時間を要することがあります。
サイトの規模や更新のタイミングなどによっても変動しますが、概ね数日から数週間程度を要するともいわれています。
もっとも、ページの新規作成や更新から数か月を経過してもインデックスがされない場合には、何らかの不具合やコンテンツに問題がある可能性も考えられます。
また、クローラーの活動量にも限界があり、特に大規模なECサイトやニュースサイトなどでは、クロールバジェット(クロールの割り当て上限)が影響することもあります。
そのため、自社のWebサイトやページがインデックスされない場合には、クローラーに内在する事情とコンテンツ自体の事情の双方が関わっている可能性も視野に入れて対策を行いましょう。
なお、クロールバジェットの概念や影響を及ぼす要素などについては、以下の記事で解説しています。
2.インデックス状況の確認方法
自社のWebサイトやページは、クローラーが巡回し、インデックスが行われることで、はじめて検索結果に表示されます。
そのため、クローラーが巡回している頻度を予測することができれば、それに合わせてページやコンテンツの制作・改修を行うことで、効率的にインデックスを促すことができるでしょう。
しかし、クローラーがどのような頻度で自社のWebサイトを巡回しているかを正確に特定することは困難であることが多いです。
それは、クローラーがインターネット上のすべてのWebサイトを巡回対象としていることに原因があります。
もっとも、自社のWebサイトやページがインデックスされているかどうかを確認する方法があります。
主に以下の2つの方法があります。
- Googleの検索機能から確認する方法
- Google Search Consoleから確認する方法
順にご説明します。
(1)Googleの検索機能から確認する方法
Googleの検索窓から特定のURLのインデックス状況を確認することができます。
具体的には、「site:」のコマンドを利用することで確認することが可能です。
確認の方法には、特別な知識や技術は必要ではなく、検索窓に以下のように入力することで容易に状況を確認できます。
- site:○○(特定のページのURL)
インデックスがされている場合には、検索結果に入力したURLが表示されます。
これに対して、インデックスがされていない場合には、「○○に一致する情報は見つかりませんでした」と表示されます。
そのため、単に特定のURLがインデックスされているか否かを確認するだけの場合には、その有無をすぐに把握することができます。
また、特定のドメインを入力すると、そのドメインの中でインデックスされているページのURLを一覧で閲覧することが可能です。
そのため、Webサイト全体のインデックス数を把握することもできるでしょう。
もっとも、検索機能で表示されるインデックス数は常に正しい情報とはいえないこともあり、正確なインデックス情報を把握することには不向きである場合があります。
特に本格的なSEO対策の一環としてインデックス状況の情報を把握するためには、正確な情報が必要不可欠です。
そのため、具体的な施策に反映させるための正確な情報を把握したい場合には、次に述べるGoogle Search Consoleを活用することがおすすめです。
(2)Google Search Consoleから確認する方法
Google Search Consoleでは、Webサイト全体、あるいは特定のページのインデックス状況を確認することができます。
具体的には、以下の2つの機能があります。
- カバレッジレポート
- URL検査ツール
カバレッジレポートでは、Webサイト全体のインデックス状況を確認することが可能です。
また、インデックス登録が行われているページ数と未登録のページ数、それぞれの推移についても把握することができます。
さらに、インデックス未登録のページについては、登録されなかった理由についても表示されるため、インデックス登録されるための具体的な対策を講じる上でも有益です。
これに対して、URL検査ツールでは、特定のページのインデックス状況を確認することができます。
そのため、自社のSEO戦略上で重要度の高いページやコンテンツに限って状況を確認し、対策を行うことができます。
このように、目的や施策に応じて活用する機能を柔軟に選択でき、施策立案などに必要なデータを把握することができる点が大きなメリットといえるでしょう。
3.Googleにインデックスされない原因
すでに述べたように、インデックスは検索結果に特定のWebサイトやページが表示されるために必要不可欠です。
そのため、自社のWebサイトなどが検索結果に表示されない場合には、インデックスがされていない可能性が高いといえます。
もっとも、インデックスがされていない原因には、大きく分けると以下の2つの事象が考えられます。
- クロールされていない
- クロールされているもののインデックスがされていない
自社のWebサイトやページがインデックスされていない原因によって、具体的にとるべき対応も異なってきます。
そのため、まずはどのような原因によってインデックスが行われていないかについて明らかにすることが重要といえるでしょう。
これらが具体的にどのような要因によって引き起こされるかについて、順にご説明します。
(1)クロールされていない
クローラーがWebサイトやページを巡回(クロール)していない場合には、当然ながらインデックスが行われません。
そのため、クロールがされていない場合には、まずはクローラーの巡回を促す対応が必要となります。
クロールがされない要因には、以下のようなものがあります。
- ページの更新にクローラーが追いついていない
- クロールを制限するタグが設定されている
順に見ていきましょう。
#1:ページの更新にクロールが追いついていない
クローラーが特定のページを巡回していない代表的な原因には、ページの更新にクローラーが追いついていないことがあります。
先ほども述べたように、クローラーがWebサイトやページを巡回(クロール)するまでには、数日から数週間ほどのタイムラグが生じることがあります。
そのため、ページの作成や更新を直近に行った場合には、クローラーがこれを検知できておらず、クロールされないことがあるのです。
このような場合には、時間の経過によってクローラーがページを検出し、巡回(クロール)することでインデックスが行われることがあります。
もっとも、自社のSEO対策という観点から重要度の高いページの場合には、クローラーがページを巡回(クロール)することを待っていては即時の効果が見込めないケースもあります。
そのような場合には、サイトの運営者側でインデックスを促すこともできます。
具体的な方法については、4でご説明します。
#2:クロールを制限するタグが設定されている
クローラーは自律的に作動しますが、サイト運営者側でクローラーを制御することも可能です。
具体的には、クローラーにはたらきかけるタグが設定されているページについては、クローラーは巡回(クロール)しません。
そのため、クロールを制限または拒否するタグがページに設定されている場合には、クロールされないことでインデックスも行われないことに注意が必要です。
具体的には、「robots.txt」タグがページに設定されている場合には、そのページはクロールの対象から除外されてしまいます。
このタグは、設計・開発中のページやコンテンツがクロールされてしまわないように設定されることが多いです。
しかし、開発が完了して公開した後にもこのようなタグが残った状態になっていると、クロールがされず、インデックスが行われなくなってしまいます。
そのため、インデックスがされていないページにクロールを制限するタグが残っていないかを確認し、必要に応じて削除するなどの対策も行いましょう。
(2)クロールはされているもののインデックスがされていない
先ほども述べたように、インデックスが行われるためには、まずはクロールされることが必要です。
もっとも、クロールされたページのすべてがインデックスされるとは限りません。
そのため、クロールは正常に行われたものの、何らかの理由でインデックスのみがされていないケースも考えられます。
具体的には、以下のようなケースにあてはまる可能性があります。
- 重複コンテンツや低品質なページと判断された
- インデックスを拒否するタグが設定されている
- リダイレクトチェーンが発生している
順にご説明します。
#1:重複コンテンツや低品質なページと判断された
ページのコンテンツや品質に問題がある場合、クローラーはインデックスを行わずにほかのリンク(URL)に移動することがあります。
具体的には、同じWebサイト内に同じまたは類似したページがすでに存在する場合やコンテンツの情報量が少ない場合などがこれにあたります。
なお、このようなコンテンツやページは検索ユーザーにとって有益とはいえないことも多いです。
そのため、検索結果として表示させる必要性も乏しく、クローラーが巡回頻度を下げるリスクもあります。
このように、コンテンツの品質はSEO上はもちろん、クローラーによる巡回(クロール)とインデックスを促すためにも重要であるといえるでしょう。
#2:インデックスを拒否するタグが設定されている
ページにインデックス登録を拒否するタグが設定されている場合には、クローラーがそのページを巡回(クロール)してもインデックス登録が行われません。
具体的には、「noindex」タグが設定されている場合がこれにあたります。
このようなタグは、品質の低いコンテンツを表示させないために意図的に設定されるケースもあります。
もっとも、コンテンツの更新やリライトを加えた後にも関わらず、インデックス登録が行われない場合には、このようなインデックス登録を拒否するタグが残ったままになっている可能性が考えられるのです。
そのため、Google Search Consoleでインデックス状況を確認した上で、タグの削除などの必要な対策を行うようにしましょう。
#3:リダイレクトチェーンが発生している
リダイレクトチェーンとは、複数のページにわたってリダイレクト処理が行われている状態をいいます。
クローラーはリンクをたどってWebサイト内を巡回しますが、リダイレクトチェーンが発生している場合には、クローラーが途中でクロールを停止してしまうことがあるのです。
そうすると、クロールがされてもインデックス登録までは行われないことになってしまい、検索結果に表示されないことになるため、注意が必要です。
そのような場合には、サイト構造の見直しを含めて、リダイレクト処理の解消などを行うことが重要です。
リダイレクトがSEOに与える影響や実装の注意点などの詳細については、以下の記事で詳しく解説していますので、合わせてご覧ください。
4.インデックス登録を促す方法
クローラーがどのWebサイトをどのような頻度で巡回(クロール)しているかを正確に予測することは難しいです。
そのため、クローラーの巡回(クロール)を待っているだけでは、インデックス登録が行われずに検索結果に表示されないこともあります。
特に更新したばかりのページや自社のSEO戦略で重要なコンテンツが検索結果に表示されない場合には、アクセス数や成果などの観点からも影響が生じるリスクがあるのです。
もっとも、サイトの制作者や運営者の側からインデックス登録を促すこともできます。
具体的には、以下の方法があります。
- Google Search Consoleからインデックス登録をリクエストする
- XMLサイトマップを作成・送信する
それぞれについて見ていきましょう。
(1)Google Search Consoleからインデックス登録をリクエストする
Google Search Consoleの「URL検査ツール」を利用することによって、インデックス登録をリクエストすることができます。
リクエスト申請は、URLごとに行うことが可能です。
特にインデックス登録がされていない理由について表示がされるため、問題を解消してからリクエストを行う必要があります。
このように、URL検査ツールはインデックス状況の確認だけでなく、インデックス登録の申請を行うことも可能です。
そのため、Webサイトの運用を行う際には有益なツールということができるでしょう。
(2)XMLサイトマップを作成・送信する
XMLサイトマップは、Webサイトの構造について記述したファイルです。
すでに述べているように、クローラーはWebサイト上のリンクをたどってサイト内を巡回(クロール)し、インデックス登録を行います。
そのため、サイトの構造をあらかじめ検索エンジン側に伝えることができれば、クローラーのスムーズな巡回(クロール)とインデックス登録を促すことにつながるのです。
XMLサイトマップは手動で作成することも可能ですが、ページの更新・追加ごとに変更を加えなければならないため、手間がかかってしまいます。
WebサイトをWordPressなどで構築している場合には、プラグインを導入することで手間なく作成を行うことが可能です。
また、作成したXMLサイトマップはGoogle Search Consoleを通じて送信することができます。
XMLサイトマップの重要性や作成方法などについては、以下の記事もご参照ください。
また、WordPressを用いた作成方法の手順やポイントについては、以下の記事で詳しく解説しています。
5.インデックス登録を最適化するためのポイント
Googleのインデックスは、巡回(クロール)頻度などの要素によって、そのタイミングなどが変動します。
そのため、Webサイトの中には、クローラーに巡回(クロール)されやすいものとそうでないものに分かれてしまうことがあることに注意が必要です。
自社のWebサイトがクローラーに巡回(クロール)されにくいものであれば、上記のようなインデックスを促す対策を行っても、インデックス登録が行われない可能性があります。
クローラーのインデックス登録を促すためには、自社のWebサイトやコンテンツを制作する時点から押さえておくべきポイントがいくつかあります。
具体的には、以下のような点が考えられます。
- ページの読み込み速度を改善する
- 重複を避けたオリジナルコンテンツを制作する
- 内部リンク設計を通じて関連性を示す構造を構築する
- 被リンクを獲得する
- ディレクトリ構造を最適化する
順に解説します。
(1)ページの読み込み速度を改善する
ページの読み込み速度が悪い場合には、クローラーの巡回頻度が低下してしまい、インデックスされにくくなります。
これは、ページの読み込み速度がサーバーの応答速度に関連していることに原因があります。
クローラーは特定のWebサイトにアクセスした際に、サーバーへの負荷がかかっていると判断すると、そのページへの巡回(クロール)を中断してしまうのです。
そのため、短期的なサーバーのエラーであればそれほど影響は大きくないものの、長期的にエラーが生じているならば、改善が必要となります。
また、ページの読み込み速度が遅い場合には、ページが表示されるまでの時間も長くなり、ページを訪問したユーザーが途中で離脱する可能性が高まってしまいます。
ページの表示速度は、クローラーの巡回(クロール)を促すだけでなく、ユーザビリティを高めるという観点からも重要といえるでしょう。
(2)重複を避けたオリジナルコンテンツを制作する
外部サイトや同じサイト上のコンテンツとの重複を避けたコンテンツ制作を行うことも重要です。
先ほども述べたように、すでに存在するコンテンツと同じか類似している場合には、クローラーはそのページについてインデックス登録を行いません。
そのような事態を回避するためには、オリジナリティを有するコンテンツ制作を行うことが重要といえるでしょう。
特にGoogle社は「E-E-A-T」と呼ばれる指標を用いてコンテンツを評価します。
具体的には、以下のような意味です。
- E(Experience):経験
- E(Expertise):専門性
- A(Authoritativeness):権威性
- T(Trust):信頼
これらは、ユーザーにとって価値のあるコンテンツであるかどうかを判断するための指標でもあります。
そのため、ユーザーが求めるコンテンツを制作し続けることで、検索エンジンにも評価され、クローラーの巡回(クロール)とインデックス登録を促すことにつながるのです。
なお、「E-E-A-T」の概念や各要素を高めるための具体的な施策については、以下の記事でも解説しています。
また、SEOを意識したコンテンツ制作のためには、キーワードを中心とした戦略設計が必要不可欠です。
SEOにおけるキーワードの重要性や選定の手順などについては、以下の記事で詳しく解説していますので、合わせてご参照ください。
(3)内部リンク設計を通じて関連性を示す構造を構築する
クローラーはWebサイト内のリンクをたどって巡回(クロール)を行います。
そのため、内部リンクの設計を行い、クローラーが巡回(クロール)を行いやすいようにサイト構造を整えることも効果的です。
具体的には、関連性のあるコンテンツどうしをリンク設計によって、つなぐことが大切といえます。
また、ページの末尾に「関連記事」や「おすすめ」などのリンクを設定することもクローラーの巡回(クロール)とインデックス登録を促す上では有効といえるでしょう。
なお、検索ユーザーのアクセス数とコンテンツの品質の向上を行うためには、複数のコンテンツを内部リンクでつなぐ「トピッククラスター」の設計も効果的です。
SEOにおける内部リンク設計の意義と効果、具体的なポイントなどについては、以下の記事で詳しく解説していますので、ぜひご覧ください。
また、トピッククラスターの設計方法やポイントについては、以下の記事も参考になります。
(4)被リンクを獲得する
自社のWebサイト内のリンク設定だけでなく、被リンクを獲得することも重要です。
被リンクとは、外部のサイトから自社のサイトに対してリンクが貼られている状態のことをいいます。
外部からのリンクがある場合には、そのサイトから自社のサイトへクローラーの巡回(クロール)を促すことができるため、インデックス登録がなされることも期待できます。
なお、被リンクを獲得する際には、数よりも良質な被リンクを獲得することが最も重要です。
検索ユーザーからの信頼度の高いサイトから被リンクを獲得することで、自社のサイトも評価され、インデックス登録がされる可能性を高めることができます。
被リンクがSEO上でどのような効果をもたらすかについては、以下の記事で詳しく解説しています。
被リンクを獲得するためのポイントや具体的な対策方法などについては、以下の記事もぜひご参照ください。
(5)ディレクトリ構造を最適化する
クローラーの巡回(クロール)を促し、インデックス登録されやすくするためには、自社のWebサイトのディレクトリ構造を最適化することも検討しましょう。
ディレクトリ構造とは、Webサイト上のどこにどのような情報が配置されているかを示すものです。
シンプルなディレクトリ構造を構築することで、クローラーが巡回(クロール)しやすくなり、インデックス登録を誘導することにもつながります。
これに対して、ディレクトリ構造が複雑な場合や階層が深すぎると、クローラーがページにアクセスせずにインデックス登録も行われない可能性が高まってしまうのです。
そのため、ディレクトリ構造をシンプルにし、階層を深くしすぎないことが重要といえます。
具体的には、トップページからコンテンツまでの階層は3階層以内に収めることが一般的です。
また、ディレクトリ構造を最適化することは、検索ユーザーの利便性を高める上でも有効であることを押さえておきましょう。
ディレクトリ構造の基本概念やSEOに効果的な設計方法などについては、以下の記事で詳しく解説していますので、ぜひご覧ください。
まとめ
本記事では、Googleのインデックスの概要やインデックスされない原因と対処法などについて解説しました。
自社のWebサイトやコンテンツが検索結果に表示され、アクセス数の増加を図るためには、クローラーにインデックス登録されることが必要不可欠です。
インデックス状況や未登録の原因を適切に把握し、必要な対策を講じることはSEO効果を高めるためにも重要といえるでしょう。
もっとも、どのような点に注意を払いながらインデックス対策を進めていけばよいのか判断が難しいケースも考えられます。
そのような場合には、TMS Partners株式会社にご依頼ください。
弊社は、Webサイトのインデックス最適化施策をはじめ、サイト制作・改修や広告運用など、幅広い支援を行っています。
