- 公開日: 最終更新日:
インデックスとは?確認方法やSEOとの関係性を解説
SEOを行う方にとって、インデックス数を意識することは大切です。
インデックスとは、検索エンジンのデータベースにホームページのコンテンツを格納することを言い、されていないページは検索結果に出てくることがありません。
当記事では、インデックスとは何か、SEOとの関係性、Googleがインデックスする流れ、確認法、されない原因と対策法、SEOに必要になるページ数の目安を解説します。
目次
インデックスとは
インデックスという言葉は、さまざまな業界で利用されています。
当記事で解説するインデックスとは、SEOに限定しており、意味としては検索エンジンのデータベースにホームページのコンテンツを格納することを言います。
検索結果で表示されるタイトルやmeta description、画像、URLは、データベースから出力された情報です。
さらに、検索順位もデータベースで決定しているので、インデックスされていないページは、検索結果に表示されることはありません。
インデックスとSEOの関係性
検索エンジンにインデックスされることは、SEOの第一歩目になっており、その関係性を解説します。
インデックスされたページが検索結果に出てくる
検索結果に表示されるタイトルタグやmeta description、画像、URLは、検索エンジンのデータベースから出力されています。
さらに検索順位もデータベースで決定されています。
つまり、インデックスされていないページは、検索結果に出てくることがなく、検索エンジンからの訪問者数を増やすことはできません。
関連性が高まりサイト全体のSEO効果が高まる
インデックスされたページというのは、検索エンジンのデータベース内で、何を言いたいのかが解析され、関連した内容のページの検索順位を上げる効果があります。
検索エンジンは、ページ単位だけではなくサイト単位での評価も行っているので、1つのテーマに対して詳しいホームページであるほど、さまざまなページのSEO効果が高まっていきます。
Googleがインデックスする流れ
Googleは、クロールキュー→クロール→レンダリング→インデックスの流れでインデックスを行っていて、それぞれについて解説します。
また、Google検索セントラルのJavaScript SEO の基本を理解するという記事に、インデックスの流れが紹介されているので、Webに関する知識がある方はそちらの記事もご覧ください。
ちなみに検索エンジンではなく、Googleがインデックスする流れを紹介している理由は、他の検索エンジンでは情報を公開していないからです。
クロールキュー(検出)
クロールキュー(検出)とは、GoogleがページのURLを発見することを言い、クロールすべきページを発見した際にそのURLをキュートしてリスト化する作業を行います。
すなわち、インデックスしてもらう最初の作業は、クロールキュー対策になっており、XMLサイトマップの送信や、外部リンクと内部リンクの獲得が必要になります。
特に新規で公開したページは、クロールキュー対策が必要になっているので、過去にアップロードしたページから内部リンクを行うことが重要になります。
クロール
Googleは、クロールキューでリスト化されたURLをクロールしていきます。
クロールはGoogleのデータベースにコンテンツを格納していくことを指しており、Googleがインターネットに公開しているすべてのページにアクセスできるようにしましょう。
また、クロール効率を高めるためには、canonicalタグを利用したURLの正規化やWordPressを実装したホームページであれば意味の分からないページが生成されないようにして、負担を減らさなくてはなりません。
Googleはインターネットに公開されているページはすべてクロールしようと考えていますが、ホームページごとに上限が定められているので、不要なページはクロールされないようにすることが大切です。
レンダリング
クロールが終わったあと、Googleはレンダリングという処理を行っており、人がブラウザでホームページを閲覧する見栄えを確認する作業を行っています。
Googleは単にソースコードを確認しているだけではなく、視覚的にもページの内容を確認しており、例えばソースコードに記述はあるけれども、表示されていないコンテンツの存在をチェックしています。
インデックス
クロールキューとクロール、レンダリングを行って、合格点に達していた場合に、Googleはインデックスを行ってくれます。
インデックスされないページには以下の問題があります。
- インデックスしてもユーザーに価値がないページ
- まったく同じ原稿のページが他にあり重複コンテンツと判断されたページ
- ソフト404などのエラーと判断されたページ
- レンダリングが正常に行えなかったページ
Googleはインターネットに公開しているすべてのページをインデックスしようと考えていますが、訪問者に価値のないページはデータベースに格納したくないとも考えています。
インデックス状況の確認法
インターネットに公開したページがGoogleからインデックスされているかの確認法を紹介します。
Google検索を利用
Google検索を使ってインデックス状況を確認する方法を紹介します。
サイト全体のインデックス数を確認する方法
サイト全体でどれくらいのページがインデックスされているかを確認する方法として、Googleを使って、【site:(トップページのURL)】で検索を行いましょう。
トップページのURLは、https://から記述することと、URLの最後は/までを記述します。
上記でGoogle検索を行うと、検索バーの右下にツールというボタンがあるので、そこをクリックすると、右側に何ページがインデックスされているかが表示されます。
ページがインデックスされているかを確認する方法
ページがインデックスされているかを確認する方法は、Googleを使って【site:(調べたいページのURL)】で検索を行いましょう。
インデックスされていれば、以下のような検索結果が表示されます。
インデックスされていないと以下のような検索結果が表示されます。
Googleサーチコンソールを利用
Googleサーチコンソールを利用して調べる方法を解説します。
Googleサーチコンソールについて詳しくはこちらをご覧ください。
登録済みの確認
インデックス作成>ページにアクセスすると、サイト全体での未登録と登録済みページ数が表示されます。
サイト全体として、Googleがインデックスしているページ数は、登録済みとして表示され、また個々のページで見る場合は、「インデックス登録済みページのデータを表示」をクリックしましょう。
URL検査
GoogleサーチコンソールのURL検査を利用すると、ページがインデックスされているかどうかを確認できます。
URL検査でインデックスされていた場合は、以下のように表示されます。
インデックスされていない場合は、以下のような表示になります。
インデックスされない原因と対策法
検索エンジンにインデックスされない原因とは主に2点があります。
また、Googleにインデックスされない原因と対策法という記事で詳しく解説しているので、インデックスされないとお悩みの方は、あわせてご確認ください。
1. 検索エンジンがページに気が付いていない
検索エンジンがページに気が付いていない場合、そのページがインデックスされることはありません。
例えば、以下のような原因が考えられます。
- robots.txtの設定ミス
クローラーのアクセスが拒否されている。 - noindexタグの使用
ページにnoindexタグが記述されている。 - リンクの欠如
ページにサイト内外からのリンクが1本もないため、クローラーが発見できない。
また、XMLサイトマップを作成してGoogleサーチコンソールから送信することで、Googleにサイト全体のページの存在を知らせることができます。
2. コンテンツの品質が低い
コンテンツの品質が低いと、インデックスされることはありません。
具体的には、以下のようなケースが該当します。
- ページタイトルと無関係な内容
ページタイトルと実際のコンテンツが一致しない。 - 薄いコンテンツ
内容が極端に薄い、もしくは価値がない。 - 重複コンテンツ
他のページと内容が重複している。
検索エンジンは訪問者が満足しないと判断したページをインデックスしません。
したがって、ホームページの内容を見直し、ユーザーに価値を提供できるようにリライトすることが重要です。
SEOに必要になるインデックス数の目安
SEOで必要になるインデックス数の目安の考え方を紹介します。
Googleは、検索キーワードに対して詳しいページやホームページの検索順位を高めているので、御社が上位表示を狙っているキーワードで上位表示を実現しているホームページよりも、多くの良質なコンテンツを作成することが大切です。
そのため、上位表示を狙っているキーワードで1位から10位までのホームページに対して、【site:(トップページのURL) "(上位表示を狙っているキーワード)"】とGoogle検索を行いましょう。
"(上位表示を狙っているキーワード)"については、そのキーワードに関連したページのインデックス数を調査する際に利用ができるので、サイト全体のインデックス数よりも少なくなる傾向があります。
ただし、ヘッダーやフッターなどの全ページ共通コンテンツに上位表示を狙っているキーワードが含まれていると、サイト全体のインデックス数と変わらない傾向があります。
この平均値が御社のホームページが1ページにランクインするために必要なページ数になります。
ただし、Googleは、ページの品質を見ているので、例えば御社が10ページで、ライバルサイトが1ページしかないのにライバルサイトに勝てない場合は、コンテンツが低品質になっている可能性があります。
そのため、SEOに必要になるインデックス数の調査法は、あくまで目安を調べるための方法になっており、最終的には各ページでユーザーニーズに応えるためのコンテンツが重要になっています。
インデックスのまとめ
本記事ではインデックスについて解説しました。
Googleは、データベース内で、情報を検索結果に表示させたり、検索順位を決定しているので、インデックスを行ってもらうことは、SEOのスタートラインということができます。
インデックスって何や、Googleにインデックスしてもらえないとお思いの方の参考になれば幸いです。