- 公開日: 最終更新日:
ソフト404とは?404エラーとの違いやSEOで不利になる理由、原因と対策法
ソフト404は、ページが存在しないにもかかわらず、Googleに「存在している」と誤って伝わってしまっている状態を指します。
ソフト404が発生したらWebマスターは改善に取り組む必要があり、この状態が続くとSEOとしてもユーザー体験としても低下してしまうので、集客力とコンバージョン数に大きなマイナス影響が出てしまいます。
当ページでは、ソフト404とは何か、404エラーとの違い、改善しないとSEOで不利になる理由、調べ方、原因と対策法を解説します。
目次
ソフト404とは
ソフト404とは、存在しないページが「存在しない」ことを示す404ステータスコードを返すべきにもかかわらず、誤って「存在する」ことを示す200ステータスコードを返している状態です。
この状態では、Googleがそのページを誤って有効なページと認識し、検索結果に表示してしまいます。これにより、Googleユーザーは404 NOT FOUNDページにアクセスすることになり、ユーザー体験が損なわれる可能性があります。
さらに、ソフト404が存在すると、Googleからの評価が低下するリスクがあり、早急な改善が必要です。
ソフト404と404エラーの違い
ソフト404と似た言葉に404エラーがあり、その違いを解説します。
ソフト404 | 404エラー | |
サイト上の表示 | 404 NOT FOUND | 404 NOT FOUND |
HTTPステータスコード | 200 | 404 |
Googleの認識 | ページとして認識 | 存在しないページとして認識 |
ソフト404も404エラーも、ユーザーに表示されるページは同じく「404 NOT FOUND」となりますが、Googleはステータスコードでページの存在を判断します。そのため、ソフト404の場合は「存在しているページ」と誤認し、検索結果に表示してしまいます。
また、404 NOT FOUNDについて詳しくはこちらで解説しています。
ソフト404を改善しないとSEOで不利になる理由
Search Consoleヘルプには、「ソフト404エラーはユーザーやGoogleにとって混乱の原因となるおそれがあります。」と記載されています。
つまり、ユーザー体験の低下やSEO効果の低下が懸念されるのです。では、なぜソフト404があるとSEOに悪影響を与えるのか、その理由を解説します。
低品質コンテンツとみなされる
404 NOT FOUNDのページは、通常シンプルに作成され、サイト内検索や主要なページへのリンクだけが含まれることが多いです。しかし、404ページが200ステータスコードで返されると、Googleはそれを価値のないページと判断し、数が増えるほどサイト全体のSEOに悪影響を与えます。
重複コンテンツと判断される
404 NOT FOUNDページは異なるURLで同じ内容を持つため、Googleはこれを重複コンテンツとみなします。重複コンテンツが多いとSEOパフォーマンスが低下し、検索順位が下がるリスクが高まります。
ユーザー体験が低いとGoogleに判断される
404 NOT FOUNDページが検索結果に表示されると、訪問者はブラウザバックを使い、検索結果に戻ってしまいます。これにより、Googleはユーザー体験の低いホームページと認識し、SEOの評価が低下します。
無駄なクロールが発生する
200ステータスコードが返されたページは、Googleのクローラーが定期的にアクセスします。
SEOにおいて、クローラーの訪問頻度はホームページの評価に影響する重要な要素です。存在しないページにクローラーが訪問すると、無駄にクロールバジェットを消費してしまい、本来クロールすべき重要なページへの訪問が減少し、SEO効果を最大限に発揮できなくなる恐れがあります。
ソフト404の調べ方
ソフト404の調べ方を解説します。
HTTPステータスコードチェッカー
HTTPステータスコードチェッカーを使って404 NOT FOUNDページのURLを入力し、「チェック」をクリックしましょう。チェックが完了するとステータスコードが表示されるので、そこで200と表示されていれば、ソフト404になっています。
Googleサーチコンソール
当社のホームページはソフト404がないので、項目名が表示されておらず、キャプチャー画像はありません。ただ、ソフト404があるホームページでは、Googleサーチコンソールのインデックス作成>ページにソフト404の項目が表示されます。
ソフト404の原因と対策法
ソフト404の原因とその対策法について解説します。
HTTPステータスコードを変更
404 NOT FOUNDのページがソフト404として誤認されている場合は、HTTPステータスコードを正しく設定する必要があります。これは技術的な作業を伴うため、専門的な知識がない場合はホームページ制作会社に相談することをおすすめします。
PHPを使用している場合は、以下のコードをページの先頭に追加することで、404エラーを正しく返すことができます。
<?php header(“HTTP/1.1 404 Not Found”); ?>
<html>
<head>
<title>Page Not Found</title>
</head>
<body>
<?php $error_message='<h1>ページが見つかりませんでした</h1>’; echo $error_message; ?>
</body>
</html>
このコードにより、404エラーが発生した場合に適切なステータスコードが返され、ソフト404の問題を回避できます。
低品質なコンテンツを改善する
Googleは、ページが存在していてもコンテンツがほとんどないとソフト404として扱うことがあります。
この場合は、ページの内容を見直し、リライトすることでコンテンツの充実を図りましょう。具体的には、文章量を増やし、訪問者に価値ある情報を提供することが重要です。
Googleが正しく読み込みができるようにする
ソフト404が発生する原因として、Googleがページを正しく認識できないケースもあります。以下のような要因が考えられます。
- robots.txtでクローラーのアクセスを制限している
Googlebotのアクセスが制限されていると、ページの情報が正しく取得されず、ソフト404として扱われる可能性があります。 - 画像や大きなファイルが多い
ページに大量の画像や大容量のファイルがあると、ページの読み込みが遅くなり、ソフト404として認識されてしまいます。 - 表示速度が遅い
ホームページの表示速度が遅いと、Googleがページを適切に処理できず、結果的にソフト404となる可能性があります。
これらの問題に対処するためには、ホームページの速度改善やファイルサイズの最適化、そしてクローラーのアクセス設定を見直すことが重要です。
ソフト404のまとめ
ソフト404について解説しました。
ソフト404は、ユーザー体験を低下させるだけでなく、Googleにも誤解を与える可能性があるため、必ず改善に取り組む必要があります。
ソフト404にお悩みのWebマスターの参考になれば幸いです。