どんなサイトにも独自の変更・更新頻度があります:ホームページは1ヶ月に1回変更されるかもしれませんし、ブログは週に1回か2回変更され、ニュースサイトであれば1時間に何度も変更されます。
同様に、サイトのコンテンツは常に価値を持ち続ける(そのページが存在する限り役立つ情報)か、有効期限があります。一般的に有効期限があるタイプのコンテンツは以下のような特徴を含んでいます。
- 別のURLでアップデートが行なわれるニュース記事
- 完売して在庫補充予定もない商品ページ
- 期日の過ぎたイベントが記載されるイベントリスト
- コンテンツがある状態から空の状態へと変わるリストページ(検索結果やカテゴリページ等)
この記事では、以下のようなコンテンツへの2つの対処法を扱います。
関連するコンテンツへのリダイレクト (301)
または
ユーザーフレンドリーなページデザインと関連するステータスコード (200/404/410)
新しいコンテンツまたは関連したコンテンツがある場合:
もし古いページがサイトに価値をもたらしていない場合には301リダイレクトを使用して新しいバージョンへリダイレクトしてください。再度利用する可能性のあるページに関してはリダイレクトではなく、Googleの数クロールの範囲内で再度インデックスされるようにしましょう。
しかし、新しいバージョンが公開される予定がある場合には、301リダイレクトを最適なガイドラインに従って管理しなければなりません。そのためには、以下”リダイレクトチェーンに注意する”の項目を確認してください。
または古いバージョンを新しいバージョンにリンクすることもできます。この方が技術的には容易であり、管理するリダイレクトは少なくなります。この場合、参照用に古い情報をそのままにしておくと良いかもしれません。更新のためのリンク付けは手作業でコンテキストリンクを使うか、またはコンテンツのテンプレート内で関連コンテンツをコントロールするタグを使うことで管理できます。古いコンテンツをさかのぼって利用したい読者が想定される新しいストーリーの更新やブログ記事に関しては、おそらく最善の方法と考えられます。
リダイレクトチェーンに注意する
例えば、商品AからBへリダイレクトし、さらにBからCへとリダイレクトするようなことは避けるべきです。Googleは同じチェーンにおいて4〜5回のリダイレクトのみ認めているために、これはクロールの効率性を阻害するだけではなく、遅延を発生させ、結果的にサイトパフォーマンスに問題を生じさせてしまう可能性があるからです。
リダイレクトの管理に関するさらなる情報はこちらのガイド.をご覧ください。
新しいバージョンが存在しない場合:
ユーザーがサイトから離脱してしまわないように、関連コンテンツを追加するなどしてページをアクティブにしておきましょう。リンク先のページが提供する情報を、もともとユーザーがそのリンク元のページから期待していたものであるようにし、リダイレクトによってユーザーを困惑させないように注意してください。また、これらページの直帰率をチェックして追加したページが意図した通りに機能しているかどうか確認するようにしましょう。
同じURLにおける404エラーがあると、数回のクロールで検索結果から削除されてしまう可能性があります。なお、これは後ほど再度アクティベートしてクロールすることができます。
同じURLにおいて410エラーが発生している場合、そのページは即座にインデックスから外されてしまいます。これも再度アクティベートしてクロールすることができます。
期限切れのページのための特別なサイトマップ
期限の切れたページを含むXMLサイトマップを使うことで、これらのページをより早くインデックスから削除することができます。他のインデックス可能なURLと分けるために、これらのページを別のサイトマップに追加すると良いでしょう。John Mueller氏のGoogle hangoutで2014年にこれに関して詳しい説明をしています。
404や410, 301などが大量にあるとペナルティが発生するのか?
404や410, 301などが多くあるからといってペナルティはありません。GoogleのGary Illyes氏はTwitter上で最近広がっているこの噂を払拭しようとしていますし、John Mueller氏も2013年にこの点に言及しています。
Whoever came up with the idea that having 404s gives a site any sort of penalty, you’re wrong. Utterly wrong.
— Gary Illyes (@methode) August 6, 2015
大量の301リダイレクトや期限切れないし価値が低い404エラーのあるURLは、直接的に順位表示に影響を及ぼすような問題ではありません(適切に行っていればという条件付きですが)。
ソフト404エラー
Googleが404ステータスを返していないが、もはや固有で価値のあるコンテンツではない期限切れ、ないし内容の薄いページをアクティブに見ているのは事実です。ソフト404エラーに関するGoogleのガイドはこちら
ソフト404エラーとされるページはGoogleサーチコンソールに表示されます。表示箇所は [クロール] > [クロールエラー]です。
これは設定上のエラーである場合もありますが、そうでなければ質の高い”ソフト404”ページを作成することで期限切れページのパフォーマンスの可能性を広げてみると効果的です。
例えば、Eventbrite社のサイトでは期限切れのイベントページで今後開催されるイベントのバナーが表示されています。この手法は類似商品やリスティングにも適用できます。
DeepCrawlを使って期限切れのページを管理する上で役立つレポート
クロールの種類:ユニバーサル or リスト
期限切れのURLがDeepCrawlでどのように機能するか検証する方法は2つあります。
- ユニバーサルクロールにオーガニックのランディングページを含むことで、以前はトラフィックがあったが現在は期限切れとなっているページを発見します。
- すでに期限切れとなっているページのリストがある場合、これらのURLがどう機能するかを検証するためにターゲティングしたリストクロールを行なってください。
固有のページ、重複したページ、ページネーションのあるページ
期限切れのページは、固有である、重複している、ページネーションがあると表示されることがあります。[インデックス > インデックス可能なページ] で取得できる関連レポートにより、意図する形で表示されているかを確認できます。
同じ商品やイベントの異なるバージョンのものは重複ページとして[インデクセーション > インデックス可能なページ > 重複ページ] に表示されています。古いバージョンのものは最新のバージョンに301リダイレクトしておくと良いでしょう。
同様のレポートはソフト404ページを見つけるのにも役立ちます。これは、ソフト404は仮に元々異なるコンテンツであったとしても、クロールの時点では全て同じに見えるためです。
3301リダイレクト / 301以外のリダイレクトまたは4xxエラー(破損ページ)
ステータスコードが404, 410, 301, 302等の期限切れのページは[インデクセーション > 200以外のページ]にある関連レポート内に表示されます。
noindex設定ページまたは正規化されたページ
noindexが設定されていたり正規化されていたりするページは、[インデクセーション > インデックス不可ページ]に表示されます。