同一ブログ内における重複コンテンツのインデックスを避ける方法

ブログ技術

先日のパンダアップデート以前からですが、Googleの検索アルゴリズムでは重複コンテンツに対しては低評価の対象となる場合がありました。

ブログシステムやCMSでは自動生成ページによって意図しない重複コンテンツページが発生したりそれがインデックスされたりします。

このようなことを避けるためにどのような対策を施せばよいか、というお話です。

意図しない重複コンテンツの生成

関連した内容は

Googleのインデックスからサイトを削除する方法

という記事でも触れており、基本的にはこの応用です。

ブログシステムによる重複コンテンツの生成とは、例えば同一の記事に対して記事個別ページ・月日別ページ・カテゴリ別ページなど複数のURLでアクセスできる場合です。

当ブログの記事を例に挙げると

漢字も使える日本語フリーフォント98種類まとめ [サンプル書体付き] 2012年2月版 | 56docブログ

という記事に対して

いずれのURLからでもたどり着く事ができます。月日別/カテゴリ別一覧ページは【続きを読む】以降の記事詳細は表示されませんが、しかし出だしの部分は表示されてしまいます。

これがGoogleのペナルティ対象になるかどうかは必ずしも定かではありませんが、少なくともそれぞれ表示されるページのコンテンツの一部が重複していることは間違いありません。なので月日別/カテゴリ別一覧ページはインデックスさせないようにしておいたほうが無難でしょう。

よって先に挙げた記事に倣い、metaタグの追記とrobots.txtの作成を行っておきます。

robots.txt

忍者ブログの場合は

  • 【月日別一覧ページ】http://ドメイン名/Date/西暦から日までの8桁の数字/
  • 【カテゴリ別一覧ページ】http://ドメイン名/Date/西暦から日までの8桁の数字/Category/カテゴリ番号/

という一意のURL表記なので、これを用いてインデックス避けを施します。


User-Agent: *
Disallow: /Date/
Disallow: /Category/

以上のようなテキストに「robots.txt」という名前をつけて作成し、ブログのルートにアップロードします(忍者ブログの場合は通常の画像ファイル置き場にアップすると自動的にルートに設置されることになります)。

metaタグにnoindex指定

同様にmetaタグにもnoindex指定を付記しておきます。

忍者ブログの場合は「もし月日別一覧ページならば」「もしカテゴリ別一覧ページなら」という条件判断を行う独自タグがありますのでこれを利用します。


<!--if_category-->
<meta name="robots" content="noindex">
<!--/if_category-->
<!--if_date-->
<meta name="robots" content="noindex">
<!--/if_date-->

もしくは、「もしメインページでなければ」「もし詳細記事ページでなければ」というタグもあるのでこちらを利用してもかまいません。


<!--if_not_page-->
<!--if_not_entry-->
<meta name="robots" content="noindex">
<!--/if_not_entry-->
<!--/if_not_page-->

重複コンテンツの可能性は月日別やカテゴリ以外にコメントフォームやコメント、それに対する管理者の返信ページなどもありますので、トップと詳細記事ページ以外はインデックスさせないこのような表記のほうがスマートかもしれませんね。

注意したい点は先の例と違い条件分岐がネスト(入れ子)になってることです。ネストせず並列で not_○×△ を並べてしまうとお互いが「~でない」ことになるのでどのページもインデックスされなくなってしまいます。

この例で言うと

  • メインページなら→noindexを適用しない
  • メインページでなく詳細記事ページなら→noindexを適用しない
  • メインページでなく詳細記事ページでもないなら→noindexを適用する

というような処理の流れです。

以上のようなコードをテンプレートのheadタグ内に追記しておきます。

まとめ

具体的な手法は参考で上げた過去記事通りの内容なので目新しくないですが、ブログサービスやCMSにおける自動生成ページの特性を知っておかないと、つまらないところで読者を逃すかもしれません。必ずしもブログの人気=PVではないかもしれませんが、出来るだけの対策はしておいたほうが良いでしょう。

コメント

タイトルとURLをコピーしました