canonical属性

検索エンジン3社、正しいサイトURLを認識させる canonical 属性を導入(URLの正規化) :: SEM R
http://www.sem-r.com/09/20090213153711.html


なるほどねー。


私が最近よく見に行く Wiki で言えば、以下の三つの URL の、どれを使っても同じページにアクセスできる:

  • http://practical-scheme.net/wiliki/wiliki.cgi?Gauche
  • http://practical-scheme.net/wiliki/wiliki.cgi?p=Gauche
  • http://practical-scheme.net/wiliki/wiliki.cgi/Gauche


この三つの URL のうち、先頭のやつを正式(canonical)な URL としたい場合は、残りの 2 つの URL でアクセスした際に出力される HTML の中で

<link rel="canonical" href="http://practical-scheme.net/wiliki/wiliki.cgi?Gauche"/>

と、書いてあげればいいってことか。

でもこれ、広まるかなぁ

でもこれ、広まるかなぁ。


検索エンジンの会社のために、なんで私たちが canonical 属性を使わなきゃならないのさ?」って考えちゃったんだけど、もしかすると、こういう利点があるかもしれない。


或る WebPage に対して、リンクいくつか張られていた時に、

  • リンクが 10 個張られている ……cgi?Gauche というページと、
  • リンクが 10 個張られている ……cgi?p=Gauche というページと、
  • リンクが 10 個張られている ……cgi/Gauche というページ


があるサイト、=「10 個のリンク * 3 ページ」という扱いより、

  • リンクが 30 個張られている ……cgi?Gauche というページ


という扱い、=「30 個のリンク * 1 ページ」になってくれたほうが SEO 的においしいのかもしれない。(どうなんだろう?)

はてぶ

はてブなんかにブックマークして、そこで、ページの内容についてわいわい議論するときも、この canonical 属性は意味があるかも。


「或る日付のページへの URL」と「或る日付の中の或る記事ページへの URL」の二つの URL それぞれにブックマークが存在していて、なんか残念な感じ。
「その日の記事が一個だけ」の場合は、canonical な URL をいっこ決めて、canonical じゃないほうの URL でブックマークしようとしたら、canonical なほうをお勧めしてくれるとか。


例:

アドオンや、rubyurl tinyurl

私は、ブログに URL を載せるのを楽にするために、Make Link という Firefox Add-on を使っているんだけど、こういうプログラムも、この canonical 属性に対応してくれるとありがたいのに。

Make Link :: Firefox Add-ons
https://addons.mozilla.org/ja/firefox/addon/142


ちなみに、この Make Link という Add-on の、はてな用の設定として、:%text%:%url% を使ってます。WiLiKi 用には、[%url% %text%] 。(自分用メモ)


URL を短くするやつ、RubyURL とか、TinyURL とかは、まさにこの canonical 属性を読むことで、自社サーバの HDD 節約に……、いや、トラフィックが増えてダメか。

RubyURL » Keep it short (and sweet)
http://rubyurl.com/home
TinyURL.com - shorten that long URL into a Tiny URL
http://tinyurl.com/
is.gd URL Shortener - The Shortest URLs Around
http://is.gd/