ウェブマスター向け公式ブログ
Google フレンドリーなサイト制作・運営に関するウェブマスター向け公式情報
著作者情報のマークアップに対応しました
2011年11月24日木曜日
この度、Google ではウェブ上のコンテンツとその著作者を関連付ける、著作者情報のマークアップに対応いたしました。素晴らしい著作者によるコンテンツを検索結果の中で見つけやすくするために、このデータを使用していこうと考えています。
現在 Google では、ウェブサイト内のコンテンツから著作者情報ページへリンクするマークアップに対応しています。たとえば、多くの記事を書いている The New York Times の記者がいたとします。ウェブマスターは著作者情報をマークアップすることによって、これらの記事を The New York Times の記者ページに関連付けることができます。著作者情報ページは、著作者がどういった人物か説明するものであり、著作者の略歴、写真、書いた記事、その他のリンクなどを含めることができます。
もしあなたがこうした記事等の著作物を掲載したサイトを運営しているなら、ぜひ著作者情報のマークアップについて
ヘルプ記事「著者情報」
をご一読ください。このマークアップは、各検索エンジンやその他のウェブサービスが、ウェブのいたるところに存在する同一の著作者による著作物を識別できるよう、HTML5 (rel=”author”)や XFN (rel=”me”)などの既存の標準技術を利用しています。
schema.org のマイクロデータ
(英語)を使用した構造化データのマークアップを既に行っている場合でも、Google は著作者情報として認識します。
Google では、このマークアップを可能な限り簡単に取り入れられるようにしたいと考えています。そのために、The New York Times、The Washington Post、CNET、Entertainment Weekly、The New Yorker などの複数のサイトと協力してページのマークアップに取り組みました。さらに、YouTube や Blogger がホスティングするすべてのコンテンツにもマークアップを追加しました。将来的には、どちらのプラットフォームでもコンテンツの公開時に自動でマークアップが追加されるようになります。
良質なコンテンツは素晴らしい著作者によって生み出されます。Google ではこのマークアップによって、コンテンツの著作者を強調したり、検索結果のランク付けを改良したりできないか、その可能性を模索してまいります。
Posted by Othar Hansson, Software Engineer
Original version:
Authorship markup and web search
クロスドメイン URL の選択 - 複数のドメイン間の重複コンテンツの正規化について
2011年11月15日火曜日
このブログでも何度か
重複コンテンツ
に関して取り上げてきました。重複コンテンツとは、同じコンテンツが複数の URL(同一のドメインにある/なしを問わず)に存在することを指しています。Google では、コンテンツが重複するページ グループを発見した場合、アルゴリズムに従ってコンテンツを代表する URL を 1 つ選択します。ページ グループには、同じサイトからの URL も、別のサイトからの URL も含まれます。複数のドメインが含まれるグループから代表 URL が選択された場合、この選択は「クロスドメイン URL の選択」と呼ばれます。簡単な例を挙げると、a.com からの URL と b.com からの URL が含まれる同じコンテンツのグループで、b.com から代表 URL が選択された場合、a.com の URL はそれ以降 Google の検索結果に反映されず、検索からのトラフィックが減ることがあります。
ウェブマスターは、
rel="canonical" 属性
や
301 リダイレクト
などを適切に設定することで、アルゴリズムに選択すべき URL を伝えることができます。アルゴリズムによる選択は、ほんとんどの場合こういったウェブマスターの意図が正しく反映されています。しかし時折クロスドメイン URL の選択を不適切と感じたり、不適切な場合の対処法が分からない、といった声を耳にすることがあります。
そこで Google は、クロスドメイン URL の選択の透明性を高めるために、ウェブマスター ツールに登録された URL ではなく外部 URL がアルゴリズムによって選択された場合、それをウェブマスター ツールにメッセージとして表示し始めました。このメッセージの詳細については、
クロスドメイン URL の選択
を参照してください。今回のブログ記事では、クロスドメイン URL のよく見られるいくつかのケースについて取り上げ、不適切な選択を修正する方法についてお話しします。
不適切なクロスドメイン URL の選択がされる主な原因
クロスドメイン URL の選択が適切になされるようアルゴリズムに伝える方法は数多くあります。
実際ほとんどの場合、Google のアルゴリズムはウェブマスターが代表 URL を示すために設定したシグナルに基づいて選択を行います。たとえば、ウェブマスターがサイト移転時の
ガイドライン
や
ベスト プラクティス
(英語) に従っていた場合は、新しいウェブサイトの URL が代表 URL であることを Google のアルゴリズムに正しく伝えていると言えるでしょう。ウェブサイトの移転中にウェブマスター ツールで今回実装された新しい通知メッセージを受信した場合、Google のアルゴリズムがサイト移転に気付いたと見なすことができます。
その一方で、アルゴリズムが代表にしたくない URL を選択した場合はどうすればいいのでしょうか。クロスドメイン URL の選択が不適切 (ウェブマスター側の希望と異なる) であった場合、いくつかの方法で状況を改善することができます。以下に、意図と異なるクロスドメイン URL の選択が行われる一般的な原因と、その修正方法をご紹介します。
複数リージョン向けウェブサイトを含む重複コンテンツ
:多くのウェブマスターの方が、ときには不注意で、そしてときにはユーザーの所在地によってコンテンツを提供するために、同じ言語でほぼ同一のコンテンツを複数ドメイン上で公開しています。たとえば、ウェブマスターが example.com と example.net の両方で英語の同一コンテンツを用意したり、example.de、example.at、example.ch で 1 つのドイツ語のウェブサイトをホストしたりすることは珍しくありません。
ウェブサイトの性質やユーザーに応じて、現在サポートされている正規化の方法のうちいずれかを用いて、代表 URL をアルゴリズムに通知することができます。詳細については以下の記事を参照してください。
正規化
、特に
rel="canonical" 属性について
と
301 リダイレクトについて
多地域、多言語のサイト
、また
マルチ リージョン サイトの作成について
(英語)
rel="alternate" hreflang="x" について
設定ミス
:一部の設定ミスによって、アルゴリズムが誤った選択を行うことがあります。例として以下のようなものがあります:
正規化の間違い
:
正規化
の設定の際に誤って外部ウェブサイトを指定してしまうと、アルゴリズムがその外部サイトの URL を検索結果への表示用に選択してしまうことがあります。これは、ウェブマスターが導入したコンテンツ管理システム (CMS) や CMS プラグイン の設定に間違いがある場合に発生します。
こういった状況が発生している場合は、ウェブサイトで使用する URL を誤って正規化している部分 (rel="canonical" 属性や 301 リダイレクトの不適切な使用) を見つけて、修正します。
サーバーの設定ミス
:時折、サイト a.com のコンテンツが b.com の URL に返されるという、ホスティングの設定ミスが見受けられることがあります。また、2 つの無関係なウェブ サーバーが同一の
ソフト 404 エラー
を返すと、Google がエラー ページと判断しないことがあります。いずれの場合も、同じコンテンツが異なる 2 つのサイトから返されたと見なされ、アルゴリズムが a.com の URL を b.com の正規化と判断して選択してしまうことがあります。
こういった場合は、ウェブ サーバーのどこに誤りがあるのか調査する必要があります。たとえば、サーバーがエラー ページに対して HTTP 200 (成功) ステータス コードを返したり、同一サーバー上でホスティングされている別のドメインへのリクエストを取り違えたりすることがあります。問題の原因が分かり次第、サーバー管理者と協力して設定を修正してください。
悪意のあるウェブサイトへの攻撃
:ウェブサイトに対する攻撃の中には、勝手に正規化を行うコードを生成するものがあります。たとえば、サイトに
HTTP 301 リダイレクト
を返させるものや、HTML や HTTP ヘッダーにドメインをまたがった
rel="canonical" リンク属性
を挿入するものがあります。この場合は悪意のあるコンテンツをホスティングしている外部 URL を指すことが一般的です。このような例では、攻撃を受けたウェブサイトの URL ではなく、悪意のある URL やスパム URL がアルゴリズムに選択されてしまうことがあります。
このような場合、
サイトがハッキングされた、またはマルウェアに感染した場合のガイドライン
に従い、再審査リクエストを送信します。ウェブマスター ツールの
Fetch as Googlebot
機能を使用すると、Googlebot に見えているようにコンテンツを表示し、
クローキング
された攻撃を検出できます。
また、まれにではありますが、あなたのコンテンツをあなたから許諾を得ることなく使用している外部サイトの URL が選択されることがあります。著作権に違反して、他のサイトにコンテンツを複製された場合、そのサイトのホストに連絡を取って削除を依頼してください。また、
DMCA (デジタル ミレニアム著作権法) に基づく要求を提出する
ことで、権利を侵害しているページを検索結果から除外するよう Google にリクエストすることもできます。
この記事について詳しい情報は、ヘルプ記事「
クロスドメイン URL の選択
」をご覧ください。コメントやご質問は、
ウェブマスター ヘルプフォーラム
までお寄せください。
Posted by Pierre Far, Webmaster Trends Analyst
Original version:
Raising awareness of cross-domain URL selections
多言語ウェブサイトの作成について
2011年11月9日水曜日
多言語のウェブサイトとは、複数の言語に向けてコンテンツを提供するウェブサイトです。多言語のウェブサイトの例には、日本語に加えて中国語と韓国語で公開されているアジアをターゲットとした企業のサイトや、ヨーロッパのサッカーチームのファンサイトを日本語とそのチームの母国語で公開している場合など様々なサイトがあります。
通常、多言語のウェブサイトを作成する意味があるのは、ターゲット ユーザーの使用する言語が複数にわたっている場合です。
ヨーロッパのサッカー チームのブログが日本にいるそのチームのファンに向けたものであれば、日本語のみで公開しても問題ないでしょう。しかし、世界中のそのチームファンにも読んでもらいたいと考えるなら、英語やそのチームの母国語のコンテンツも用意すると役に立つことでしょう。
Google の言語認識
Google はページごとにその主となる言語を判断しています。
言語を認識しやすくするために、ページごとに使用する言語を統一すること、そして原文と訳文を一緒に表示しないことをおすすめします。
1 ページについて複数の言語を認識することも可能ではありますが、ページ内のすべての要素(ヘッダー、サイドバー、メニューなど)の言語は統一して使用することをおすすめします。
Google では「lang」属性から文書型定義(DTD)まで、コードレベルの言語情報はすべて無視します。一部のサイト制作ソフトでは、これらの属性が自動的に作成されるため、ウェブページの言語を判断する際にこうした情報はあまり信頼できないためです。
一般的に Google である言語で検索を行う場合、ユーザーは検索した言語に最適化された検索結果が表示されることを期待しています。そこで、
サイトの多言語化を図る際には、検索結果に表示されるスニペットや URL などにも気を配る事が重要となります。
以下にそのためのヒントをいくつか紹介します。
多言語のサイトの分析: URL 構造
多言語のウェブサイトを作成するときに、特別な URL を用意する必要はありません。とはいえ、URL を見て自分がウェブサイトのどのセクションにいるのかを把握できればユーザーにとって便利です。たとえば、次のような URL が使われていると、ユーザーは自分がこのサイトの中の英語用コンテンツにいることが把握できます。
http://example.ca/
en
/mountain-bikes.html
http://
en
.example.ca/mountain-bikes.html
一方、次のような URL であれば、同じページをフランス語で表示していることがわかります。
http://example.ca/
fr
/mountain-bikes.html
http://
fr
.example.ca/mountain-bikes.html
また、このような URL 構造を使うと、多言語コンテンツのインデックス状況が分析しやすくなります。
非英語文字が含まれる URL を作成する場合は、必ず UTF-8 エンコードを使うようにしてください。UTF-8 でエンコードされた URL であれば、コンテンツ内からリンクされた場合も適切にエスケープされます。手動で URL をエスケープする必要がある場合は、
オンラインの URL エンコーダ
を利用するのが簡単です。たとえば、次の URL を英語からフランス語に翻訳するとします。
http://example.ca/fr/
mountain-bikes
.html
翻訳後の URL は次のようになります。
http://example.ca/fr/
vélo-de-montagne
.html
この URL には非英語文字が 1 文字(é)含まれているので、ページ内のリンクで使用するために適切にエスケープすると次のようになります。
http://example.ca/fr/v
%C3%A9
lo-de-montagne
多言語のウェブサイトのクロールとインデックス
まずはじめに、自動翻訳したページをインデックスの対象としないようにしてください。自動翻訳は意味が通じない場合があるため、スパムとみなされる可能性があります。また、自動翻訳されたコンテンツは、しばしばユーザーにとって理解できなかったり、不自然に感じることがあります。そのようなコンテンツを多言語のウェブサイトとして作成するのは、ユーザーにとって有益ではありません。
多言語化を行う場合は、Googlebot がサイトのすべての言語バージョンをクロールできるようにしてください。また、ページ間で相互にリンクすることをおすすめします。つまり、同一コンテンツを異なる言語で掲載したページ間をリンクします。ユーザーにとってもこのリンクは非常に便利です。先ほどの例を使って説明すると、たとえばフランス語を使うユーザーが http://example.ca/en/mountain-bikes.html にアクセスしてしまった場合、ワンクリックで http://example.ca/fr/vélo-de-montagne.html に移動して同じコンテンツをフランス語で表示することができます。
サイトをよりクロールされやすくするために、ブラウザの言語設定による自動的なリダイレクトを行わないようにしてください。このようなリダイレクトを行うと、ユーザー(と検索エンジン)がサイトのすべての言語バージョンを見られなくなる場合があります。
最後に大切なこととして、各言語のコンテンツには別々の URL を使用してください。つまり、多言語間で同一の URL を使って Cookie でコンテンツを切り替えるような構造は避け、それぞれの言語ごとに URL を設定しましょう。
文字コードの使用
Google は、HTTP ヘッダー、HTML ページ ヘッダー、コンテンツから文字コードを直接判定します。文字コードに関して注意していただきたいのは、コンテンツとヘッダーの間などで情報が矛盾していないか注意することです。Google ではさまざまな文字コードを認識できますが、可能であればウェブサイトでは UTF-8 を使用することをおすすめします。
多言語のウェブサイトの作成についての説明は以上です。この記事に関するコメントやご質問は、
ウェブマスター ヘルプフォーラム
までお寄せください。
Written by Xavier deMorales, Google Search Quality
Original version:
Working with multilingual websites
ラベル
+1 ボタン
AMP
API
App Indexing
Google プレイス
Merchant Center
Search Console
イベント
ウェブマスターガイドライン
ウェブマスタークイズ
ウェブマスターツール
ウェブマスターフォーラム
オートコンプリート
お知らせ
クロールとインデックス
サイトクリニック
サイトマップ
スマートフォン
セーフブラウジング
セキュリティ
データー ハイライター
ハッキング
ハングアウト
ビデオチュートリアル
マルウェア
モバイルサイト
リッチスニペット
検索エンジン最適化
検索結果
構造化データ
国際化
再審査リクエスト
初級者向け
上級者向け
中級者向け
アーカイブ
2016
2月
1月
2015
12月
11月
10月
9月
8月
7月
5月
4月
3月
2月
1月
2014
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2013
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2012
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2011
12月
11月
著作者情報のマークアップに対応しました
クロスドメイン URL の選択 - 複数のドメイン間の重複コンテンツの正規化について
多言語ウェブサイトの作成について
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2010
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2009
12月
11月
10月
8月
7月
6月
4月
3月
2月
1月
2008
12月
Feed
Follow @googlewmc
モバイルの検索結果が
4 月 21 日
から変わります。
モバイル フレンドリーかどうかをぜひ試してみてください!