GitHub Pages で作成したwebページを検索エンジンに見つけてもらうために
こんにちは、netchiraです。
今回は、ブログ等の自分のwebページを運営し始めた人に向けて、検索エンジンにインデックスされるようになるための手順について試行錯誤したので、それを記していきたいと思います。
私もGitHub Pagesを使ってwebページを作成したのは良いのですが、最初は自分のページがヒットしなかったんですよね…
いくつか試した方法は以下です。
- Google Search Console を使用
- GitHub Pagesプラグインjekyll-sitemapを使用
それでは、それぞれについて述べていきます。
Google Search Console を使用してみる
Google Search Console を使うと、 「Google がコンテンツを検出できるかどうか」 「Google 検索結果でのパフォーマンス」 を確認することができるようになります。
自分のGoogleアカウントと自分のwebページを持っていればすぐに始められます。
私として、このヘルプを読んでみて思ったのは、Google検索で「site:(自分のwebページのURL)」と検索して、自分のwebページがヒットすれば、Google検索に自分のwebページがインデックスされていることが確認できるので、これが1つのゴールなのかな、と思います。
参考にしてみてください。
サイトマップを作成する
GitHub Pagesを始めると、’_config.yml’というファイルが生成されていると思います。 そこに下記の2行を足して、プラグインを利用できるようにします。
plugins:
- jekyll-sitemap
(すでに、’plugins:’を記述している場合は、’ - jekyll-sitemap’を加えるだけで良いです。)
これで、Jekyllによって自動的にsitemap.xmlが生成されます。
このファイルの内容を確認したい場合は、
https://{ユーザー名}.github.io/sitemap.xml
※ちなみに私の場合だと、
https://netchira.github.io/sitemap.xml
にアクセスすると見れます。
この「サイトマップ」は、検索エンジンのために作成します。 作成しておくと、(たぶん)自分webページがGoogleにインデックスされやすくなります。
以下、Googleが提供している「検索エンジン最適化(SEO)スターター ガイド」に記載されている「用語集」の内容の抜粋です。
- インデックス - Google は認識したすべてのウェブページを「インデックス」に格納します。各ページのインデックス エントリにはそのページのコンテンツと場所(URL)が記述されています。「インデックスに登録する」とは、Google があるページを取得し、そのページを読み込んで、インデックスに追加することを指します。(後略)
- クロール - 新しいウェブページや更新されたウェブページを検出するプロセスのことです。Google はリンクをたどる、サイトマップを読み込むなど、さまざまな手段で URL を検出します。Google はウェブをクロールして新しいページを検出し、(該当する場合は)そのページをインデックスに登録します。
- クローラ - ウェブのページをクロール(取得)して、そのページをインデックスに登録する、自動化されたソフトウェアです。
以下、引用元(原文)です。
以上です。