ウェブマスターになったばかりの方にとって、SEO用語は分からないことだらけではないかと思います。でも、当然のようにみなさん利用しているので、いまさら聞けない用語もあるのではないかと考えています。
今回は「クローラーとは?」いまさら聞けないSEO用語について解説します。
この記事をご覧の方には「プラグインって何?いまさら聞けないIT用語」も参考になります。
クローラーとは?
日本に限った話ではありませんが、検索エンジンの世界は実質Googleの一人勝ちです。
Yahoo!など検索エンジンを置いてあるポータルサイトは多いですが、実際にはGoogleの検索エンジンに手を加えたものです。
そのため、違うサイトで検索したら検索順位が大幅に変わってくる、そのようなケースはほとんどありません。
ちなみにマイクロソフトが手がけているBingという検索エンジンが2位に付けていて、MSNはこのBingを使用しています。
しかし、2位のBingでも圧倒的な少数派ですから、ウェブマスターにとって重要な検索順位を上げるためのSEO対策とは実質的にGoogleへの対応策と言ってもよいでしょう。
自動でウェブサイトの情報を集めるクローラー
Googleはネットワークを通して常に情報収集をしていますが、その時に使われているのがクローラーです。
アフィリエイトをやったことがない人の場合は「クローラーとは?」と疑問に感じるかもしれませんが、Googleは自動で情報を集めています。クローラーはインターネット上を自動で巡回するプログラムであり、ロボットやスパイダーが別名です。
このクローラーが集めてきた情報を基に検索エンジンが構築されていて、他に画像を専門に扱うプログラムなど亜種もあります。
クローラーに対して優しいサイトを作るのもSEO対策の一環
検索順位を上げるための工夫は色々とありますが、このクローラーが訪れやすい環境を作るのはSEO対策の定番です。
クローラーは自動でインターネット上を巡回するものの、それでもくまなく訪れてくれるわけではありません。
人間がインターネットを巡回する時のようにリンクを辿って移動するので、そもそもリンクが貼られていないできたばかりのウェブサイトは無視されるケースも珍しくはありません。
そのような場合は新たにウェブサイトを作ったので来てください、とGoogleに申請するなどの対策が必要です。
少数の記事があるだけのウェブサイトの場合、そこまでクローラーの対策を取る必要はありませんが、規模が大きいウェブサイトならクローラーが巡回しやすい構成は必須です。
クローラーが調べること
Googleの巡回プログラム、クローラーについての知識はウェブマスターにとって必須と言っても過言ではありません。
各ウェブサイトを巡ってクローラーが調べることは、簡単に言えばそのウェブサイトの全てです。
クローラーはウェブサイトのテキストや画像の情報を集める
ウェブサイトに何を表示させるかは人によって異なりますが、テキスト、画像は多くのウェブサイトに設置されています。これらの情報は全てクローラーによってGoogleに送られていて、その結果を基に検索順位が決められるのが基本的な仕組みです。
もっとも、Googleは検索に関わるプログラムを過去に大きく変えてきたことがありますので今後については断言できません。
HTMLファイルの内容も読み取っている?
また、クローラーの仕様についても正確には公開されていないので私の推測が含まれますが、HTMLファイルの内容を読み取っていると考えられます。
HTMLはウェブサイトの設計図とも呼べるプログラムのことで、ここに文章を表示させる、ここで改行する、ここにリンクを入れる、ここに画像を表示させるなどのプログラムが記載されているものです。
そのため、HTMLファイルに記載されているものはほぼ全てがクローラーが読み取って情報を持ち帰っていると考えてよいでしょう。
クローラーには画像専門や広告専門の亜種がある
クローラーにも種類があって画像専門や広告専門の亜種が存在しますが、基本的なクローラーはテキストのみを読み取っています。
ここで画像に話を切り換えますが、画像が保存されているアドレス、表示する位置などHTMLファイルに示されている情報を再現してウェブサイトに画像が表示される、これが基本的な仕組みです。
クローラーに画像そのものを判別する能力はありませんが、画像が保存されているアドレスについてはHTMLファイルに記載されているのでどこに画像があるかは把握できます。
同様の理由で、ウェブサイトにPDF、テキストファイルなどのリンクがあればファイルの情報はGoogleに伝わるというわけです。
過去に横行していた、背景色とテキストの色を同じにして多くのキーワードを詰め込むサイトが現在では検索結果から排除されているように、クローラーは「このウェブサイトは問題がある」といったことも判断しています。
クローラーは画像判別できない!?
インターネットを巡回して情報を集めているのがクローラーです。文章なら間違いなく情報を取得できますし、不正な手段を使って評価を高める行為も見抜けると考えてよいでしょう。
しかし、クローラーは万能なわけではなく、現時点での欠点としては画像を判別できない点が挙げられます。
「クローラーは画像判別できない!?」と驚く人もいるかもしれませんが、画像の読み取りに関してはまだ発展途上なのでしょう。
画像があることはクローラーも把握できますが、その画像がどのようなものなのか、どんな意味を持っているのかについては理解できません。
2018年4月24日追記
最近では画像の内容をテキストで表示することが可能になるなど、画像の読み込みに関する技術にかなりの進歩が見受けられます。
クローラーの機能がどうあってもSEO対策に大切なことは変わらない
このことが検索順位を上げるためのSEO対策にどのような影響を与えるかですが、基本的にはさほど気にしなくても構いません。
もっとも、画像を多用する人の場合は注意しないとGoogleからの評価が下がってしまいます。
Lineにはスタンプと呼ばれる画像を使ってやり取りする機能がありますし、Twitterでも漫画の一部など汎用性の高い画像を投稿して感情を表す文化のようなものがあるのです。
人間だから画像の意味が分かりますが、これがクローラーだと何をやっているのか読み取ってくれません。
このようにブログやウェブサイトで画像を使って感情や意思を表そうとしても、うまくいかないどころか評価が下がってしまいます。
画像を多用したサイトよりテキスト量の多いサイトが評価されやすい
現時点ではクローラーは文章を読み取ってそれぞれのウェブサイトを評価していますから、画像頼りで途切れ途切れな文章が多いとクローラーが意味不明だと認識してもおかしくはありません。
クローラーの仕様については未知の部分も多いものの、現時点では画像を話のオチなどに使うのは避けた方が無難です。
もっとも、画像を使ってはいけないわけではなく、訪れてくれる人のことを考えると文章だけでのウェブサイトより画像が有るところの方が目を惹きやすいのは間違いありません。画像は積極的に使っていきたいところですが、画像なしでも文章が成立するような工夫は必須です。
クローラーはデータをどうやって取得している?
Googleのクローラーはウェブサイトの情報を自動で取得しています。
インターネット上のウェブサイトはリンクにより繋がっていて、インターネットをする場合はこのリンクを辿って色々なページに飛べるのが魅力の1つです。
クローラーも人間がリンクをクリックして他のウェブサイトにアクセスするように、リンクを辿って移動しています。
クローラーはリンクを辿ってデータを取得している
「クローラーはデータをどうやって取得している?」という疑問の答えは、リンクを辿ってウェブサイトを回ってデータを取得している、です。
クローラーはスパイダーとも呼ばれていますが、これはインターネット上のリンクを次々と移動している姿が蜘蛛の巣のようにも感じられるからです。
クローラーの正確な挙動については推測するしかありませんが、HTMLファイル内に記載されている文章は全て取得されていると私は考えています。
HTMLファイル内には画像が保存されている場所、他のウェブサイトのアドレスなどリンクが記載されているので、その情報を基に他のウェブサイトに向かっているのでしょう。
クローラーは1回の訪問で全ての情報を取得しているわけではない
もっとも、1回の訪問でそのウェブサイトの情報を全て取得しているわけではなく、規模が大きなウェブサイトになると、1日に1000回以上クローラーがやってくるところも珍しくはありません。
1回で全ての情報を取得できるなら1000回も訪れる必要はないので、情報の取得には限界があると考えられます。
逆にほとんどクローラーが訪れないサイトもあり、クローラーの訪れる頻度を増やして正確な情報を取得してもらうのがSEO対策の1つです。
クローラーが何を重視して巡回しているかですが、無効なリンクがないか、新たなリンク先はないか、以前に訪問した時と比べてウェブサイト内がどう変わっているかなどが挙げられます。
Googleは10の大きな方針を掲げていますが、その中の1つが検索を使うユーザーを最も重視しているという点です。
クローラーにはユーザーにとって有益か、そうでないかを判断するプログラムは間違いなく搭載されています。
関連記事「【IT用語】いまさら聞けないIT用語を一覧にまとめました」
ワードプレスサイトの運用なら特化型のwpX Speedがおすすめ
・初期費用無料
・1時間2円・月額1,200円(税抜)~
・リソース使用量に応じて自動的に上位プランに移行し、
サイトのダウンを防ぐ「オートスケール設定」機能
・「ダッシュボードへの不正ログイン防止」機能
ご契約期間 | 初期費用 | ご利用料金 | 合計 |
---|---|---|---|
3ヶ月 | 5,000円 +消費税400円 |
(1,200円 +消費税96円)×3ヶ月 |
8,600円 (税込9,288円) |
6ヶ月 | 5,000円 +消費税400円 |
(1,100円 +消費税88円)×6ヶ月 |
11,600円 (税込12,528円) |
12ヶ月 | 5,000円 +消費税400円 |
(1,000円 +消費税80円)×12ヶ月 |
17,000円 (税込18,360円) |
コストパフォーマンスに優れたレンタルサーバー
価格が安いレンタルサーバーなら他にたくさんあるのですが、コストパフォーマンスを考えると、ワードプレスサイトの運営に最もおすすめできるのがwpX Speed です。
料金も年間2万円を切る程度ですし、ドメイン取得費用と併せても2万円を少し超える程度でしょう。
ウェブサイトの自作はさほど難しくない
これだけの金額でワードプレスを利用したサイト運営ができるので、店舗の紹介や簡単なブログ作成なら、ホームページ作成会社に依頼するより、レンタルサーバーを利用して自作してしまった方が安上がりになると思います。
アクセスを集めるという点で、ウェブサイトの運営は非常に難しいものとなりますが、特別な技術やスキルなどがなくても、今ではホームページを作ることは可能です。
wpX Speed はワードプレスでブログを作成するなら1番おすすめできます。独自ドメインの取得ならお名前.comがおすすめ
独自ドメインの取得にはお名前.com がおすすめです。レンタルサーバーの比較検討なら
wpX Speed以外にも、エックスサーバーやロリポップについて紹介しています。レンタルサーバーの比較検討をしたい方はこちらもご覧ください。
この記事をご覧の方には「【レンタルサーバー比較】wpX Speed・エックスサーバー・ロリポップ」も参考になります。
- wpX Speed初年度18,360円~
- エックスサーバー初年度16,200円~
- ロリポップ初年度2,916円~