search engine 検索エンジン,検索サイト,検索企業,ネット検索

 インターネットで提供されている,検索サービスまたはそのサイト。 あるいはそれらを提供している企業・またはそのビジネスモデル。 不特定多数のユーザーが用いる不特定多数のキーワードに対してマッチする,不特定多数の Web サイトを表示する。 検索サイトがインターネットを検索する形式により,ディレクトリ型=登録型とロボット型に分かれる。 いずれもキーワードを入力すると,それに合致した情報(を扱う場所=サイト)の一覧,つまり入力した単語を含むページがリストアップされる。 複数の単語を入力する(間にスペースを入れる)事で,必要なページのみに絞り込むことができる。 多くの場合,サイトの名称が分かっている場合,検索窓にその名称を入力すれば,ほとんどはそのサイトが検索結果の1ページ目に表示される。 〜に関する情報がほしい場合は,その『〜』を入力し,検索結果のタイトルとサマリー(概要文)を読んで,クリックするサイトを決める。 新しいサイトが検索エンジンに表示されるには,1ヶ月程度かかるらしい。 検索サイトの同士では,基本的な検索方法は変わらないが,細かい検索方法に違いが存在する。 2004年1月21日,ECジャパンは Google と Inktomi の日本語サービスに同じ語句を入力した際の,上位50位までの一致率は16%と発表。 8月2日,マイクロソフトは米国のネットユーザーは,家族や友人など身近な人よりも,自分自身を検索する人の方が多いという調査結果を発表。
 2005年8月19日,コムスコア・メディア・メトリックスは米国ではインターネット検索の11%がツールバーから実行されていることが分かったと発表。 最も人気があるのは米ヤフーのツールバーで,シェアが51%に達している。 11月にピュー・インターネット・アンド・アメリカン・ライフ・プロジェクトが発表した調査結果によると,普通の日で,同国の成人の6000万人近く(41%)が検索エンジンを使っており,電子メールユーザーに次いで2番目に多い。
 2006年4月に iProspect が発表した iProspect Search Engine User Behavior Study によると,ユーザーの行動は,最初のページに表示された検索結果のリンクをクリックする62%,3ページ目までは検索結果をチェックする9割。
 2006年5月12日に SiteAdvisor が発表した検索エンジンの安全性に関する調査報告『The Safety of Internet Search Engines』によると,検索エンジンが連動広告で表示するリンクのうち,悪質なサイトに繋がるリンクの割合は,アルゴリズム検索結果における悪質サイトの割合に比べ,かなり高い。 危険なサイトが占める割合は,Ask.com 6.1%,Google と AOL 5.3%,Yahoo! 4.3%,MSN 3.9%。
 2007年6月11日にアイレップとジャパンマーケットインテリジェンスが発表した調査結果では,Yahoo!は『関連検索ワード』や『Yahoo!カテゴリ』が注目され,Google はサイトのタイトルを最初から最後までよく読まれているという傾向があった。 測定は2006年9月から10月にかけ,目の網膜に照射した赤外線の反射を利用する専用機器を使い,無作為に選んだ76人(男女半々)を対象に実施した。

 検索サイトが提供する,無料電子メール・アカウントや最新情報通知サービス,自分好みにカスタマイズしたトップページなどのサービスでは,個人を特定できる情報が運営者の手に渡る。 また,検索語のリストがあれば,その人が特定の時点で何を考えていたかがわかるとされる。

 検索しても目的の情報が見つからない場合は,探している情報がインターネット上にない,インターネット上にはあるが検索エンジンにインデックスされていない,膨大な検索結果の中に埋もれている,キーワードが的外れだった,などが原因である。 キーワードが的外れでなくするためには,目的の情報を掲載しているであろうサイトに,どのようなキーワードが含まれているかを想定する必要がある。 ある検索サイトでの検索結果に満足がいかなかった場合,他の検索サイトへ移動して再度キーワードを入力するのは面倒である。 その解決として多くの検索サイトでは,検索結果画面の下部に『他のサーチエンジンで検索』というリンクがあり,それをクリックすれば事足りる。
 2004年の時点で,検索エンジンはウェブ全体の1%ほどしかカバーしていない可能性があり,その原因は巡回プログラムがアクセスできないデータベースの中や,ユーザー登録が必要なサイト,巡回プログラムを拒否するサイト,オプション選択からカスタマイズされる動的なウェブページなどである。 ヤフー社は,見えないページを検索結果に載せてほしい企業から,料金を徴収している。
 2004年8月4日に EC ジャパンが発表した,第3回の検索エンジン調査レポートでは,Google と Yahoo! JAPAN で同じ単語を検索した結果の一致率は約18%らしい。

 検索のための語句はユーザーが入力するため,正式名称が入力されるとは限らない。 CM などテレビから流れる音で覚える場合もあるし,耳で覚えた文字列を漢字で入力するかもしれない,平仮名,カタカナ,英字かもしれない。 小さな『ッ』がある場合,それを抜かして入力する場合もある。 他人が検索した言葉を表示させることで,他人(世の中)が何に興味があるかがわかる。

 一般的な単語だと,数千件,数万件のヒット(一致)もザラであるため『AND 検索』とか『OR 検索』といって複数のキーワードを指定して検索できるようになっている。
 消費者が商品やサービスを検索する時には2語を入力する場合が多く,その結果に満足しない場合は40%が2ページ目を見るが,31%が新しい単語を加えて絞込み検索を行うらしい。 検索結果を4ページ以上見る人は2割以下とされる。 ただし,検索語に満足した場合は,そこからさらに2〜3ページみるらしい。 ユーザーは,検索結果が表示されてからクリックするまでの平均時間は6秒らしい。 また,ユーザーの視線はページの下部よりも上部に,ページの右側よりも左側に集中している傾向があるらしい。

 検索結果は利用者が自分自身の願望や要望を単語として入力して検索した結果である。 従って,そこに表示されるとクリックされる可能性が高くなる。 利用者の多くはリストの上からクリックため,クリックしてもらうためには少なくともリスト上位30位以内に入る必要があるとされる。
 関連性が高く偏りのない検索結果を提供したい検索エンジンと,何が何でも検索結果の上位に表示させたい企業との間で,戦いが何年間も繰り広げられている。 サイトを検索エンジンに最適化することは Search Engine Optimization(SEO) と言う。 大多数の検索エンジンは,検索結果を不正操作するテクニックへの対策を施している。 また,特定の単語を検索すると,ポップアップ広告を出すサイト・ソフトもある。
 検索エンジンに上位表示させたい時,キーワードの選択が重要になる。 特に,その言葉が,検索エンジン特有の『辞書語』に一致するかどうかが重要とされる。 たとえば Google を例に取ると,日本語の単語認識と Google のそれが異なるためである。 Google で検索した後,検索結果の『キャッシュ』を見るとキーワードがハイライトされるが,その際,文字の間にスペースがあれば複数単語の組み合わせ,全くなければ一つの単語として,Google が見ていることになる。 また,日本語での,送り仮名の違いや誤表記,略語などの“誤入力”は全体の12%とされる。
 検索順位が下がる要因としては,1)毎日行われているインデックス更新,2)アルゴリズムの調整,3)パーソナライズ検索が作用(Google),4)アクセス環境によって検索順位が変わる(Yahoo!),5)順位は常に相対的なもの,などの理由がある。 つまり,単純にアルゴリズムの更新によってスコアが変わった結果かも知れないし,他にキーワードと関連性が高いと判断されたページが多数出現したのかも知れないし,これまであなたのサイトにリンクを張っており,スコアに影響を与えていたページが消滅しただけの話かも知れない。

 2002年ころから,検索エンジンは ASP,JSP,PHP など動的なページ PDF,DOC,SWF フラッシュファイルも認識するようになった。 ただし CGI はまだである。 2003年ころに登場したものは,検索結果を分析し,自動的にカテゴリー別に分類して,一般的な形式のリストよりはるかに多くの情報を一目で見渡せるようにする。 また,順位更新は,以前までは4週に1度だったが,更新のタイミングが変わり,サイトにより更新周期が異なっている。 JavaScript の認識は,以前まで認識していなかった