search engine 検索エンジン,検索サイト,検索企業,ネット検索
インターネットで提供されている,検索サービスまたはそのサイト。
あるいはそれらを提供している企業・またはそのビジネスモデル。
不特定多数のユーザーが用いる不特定多数のキーワードに対してマッチする,不特定多数の Web サイトを表示する。
検索サイトがインターネットを検索する形式により,ディレクトリ型=登録型とロボット型に分かれる。
いずれもキーワードを入力すると,それに合致した情報(を扱う場所=サイト)の一覧,つまり入力した単語を含むページがリストアップされる。
複数の単語を入力する(間にスペースを入れる)事で,必要なページのみに絞り込むことができる。
多くの場合,サイトの名称が分かっている場合,検索窓にその名称を入力すれば,ほとんどはそのサイトが検索結果の1ページ目に表示される。
〜に関する情報がほしい場合は,その『〜』を入力し,検索結果のタイトルとサマリー(概要文)を読んで,クリックするサイトを決める。
新しいサイトが検索エンジンに表示されるには,1ヶ月程度かかるらしい。
検索サイトの同士では,基本的な検索方法は変わらないが,細かい検索方法に違いが存在する。
2004年1月21日,ECジャパンは Google と Inktomi の日本語サービスに同じ語句を入力した際の,上位50位までの一致率は16%と発表。
8月2日,マイクロソフトは米国のネットユーザーは,家族や友人など身近な人よりも,自分自身を検索する人の方が多いという調査結果を発表。
2005年8月19日,コムスコア・メディア・メトリックスは米国ではインターネット検索の11%がツールバーから実行されていることが分かったと発表。
最も人気があるのは米ヤフーのツールバーで,シェアが51%に達している。
11月にピュー・インターネット・アンド・アメリカン・ライフ・プロジェクトが発表した調査結果によると,普通の日で,同国の成人の6000万人近く(41%)が検索エンジンを使っており,電子メールユーザーに次いで2番目に多い。
2006年4月に iProspect が発表した iProspect Search Engine User Behavior Study によると,ユーザーの行動は,最初のページに表示された検索結果のリンクをクリックする62%,3ページ目までは検索結果をチェックする9割。
2006年5月12日に SiteAdvisor が発表した検索エンジンの安全性に関する調査報告『The Safety of Internet Search Engines』によると,検索エンジンが連動広告で表示するリンクのうち,悪質なサイトに繋がるリンクの割合は,アルゴリズム検索結果における悪質サイトの割合に比べ,かなり高い。
危険なサイトが占める割合は,Ask.com 6.1%,Google と AOL 5.3%,Yahoo! 4.3%,MSN 3.9%。
2007年6月11日にアイレップとジャパンマーケットインテリジェンスが発表した調査結果では,Yahoo!は『関連検索ワード』や『Yahoo!カテゴリ』が注目され,Google はサイトのタイトルを最初から最後までよく読まれているという傾向があった。
測定は2006年9月から10月にかけ,目の網膜に照射した赤外線の反射を利用する専用機器を使い,無作為に選んだ76人(男女半々)を対象に実施した。
検索サイトが提供する,無料電子メール・アカウントや最新情報通知サービス,自分好みにカスタマイズしたトップページなどのサービスでは,個人を特定できる情報が運営者の手に渡る。
また,検索語のリストがあれば,その人が特定の時点で何を考えていたかがわかるとされる。
検索しても目的の情報が見つからない場合は,探している情報がインターネット上にない,インターネット上にはあるが検索エンジンにインデックスされていない,膨大な検索結果の中に埋もれている,キーワードが的外れだった,などが原因である。
キーワードが的外れでなくするためには,目的の情報を掲載しているであろうサイトに,どのようなキーワードが含まれているかを想定する必要がある。
ある検索サイトでの検索結果に満足がいかなかった場合,他の検索サイトへ移動して再度キーワードを入力するのは面倒である。
その解決として多くの検索サイトでは,検索結果画面の下部に『他のサーチエンジンで検索』というリンクがあり,それをクリックすれば事足りる。
2004年の時点で,検索エンジンはウェブ全体の1%ほどしかカバーしていない可能性があり,その原因は巡回プログラムがアクセスできないデータベースの中や,ユーザー登録が必要なサイト,巡回プログラムを拒否するサイト,オプション選択からカスタマイズされる動的なウェブページなどである。
ヤフー社は,見えないページを検索結果に載せてほしい企業から,料金を徴収している。
2004年8月4日に EC ジャパンが発表した,第3回の検索エンジン調査レポートでは,Google と Yahoo! JAPAN で同じ単語を検索した結果の一致率は約18%らしい。
検索のための語句はユーザーが入力するため,正式名称が入力されるとは限らない。
CM などテレビから流れる音で覚える場合もあるし,耳で覚えた文字列を漢字で入力するかもしれない,平仮名,カタカナ,英字かもしれない。
小さな『ッ』がある場合,それを抜かして入力する場合もある。
他人が検索した言葉を表示させることで,他人(世の中)が何に興味があるかがわかる。
一般的な単語だと,数千件,数万件のヒット(一致)もザラであるため『AND 検索』とか『OR 検索』といって複数のキーワードを指定して検索できるようになっている。
消費者が商品やサービスを検索する時には2語を入力する場合が多く,その結果に満足しない場合は40%が2ページ目を見るが,31%が新しい単語を加えて絞込み検索を行うらしい。
検索結果を4ページ以上見る人は2割以下とされる。
ただし,検索語に満足した場合は,そこからさらに2〜3ページみるらしい。
ユーザーは,検索結果が表示されてからクリックするまでの平均時間は6秒らしい。
また,ユーザーの視線はページの下部よりも上部に,ページの右側よりも左側に集中している傾向があるらしい。
検索結果は利用者が自分自身の願望や要望を単語として入力して検索した結果である。
従って,そこに表示されるとクリックされる可能性が高くなる。
利用者の多くはリストの上からクリックため,クリックしてもらうためには少なくともリスト上位30位以内に入る必要があるとされる。
関連性が高く偏りのない検索結果を提供したい検索エンジンと,何が何でも検索結果の上位に表示させたい企業との間で,戦いが何年間も繰り広げられている。
サイトを検索エンジンに最適化することは Search Engine Optimization(SEO) と言う。
大多数の検索エンジンは,検索結果を不正操作するテクニック への対策を施している。
また,特定の単語を検索すると,ポップアップ広告を出すサイト・ソフトもある。
検索エンジンに上位表示させたい時,キーワードの選択が重要になる。
特に,その言葉が,検索エンジン特有の『辞書語』に一致するかどうかが重要とされる。
たとえば Google を例に取ると,日本語の単語認識と Google のそれが異なるためである。
Google で検索した後,検索結果の『キャッシュ』を見るとキーワードがハイライトされるが,その際,文字の間にスペースがあれば複数単語の組み合わせ,全くなければ一つの単語として,Google が見ていることになる。
また,日本語での,送り仮名の違いや誤表記,略語などの“誤入力”は全体の12%とされる。
検索順位が下がる要因としては,1)毎日行われているインデックス更新,2)アルゴリズムの調整,3)パーソナライズ検索が作用(Google),4)アクセス環境によって検索順位が変わる(Yahoo!),5)順位は常に相対的なもの,などの理由がある。
つまり,単純にアルゴリズムの更新によってスコアが変わった結果かも知れないし,他にキーワードと関連性が高いと判断されたページが多数出現したのかも知れないし,これまであなたのサイトにリンクを張っており,スコアに影響を与えていたページが消滅しただけの話かも知れない。
2002年ころから,検索エンジンは ASP,JSP,PHP など動的なページ PDF,DOC,SWF フラッシュファイルも認識するようになった。
ただし CGI はまだである。
2003年ころに登場したものは,検索結果を分析し,自動的にカテゴリー別に分類して,一般的な形式のリストよりはるかに多くの情報を一目で見渡せるようにする。
また,順位更新は,以前までは4週に1度だったが,更新のタイミングが変わり,サイトにより更新周期が異なっている。
JavaScript の認識は,以前まで認識していなかったタグ内のキーワードが認識されるようになってきた。
次世代検索エンジン技術として,ヤフー社,マイクロソフト社の両社はすでに準備を開始している。
2005年1月23日にピュー・インターネット・アンド・アメリカン・ライフ・プロジェクトが発表した調査結果では,検索エンジン利用者のうち,偏りのない検索結果と有料広告リンクの違いがわかる人は6人に1人しかいないことが明らかになった。
調査は電話アンケートで,2004年5月14日〜6月17日の期間に,2200人の成人に行われた。
2005年2月に Pew Internet&American Life Project が発表したレポートによると,米国インターネットユーザーの大半は,検索エンジン技術を自由に操ることに自信を持っているが,その技術には無知である。
有償検索とオーガニック検索のリスティングの違いについて耳にしたことがある人は38%で,実際の検索エンジンページでその違いを見分けることができたのは6人中1人だった。
また,オンラインの米国成人(約1億800万人)の84%が,検索エンジンを利用したことがあり,56%が毎日利用している。
47%はひとつの検索エンジンだけを週に1度か2度検索し,35%は,日に最低1度は複数の検索エンジンを利用している。
44%はひとつの検索エンジンを定期的に利用しており,48%は2つまたは3つの検索エンジンを,7%は3つ以上の検索エンジンを利用している。
68%が,検索エンジンは公平で偏りのない情報源であるとし,19%が検索エンジンを信用していないと思っている。
調査期間は,2004年5月14日〜6月17日,対象は18歳以上の成人2,200人。
2004年12月時点ではシェアは,グーグル 43.1%,ヤフー 21.7%,MSN 14%。
2005年3月に Nielsen // NetRatings が発表した検索エンジン利用状況などのレポート Nielsen//NetRatings MegaView Search によると,利用率のトップは Google だが,他の検索エンジンと組み合わせて利用しているユーザーも多い。
利用率は,Google 47%,Yahoo! 21%,MSN 13%。
ただし,Google の利用者の中で,Yahoo! も同時に利用しているユーザーは26%,MSN も同時に利用しているユーザーは19%。
Google/Yahoo!/MSN を同時に利用しているユーザーは14%で,Google だけで満足するユーザーは約4割である。
Yahoo! ユーザーでは Google や MSN を組み合わせて利用するのは 71%,MSN ユーザーでは同じく 70%である。
2006年2月9日に Nielsen//NetRatings が発表した,2005年12月のアメリカの市場シェアは,1位 Google 48.8%(前年同月は43.1%),2位 Yahoo! 21.4%(同21.7%),3位 MSN 10.9%(同14%)。
ユーザーの検索利用回数は約50億6938万回で,前年同月比55%増加。
5月25日の Nielsen//NetRatings の発表では,1位 グーグル 50%,2位 ヤフー 22%,3位 MSN 11%(同12%)。
2007年4月に Web 計測会社 Hitwise が発表した2007年3月31日までの4週間の調査結果では,1位 Google 64.13%(前年同期 58.33%),2位は Yahoo! 21.26%(同 22.30%)。
2010年4月,インターネットコムとメディアインタラクティブは『検索エンジンに関する定期リサーチ』の結果を発表。
利用したことのある検索エンジンは,『Yahoo! Japan』91.7%,『Google』73.3%,『Infoseek(Infoseek 楽天)』31.7%,『goo』26.3%,『MSN』19.0%,『BIGLOBE』14.0%。
目的の情報が見つからない時は,『検索キーワードを変更する』46.0%,『検索キーワードを追加する』36.7%。
検索結果を何ページ目まで見ているは,第1回は『5ページ以上』と回答した人が約2割(20.0%)だったのに対し,今回は13.3%と減少。
代わりに『1ページ』10.7%が第1回(7.7%)から3.0ポイント増加し,『2ページ』34.7%も1回(32.0%)から2.7ポイント増加した。
調査対象は全国18歳〜69歳のインターネットユーザー300人。
男女比,男性47.0%,女性53.0%。
年齢は19歳以下0.3%,20代11.7%,30代31.7%,40代27.7%,50代20.7%,60代8.0%。
アメリカの検索市場のシェア
中国の検索エンジン業界ア
3次元検索エンジン
普通の検索エンジンの重大な制約として,テキストしか検索できないことがある。
コンピューターの処理能力と,双方向的なモデリング・ソフトウェアの向上によって,クエリーに利用できる像の蓄積が拡大したため,3次元的な物体のデータベースから必要なものを探し出す検索エンジンが開発されている。
イメージの概略図を描くと,類似した物体が提示される。
しばらくは,特定の業務利用だけに使われる可能性が高い。
旅行検索エンジン
モバイル検索サイト
検索エンジンのサーバー
日本の著作権法では,著作物を無断で複製したり,広く公に向かって送信したりすることを禁止している。
検索エンジンなのですが,集めてきたウェブサイトの情報をサーバーにキャッシュとして一時蓄積する。
これが無断で複製することになり,キャッシュを表示することが広く公に送信することになるので,日本の著作権法に抵触する可能性があるため,検索エンジンのサーバーは日本国内に置いていない(置けない)ことが多いらしい。
有名な検索エンジンのサイト,または会社
AlltheWeb.com
Altavista
Ask Jeeves
Fast Search
Find.com
Gigablast
Goo
Google
HyperEstraier
IceRocket.com
LookSmart
MARS FLAG
Moreover Technologies
Namazu
Northern Light
Overture
Paglo
Scirus
Teoma
Yahoo
ステガノファインダー
Search Engine Watch 業界誌
初期の検索エンジンの多くは,単純なキーワード検索を利用して検索結果を出していた。
グーグル社は,ハイパーリンクとキーワードを検証し,ウェブ上でどのページが最もよく信用されているかを判定する独自のシステム,『ページランク』を開発,優位に立った。
この発展は SPAM との戦いの歴史で,2000年と2003年の検索エンジンにおけるページ評価のアルゴリズムは,大きく異なっている。
それは GOOGLE が,検索結果において優良な情報を含んでいるページを表示させたい,という努力を続けてきた結果でもある。
『キーワード△site:ドメイン』という検索式を用いて,検索を行うドメインを限定することができる。
日本の政府機関や各省庁所轄研究所,特殊法人などを表す go.jp や,学校教育法および他の法律規定による学校を表す ac.jp などに有効。
検索ランキング
リアルタイムで表示され,その瞬間におけるネティズンの関心事や,インターネット上の動向を知る上での1つの指針となっている。
また世界で起こっている出来事,話題や論点などによっても左右されることがある。
ただし,検索ランキングに意外な単語が出てくれば,なんら関係ない人でも『何事か』と思い調べたくなり,そのうちインターネット新聞など各メディアでもこれを取り上げ始め,記事が掲載されると噂が広まり,ますます検索する人が増える。
検索エンジンの保有 index 数
検索エンジンが収集して検索結果に提示できる形として保有している URL の数。
話題性があり,検索エンジンがインターネット空間のどの程度を既知としているかを示す数値だが,重要なのは,検索結果の妥当性と検索結果表示スピードである。
グーグルは2001年12月に20億ページを突破し,オール・ザ・ウェブが2002年6月に追い抜いてたが,その後,再び逆転。
2003年8月21日,Overture は子会社 FAST のサーチエンジンが約32億ドキュメントをインデックスし,世界最大のサーチエンジンなったと発表。
同29日,『Google Web Search』からアクセスできるドキュメントの数が33億を超え,Overture の約32億ドキュメントを上回ったことが明らかになった。
pay for placement ペイフォープレイスメント
広告主の支払う広告料金で検索結果の表示場所が変わるもの。
消費者団体や商標保有者から非難されている。
ディレクトリ型検索エンジン
情報が分野別に分類してあり,捜している情報に合ったカテゴリーがあれば,
手軽に目的の情報が発見できる可能性が高い。
このタイプへの情報の登録は,管理者が手作業で行う場合と,ホームページの作者が自分で行う場合がある。
ロボット型,ロボット検索エンジン,World Wide Web robot,WWW ロボット
インターネットから人間にとって有益な情報を探し出すプログラム,ウェブを動き回るサーチエンジン。
ロボット検索エンジン(たんにロボットまたはスパイダー,crawler と呼ばれることも多い)と呼ばれるプログラムがインターネットを巡回し,
WWW サーバを自動的に検索,これに含まれる単語をインデックス化して保存,
こうしてサーバーに蓄えた情報に対しキーワードで検索をかけることで,高速なフルテキスト検索を実現するサービス。
ディレクトリ型にないホームページが見つかる可能性が高いが,逆に検索結果が多すぎて困る事もある。
Disney の関連会社である Infoseek の検索サービスが有名。
通常は一定の更新周期の間にインターネットを巡回し,変化があればインデックスを変更するという形を取っている。
更新周期は公式には発表されていない場合が多い。
登場したころから,パスワードやクレジットカード情報,機密情報,そしてハッカーに悪用される恐れのあるコンピューターの脆弱性などを含めた重要なデータをも収集していた。
robots.txt をウェブページに追加すれば,検索ロボットを追い払うことができる。
ただし,これを無視する悪質な検索ロボットには無防備である。
関係のない情報・サイトが引っかかってくるのは,ホームページのアドレスが同じでも作者が内容を変更している場合。
また,ソースに記載された文字に検索対象の文字が入っていた場合である。
作者がアクセス数アップのために,検索回数の多い文字を故意に入れる場合も多い。
商品データベースや顧客データベースからユーザーにあわせて自動的にサイトを構築する『動的なサイト』が苦手。
また,フレームによって区切られたサイトも的確な検索結果として表示しにくい。
robots.txt
検索ロボット制御ファイル。
検索エンジンに検索対象を伝えるための検索エンジンの共通規格。
検索エンジンのインデックスから,Web サイトの全ページまたは特定のディレクトリを除外させることができる。
Google,Yahoo!検索などの主要検索エンジンは,それぞれ robots.txt への対応状況を説明している。
ただし,ユーザーにこのファイルを見られると,見られたくないページのリストを公開することになってしまう。
分散検索
Yahoo! や Google は非常に強力なシステムを持ち,インターネット上の情報をそれなりに網羅していると言われる。
しかし,blog のような個人ベースの情報が増えると, 破綻するのではないかとも言われている。
そこで,P2P でコストを抑えた検索システムを開発できれば, 検索システムを様々な場所で活用できるようになる可能性がある。
カテゴリーサーチ,バーチカルサーチエンジン
特定の分野に絞った検索を得意とするエンジン。
インターネット上の情報量が巨大になり,Yahoo! や Google などの一般的な検索エンジンが提供する情報では目的の情報にたどり着くのが難しくなっていることに対応したもの。
Become
2004年に2人の韓国系アメリカ人が開始したショッピング情報に特化したカテゴリーサーチ。
2005年2月にサイトをオープン。
サイト:http://www.become.com
Cairo
シリコンバレーに拠点を置くカテゴリーサーチ。
近所のスーパーやお店などで行われている特売に的を絞った情報提供を行っている。
ZIP コードと探している品物を入力すると,スキャンされた新聞用のチラシと共に検索結果が表示される。
サイト:http://www.cairo.com
メタサーチ
複数の検索エンジンを横断的に検索するシステムのこと。
メタ(meta)とは’超’或は’高次’の意味。
一般的に自分の検索ロボットやディレクトリーを持たず, 他社の収集した複数のデーターを利用する。
複数の検索エンジンにキーワードを渡して複数のフレームやウィンドウに個別に検索結果を表示するもの(非統合型)や,検索結果を独自に分析して出力するもの(統合型)などがある。
統合型の利点は,検索時間を短縮できる事と,多数のキーワードで絞り込んで検索数が少なくなる場合に,複数の検索エンジンを探す手間が省ける事。
問題点は Google のようにメタサーチからの利用を認めていない検索エンジンがある事。
これに対しては,Google を利用しているサイトのデーターを使って Google を利用した場合と同等の結果になる様にしている。
非統合型は,検索のための複数のボタンを分類して配置した,リンク集と同じような物。
非営利目的であればほとんどの検索サイトは利用制限をしていない。
ただし, ボタンが多いとなれるまでが大変。
Gada.be
変わったメタサーチサービス。
ワシントン州シアトルに拠点を置く Lockergnome.com の経営者 Chris Pirillo 氏と,カリフォルニア州チコのプログラマ Shayne Sweeney 氏の発案により創立。
名称は,携帯電話のテンキーパッドを押す回数が少なくてすむという理由で付けられた。
2005年10月,パブリックβ版を Web に公開。
携帯電話で簡単に検索ができるように, サブドメインに検索用語を入力できるようにしたため,
Google リスティングから締め出され,その後解除されるという経緯があった。
サイト:http://gada.be
フリーTVオンライン・コム
2006年9月20日に正式に開始した,アメリカのオンライン上の動画を一括検索できるウェブサイト。
『グーグル・ビデオ』に登録された動画や,ユーチューブに投稿された動画を,縦断検索でき,マイスペース・ビデオや iFilm も探してくれる。
動画サイトへのポータルとしても使える。
サイト:http://www.freetvonline.com
検索エンジンに認識させないための方法
クロールの対象から外すための方法が複数ある。
1)robots.txt での記述
適切な記述を行うことで,クロール対象から外すための申請となる。
2)meta 要素にインデックス拒否の設定を記述。
検索されたくないページの head 要素内に, など,検索エンジンから検索されないための meta 要素を記述する。
3)サイト管理ツールの使用
検索エンジンがウェブマスター向けに用意しているサイト管理ツールで,すでにインデックスされているページの削除などをできる。
ただし,上記の手段でも検索結果への露出をなくすことは困難である。
確実に検索されないようするためには,Basic 認証など,URL に ID やパスワードが表示されない形でのログインを必要としておくことや,厳しい IP 制限をかけるなど,特定の厳しい条件を満たした環境以外はアクセスできないようにするしかない。
そもそも,公開すると非常に大きな問題となる情報を,インターネット経由でアクセスできる状態になっていることが問題ではないだろうか。
Search Engine Watch サーチエンジン・ウォッチ
サーチエンジンの情報サイト,カリフォルニア州 San Jose。
サイト:http://www.searchenginewatch.com
SearchDay サーチデー
サーチエンジン・ウォッチが発行するニューズレター。
Gigablast
新たな検索エンジンで,fast を凌ぐ検索結果の更新頻度と,Openfind 以上のページ保有数ポテンシャルを誇っている。
サイト:http://www.gigablast.com
IceRocket.com
新興の検索サービス会社。
提供している機能は,個別にはすでに存在するが,それらを1か所で提供している。
サイト:http://www.icerocket.com
Justy Finder
EC サイトで販売している PC や家電の最安値を検索できる検索エンジン.
企業向けの情報漏えい対策ソフトなどを手掛けるハミングヘッズが2010年9月に公開した初めての一般向けサービス。
『デジタルカメラ』『テレビ』『ゲームソフト』などカテゴリーを一覧から選んで指定し,商品名や条件となるキーワードを入力して検索すると,ECサイトの販売ページを,価格の安い順に並べて表示する。
MARS FLAG
純国産検索エンジン。
見やすい検索結果を提供するために『要約文』と『サイトイメージ』とを表示するのが特徴。
約1年間のβ運用期間の後,新しくより高性能な新検索エンジンを開発し,サイトリニューアルとともに2006年5月8日に公開。
サイト:http://www.marsflag.com
2006年6月,対象サイトの利用動向を分析・グルーピングして対象サイトに近いサイトを表示するつながり検索機能『つなケン』の提供を開始。
つなケン
マーズフラッグが独自に開発したキーワード検索の機能。
任意のキーワードについて類似性の高いキーワードや検索対象となるWebサイトの内容を判定し,関連するWebサイトを検索結果として表示できる。
netPlant
2007年2月6日に国立福島工業高等専門学校の電気工学科4年生である大澤昇平氏が発表した,FireFox用のブックマーク共有プラグイン『swimmie』を利用した検索エンジン。
swimmie のユーザーからブックマークのデータを収集し,検索インデックスとして利用。
任意のキーワードを入力して検索を実行すると,関連する別のキーワードを自動表示し,それらのキーワードのリンクを辿っていくことで,目的のサイトを探せる。
検索結果はディレクトリ形式で表示されるが,手動で登録するのではなく,ユーザーが持つブックマークをインデックス情報にしているため,偏りのない検索結果が得られる。
情報処理推進機構(IPA)の『2006年度未踏ソフトウェア創造事業』の一環。
サイト:http://netplant.jp
swimmie
2007年1月23日に大澤氏が発表した FireFox 用のブックマーク共有プラグイン。
不特定多数のユーザーとブックマークを共有できる。
サイト:http://netplant.jp/swimmie
pixsy
アメリカの検索サービスベンチャー。
2006年9月1日,俳優やミュージシャンなどの有名人の写真や動画を対象とする検索エンジン『スターハビット・コム(http://www.starhabit.com)』を公開。
『ABCニュース』『CNN』などの主要ニュースサイトや,『E!オンライン』『ハリウッド・コム』など芸能ニュースサイトと提携し,各サイトが提供するコンテンツのRSSフィードで自動収集する。
サイト:http://www.pixsy.com
SAGOOL
独自のアルゴリズム『オモロ』を用いる検索エンジン。
Web サイトへのリンク数が重視される従来の検索エンジンでは抽出しにくい,『人の主観・興味を反映した』検索結果が得られるらしい。
DOCODEMO SAGOOL IE 版
チームラボビジネスディベロップメントとチームラボが2007年2月21日に発表した,Web ページのテキストをなぞって検索できるツールバー。
Web ページ内の調べたい言葉をドラッグするだけで,SAGOOL 検索ができる。
対応 OS は Windows 98SE/Me/2000/XP。
Startpage
アメリカの検索エンジン。
2010年1月28日,『完全に匿名でネットサーフィンできる』とうたうプロキシサービスを開始。
Startpage 検索エンジンから利用できる。
True Knowledge
イギリスの自然言語による検索エンジンを開発する会社。
収集した情報からナレッジベースを作成,コンピュータがこれを学習し,答えを導き出せるようにした検索エンジンを開発している。
2007年11月7日,β版テスターを募集すると発表。
ステガノファインダー
日本の画像検索ポータルサイト。
検索サービスは有料だったが,2002年8月9日から無料となる。
サイト:http://www.steganofinder.com
情報検索システム評価用テストコレクション構築プロジェクト
NII-NACSIS Test Collection for IR Systems(NTCIR)
検索エンジンを国際的に比較評価するために,国立情報学研究所が1998年から行なっている共同研究プロジェクト。
国内外の企業・大学などの研究グループが,共通の実験用データセットを用いて検索エンジンの実験を行なっている。
現在までに,言語横断検索における機械翻訳の多様化,多言語検索での結果統合の新手法,異なる文書書類や個別ユーザーの差異に対応する新しい検索モデルなどの有用性が確認されている。
また,日本語検索の基本索引単位として,ワード型(フレーズ型)が2文字型(バイグラム)より有利という結論が出ている。
マニア/ファン指向ランキングを有するブログサーチエンジン
学校法人京都産業大学と株式会社きざしカンパニーが独立行政法人情報通信研究機構からの委託研究『電気通信サービスにおける情報信憑性検証技術に関する研究開発』の一環として開発した,重要かつ信憑性の高い Blog を探すサーチエンジンの実証実験サイト。
検索キーワードに対して,キーワードに関連するマニア/ファングループを抽出し,そのグループ内のブロガーの熟知度順に Blog 検索結果を表示する。
2008年10月1日公開。
サイト:http://kizasi.jp/labo/fansearch/index.py
NetLifeHelper
Google や goo などの各種 Web 検索サービスの利用を支援するフリーソフト。
2005年7月14日 v0.1.0 が公開,対応 OS は Windows/Mac OS。
サイト:http://face.page.ne.jp/web
ヒトの記憶に与える検索エンジンの影響
2011年7月14日,Science 誌に『検索エンジンの台頭により,人間の脳が情報を記憶する方法は変わってきている』とする論文『Google Effects on Memory: Cognitive Consequences of Having Information at Our Fingertips(Googleが記憶に及ぼす影響:指先に情報を保持することの認知的所産)』が発表された。
これによると,人間の脳は,友人や家族,同僚などに尋ねれば答えが分かることについては記憶しようとしない(他者の記憶に頼る方法を心理学では『交換記憶(Transactive Memory)』と呼ぶ)が,インターネットに対しても同じように頼るようになっているという。
つまり,情報そのものではなく,“どこで”情報を得られるかを記憶するようになっているとしている。
この報告は以下の実験結果による。
1)被験者は一連の難しい雑学知識の質問に答えさせられる。その直後に基本的な色名テスト(ストループ課題)を受ける。GoogleやYahoo!といった検索エンジンに関連する単語への反応時間(が短いこと)は,難しい質問に答えた際に情報入手方法として検索エンジンについて考えていたことを示す。
2)被験者は文を読まされ,その後で文を覚えているかどうかテストされる。文が後で(例えばインターネットで)確認できると知らされた被験者は,削除されたと知らされた被験者よりも記憶テストの結果が悪かった。
3)被験者は読まされる複数の文が,ネットで広く確認できるもの,特定の場所に保管されるもの,削除されるものの3種類あると知らされると,削除される文を最もよく覚えた。
4)被験者は雑文を入力させられ,それが5つのフォルダのうちの1つに保存されると信じさせられる。保存後に被験者にフォルダの名前と文の内容を思い出させたところ,フォルダの名前の方をよく覚えていた。この結果から,人は情報自体よりも,情報がどこで入手できるかを覚えていることが分かるとしている。
戻る 『S』 ,最初のメニュー