Brian Pinkerton 1994年4月20日University of Washington開発の世界初フルテキストWeb検索エンジン。AOL買収+1995年6月100万ページ達成。

WebCrawlerとは？（ウェブクローラー）わかりやすく解説

概要

WebCrawlerは、Brian Pinkerton（米University of Washington博士課程学生）が1994年4月20日に開発+公開した世界初のフルテキストWeb検索エンジンで、HTMLページのボディ全文をインデックス+全文検索クエリ対応を実現した検索エンジン業界の決定的革新機。従来のArchie（1990年Alan Emtage、anonymous FTPサーバ上のファイル名検索）+Veronica（1992年、Gopherサーバメニュー検索）+JumpStation（1993年12月、Title/Header検索）等の先行検索エンジンはファイル名・タイトル・ヘッダのみでフルテキスト検索非対応だったが、WebCrawlerは初の完全フルテキストでWeb検索の決定的進化を実現。1995年6月には累計100万ページインデックス達成+毎日10万ユーザーの利用を獲得し、当時最大のWeb検索エンジンとして君臨。1995年6月にAOL（America Online）が$1M（約1.5億円）で買収+1995年8月にWebCrawler Pro/AOLサブスクリプション統合+1996年6月にExcite社が$200M（約300億円）で買収+2001年Excite経営破綻+2001年4月Infospace買収+2018年現在もInfospace（System1社）下で稼働継続の長期ブランドとして30年継続。WebCrawlerの主要技術: ①HTMLパーサ+フルテキスト全文インデックス（doctitle/h1-h6/p/li 等のHTML要素を全文検索対象）+②TF-IDF（Term Frequency-Inverse Document Frequency）スコアリング（後の検索エンジンでも継続使用される基本ランキングアルゴリズム）+③Robotクローラ（Webページを定期的に巡回+取得+インデックス更新）+④シンプル検索インターフェース（Google検索の前駆）+⑤1995年6月100万ページ+1996年30万クエリ/日+1997年10万ユーザー/日等の業界トップレベル運用実績。業界の意義: ①+②+③+④+++等の検索エンジン爆発期の起点+⑤の中核として確立。は++として活動継続、として記憶される。

主な特徴・仕組み

種類: 世界初フルテキストWeb検索エンジン
開発: Brian Pinkerton（University of Washington博士課程）
公開: 1994年4月20日
累計ページ: 100万ページ（1995年6月）
主要技術: HTMLパーサ+TF-IDF+ロボットクローラ
1996年クエリ: 30万/日
1995年買収: AOL $1M
1996年買収: Excite $200M
2001年買収: Infospace
現在運営: System1（旧Infospace）下で30年継続
業界意義: Google/Yahoo/AltaVista等の検索エンジン爆発期の起点

スペック比較表

検索エンジン	公開年	検索技術	規模ピーク
Archie	1990	FTPファイル名	数千ファイル
Veronica	1992	Gopherメニュー	数万エントリ
JumpStation	1993/12	Title/Header

メニュー

WebCrawler（ウェブクローラー）

メニュー

WebCrawler（ウェブクローラー）

概要

主な特徴・仕組み

スペック比較表

この用語に関連するコンテンツ

具体例・対応製品

自作PCでの選び方・注意点

関連用語との違い

よくある質問（FAQ）

まとめ