ミツバチを選ぶ理由

革新的なクローラエンジン

evolution ミツバチはWebページの構文を解析し、構造を理解した上でデータを取得するクローラです。 構造を理解しているので、ミツバチは狙ったデータを確実に取得することが出来ます。
HTMLの構文解析にはFirefoxと同じ構文解析エンジンを使用しています。 あなたがFirefoxを使ってインターネットをしているのと同じように、 ミツバチもFirefoxを使ってそのWebサイトを見ているのです。 従来の正規表現型のクローラと比べて、構造を理解するミツバチは表現のゆらぎにも柔軟に対応します。 Webページの構造が変わらなければ、書いてある内容が変わってもさほど問題にはならないのです。
取得したい内容を保持しているタグを、ミツバチではCSSのセレクタを使って指定します。 これは正規表現を使うよりずっと、開発と保守を簡単にします。 jQueryがセレクタ指定によってDOM操作に革命を起こしたように、ミツバチもまたクローラ開発に革命を起こしました。
ミツバチのコントロールにはRubyを使います。Rubyはシンプルさと高い生産性を備えた動的なプログラミング言語です。 動的言語を採用することで、あらゆるサイトに柔軟に、かつ素早く対応することが可能になりました。

革新的なクローラエンジンが、あなたの要求に答えます。

障害に強く安定した動作環境

strong ミツバチはAmazonの実績あるインフラ上で実行されます。 全世界5箇所に分散した*1データセンターが自然災害やその他のリスクを極限まで低くします。 ミツバチが稼働するサーバは99.95%の可用性を誇っています。 これは、1年間のうちに4時間30分程度しかシステムが停止しないことを意味します。
仮に停止したとしても約10分程度で同じ環境のサーバインスタンスを立ち上げることができるため、 実運用上の不都合は何も生まれません。
ミツバチが集めた情報は、自動バックアップ、DBスナップショット、などの機能をもち、物理的に離れた複数のサーバで構成されたデータベースに格納されます。
必要に応じて容量がスケールするこのデータベースは、膨大な情報を集めるミツバチに最適な選択です。 ミツバチが集めた情報はこれらの機能により強固に守られています。

Amazon Web Serviceの導入事例紹介ページ
土台が安定しているから、安心して任せることができるのです。

*1:アメリカ東海岸、アメリカ西海岸、アイルランド、シンガポール、東京の5箇所(2011年3月3日現在)

ポリシーは『優しさ』

gentle ミツバチはサイトに優しいクローリングを心がけます。1つのサイトに対して50~60秒の間隔でアクセスするため、ミツバチによるアクセスが攻撃とみなされることはありません。また対象となるサイトに負荷をかけないため、トラブルが発生しにくく安心です。
この間隔で1つのサイトにアクセスすると、一日あたり1,400~1,700件、ひと月で42,000~51,000件のURLからデータを取得することが出来ます。中小規模のECサイトが対象であれば、これは十分な量です。

ミツバチは、優しいあなたの優しい選択です。