|
|
なぜ、検索エンジンは無料なのに、世界は Nutch を必要とするのか?検索エンジンはテレビが見るのが無料であるのと同様に、使うのは無料です。しかし、テレビ番組の様に、彼らを操る利益によって、検索結果は操作を受けることがあります。 検索結果を算出する技術が公になっていることが、人々が検索結果が公平なことを確信する唯一の方法です。 Nutch は、自由に入手できる高品質の検索技術を作ろうとするものです。 どのように手助けできますか?あなたが資金を寄付する志しがあるならば、我々の 寄付 に関するページをご覧ください。 あなたが開発者として手伝おうとするならば、我々の 開発者 に関するページをご覧ください。 あなたが提案(質問またはコメント)があるならば general@nutch.org へメールを送ってください。 どのようにしたら非営利的団体が検索エンジンを走らせる余裕を持つことができるか?Nutch は、主にソフトウェアプロジェクト(サービスではない)です。 Nutch の大規模な展開は多分 Nutch とは別の商用システムによって動くでしょう。そして、広告または誰かによって資金を供給されることでしょう。 Nutch ソフトウェアが十分に良いものならば、おそらく、既存の主な検索エンジンは未公開のソースコードの代わりに Nutch を使うようになるでしょう。 Nutchプロジェクトは、人々が Nutch が本当に動作することがわかるように、小規模のデモ・システムを設置する方法を選ぶかもしれません。 このデモシステムは、適度な資金提供(おそらく 2〜30万ドル)で十分です。 Nutch プロジェクトは、皆さんが日常的な検索エンジンとして使用するための全面的な展開は、おこなわないかもしれません。 潤沢な資金があった場合の挑戦のために、我々は大規模展開のプランを課題として残しておきます。 Nutch は、他の検索エンジンと同じくらい良いものなのですか?我々は、それがより良いものであることを望んでいます。 世界中の開発者と研究者が手伝ってくれることにより、我々はどんな会社でも実現しえない品質になることを望んでいます。 どうしたら、私のサイトに対する Nutch からのクローリングを止めることができますか?ウェブマスター向け情報ページをご覧ください。 どうしたら、私のサイトが Nutch からクロールしてもらうようにできますか?Nutch はクローリングの起点として DMOZ Open Directory を使っています。あなたのサイトが Nutch によってクロールしてもらう最良の方法は、あなたのサイトが DMOZ に登録されていることです。 Nutch は、P2Pベース の検索エンジンですか?我々は、既存の検索エンジンの競争にうち勝つピア・ツー・ピア検索エンジンを構築するのは現在不可能であると考えます。 なぜなら、あまりに遅いからです。 検索エンジンにとって 1秒未満で結果を返すことは、重要なことです。 何度も検索し、探しているものを見つけ出せるよう、素早く質問の結果を系統立てて提示するのです。 要するに、速い検索エンジンが、良い検索エンジンなのです。 多くの人々は結果を求めるまでに 10秒以上かかる検索エンジンを使用したいとは思わないでしょう。 どなたかが Nutch のサブプロジェクトとして P2P 検索エンジンを始めたいとしましょう。 Nutch プロジェクトに是非ともそのプロジェクトのホスティングをお手伝いさせてください。 P2P 検索の技術は Nutch が解決する必要のある困難な問題を解決するとは限りません。 しかし、P2P検索エンジンが遅いという事実が間違っていることが証明されれば、それは喜ばしいことです。 Nutch は Grub のような公開されているクローラを用いているのですか?配布されたクローリングを用いればダウンロード・バンド幅を温存することができます。しかし、長い目で見れば、このことは重要ではありません。 成功した検索エンジンは質問結果ページをアップロードするためにそのクローラーがページをダウンロードする作業より多くのバンド幅を必要とするので、クローラーがより少ないバンド幅で済むことは全体的なバンド幅使用量を減らしません。 検索エンジンの消費するコストは、クローラーではなくて、検索です。 オープンソースであることによって、よりランキングを意図的に操作することをより容易にしませんか?検索エンジンは、意図的なランキング操作のために作られたページに影響されないランキング・アルゴリズムを造るために一生懸命がんばっています。 検索エンジン・オプティマイザーは、現在のところまだなんとか検索エンジンによって利用されている第一流のアルゴリズムを逆分析して、ページのランキングを改善することができます。 たとえば、多くのサイトは検索エンジンのリンク・ベースのランキング・アルゴリズムを操作するためにリンクファームを使います。そして、検索エンジンはリンクファームの効果をうち消すためにリンク・ベースのアルゴリズムを改善することによって報復しています。 オープンソース検索エンジンは、ソースコードが公開されているので、よくこの問題が取りあげられます。 この問題は、暗号化アルゴリズムやウイルス保護ソフトウェアに類似しています。 ソースコードが公開されていることによって、 長期的に、より多くの人々が欠陥を見つけて、改良を提案するためにソースコードを調べることができます。 アルゴリズムを公開することによって、そのアルゴリズムをより強力にします。 このように、オープンソース検索エンジンは、意図的なランキング操作により良く抵抗するための可能性を持つと思っています。 いつ Nutch は画像検索や PDF ファイルなどを検索できるようになりますか?そのうちすぐに検索できるよう、がんばってます。 |
Except where otherwise noted, this site is licensed under a Creative Commons License. ca | de | en | es | fi | fr | hu | jp | ms | nl | pl | pt | sv | th | zh |
||