A proposQuestions fréquentesDéveloppeursFaire un don
 
 
FAQ

Pourquoi le monde a-t-il besoin de Nutch, alors que les moteurs de recherche sont gratuits?

Les moteurs de recherche sont gratuits, la télévision aussi, mais comme les programmes télévisés, les résultats des moteurs de recherche ont tendance à être manipulés par les intérêts qui les contrôlent. Le seul moyen d'être sûr que les résultats d'une recherche ne sont pas faussés, c'est que la technologie utilisée soit publique. Nutch a pour vocation de rendre une technologie de recherche de haute qualité disponible gratuitement.

Que faire pour aider?

Si vous souhaitez donner de l'argent, merci de vous rendre sur la page dons.

Si vous êtes un développeur, merci de vous rendre sur la page développeurs.

Si vous avez des suggestions, questions ou commentaires, merci d'envoyer un message à general@nutch.org.

Comment une organisation à but non lucratif pourrait avoir un moteur de recherche?

Nutch est avant tout un projet logiciel et non un service. Des déploiements à grande échelle de Nutch seraient vraisemblablement entrepris par des intérêts commerciaux indépendemment de Nutch, en fonctionnant avec de la publicité ou autre. Si Nutch est suffisamment performant, de grands moteurs de recherche actuels l'utiliseront à la place de leur propre code source.

Le projet Nutch pourrait choisir d'héberger un système de petites démos, pour que les gens puissent voir que ça marche vraiment. Cela ne nécessiterait qu'un investissement modéré, peut être de quelques centaines de milliers de dollars. Le projet Nutch n'hébergera sans doute jamais un système à grande échelle que les gens pourraient utiliser tous les jours comme moteur de recherche. Nous laisserons cela aux grands entreprises commerciales qui peuvent se le permettre.

Est-ce que Nutch sera aussi bon que les autres moteurs de recherche?

Nous espérons qu'il sera meilleur. Avec l'aide de développeurs et de chercheurs du monde entier, nous espérons être capable de surpasser la qualité de ce qu'une compagnie peut faire seule.

Comment empêcher Nutch d'indexer mon site?

Merci d'aller sur la page infos webmaster.

Comment faire pour que Nutch indexe mon site?

Nutch utilise le DMOZ Open Directory pour initialiser son crawling. C'est pourquoi le meilleur moyen de faire indexer votre site par Nutch est de vous assurer qu'il est répertorié dans l'Open Directory.

Est-ce que Nutch sera un moteur de recherche distribué de type P2P?

Nous ne pensons pas qu'il soit actuellement possible de réaliser un moteur de recherche peer-to-peer capable de rivaliser avec les moteurs de recherche existants. Il serait tout simplement trop lent. Donner des résultats en moins d'une seconde est important : cela permet aux gens de reformuler rapidement leurs requêtes pour qu'ils puissent trouver plus souvent ce qu'ils cherchent. En bref, un moteur de recherche rapide est un bon moteur de recherche. Je ne pense pas que beaucoup de gens voudraient utiliser un moteur de recherche qui mette dix secondes ou plus avant d'afficher un résultat.

Ceci dit, si quelqu'un souhaite lancer un sous-projet de Nutch pour explorer la recherche distribuée, nous accepterons volontiers de l'héberger. Nous ne pensons pas que ces techniques soient capables de résoudre les problèmes complexes auxquels Nutch se doit de répondre, mais nous serions ravis que l'on nous prouve le contraire.

Est-ce que Nutch utilisera un crawler distribué tel que Grub?

Le crawling distribué permet d'épargner de la bande passante descendante, mais à long terme, cette économie n'est pas très importante. Un moteur de recherche réussi nécessite plus de bande passante pour uploader les pages de résultats que son crawler n'en a besoin pour télécharger les pages. Réduire la bande passante utilisée par le crawler ne réduit donc pas les besoin de bande passante en général. Le coût principal pour un moteur de recherche n'est pas le crawling, mais la recherche.

Etre open source ne facilite t'il pas la manipulation des classements par les sites web?

Les moteurs de recherche s'efforcent de construire des algorithmes insensibles aux manipulations. Des optimiseurs de moteurs de recherche réussissent tout de même à percer les algorithmes de classement utilisés par les moteurs et améliorent le classement de leurs pages. Par exemple, beaucoup de sites utilisent des Link Farms pour manipuler les algorithmes de classement basés sur les liens et en réponse à cela les moteurs de recherche améliorent leurs algorithmes pour neutraliser l'effet de ces Link Farms.

Avec un moteur de recherche open source cela arriverait quand même, mais d'une manière ouverte. C'est comme pour le cryptage et les logiciels de protection contre les virus. A long terme, avoir de tels algorithmes en open source les rend plus puissants, dans la mesure où plus de gens peuvent examiner le code pour y trouver des faiblesses et suggérer des améliorations. C'est pour cela que nous croyons qu'un moteur de recherche open source a le potentiel pour mieux résister aux manipulations de ses classements.

Quand est-ce que Nutch pourra rechercher des images, des fichiers pdf, etc.?

Bientôt, du moins nous l'espérons.



    Creative Commons License
Except where otherwise noted,
this site is licensed under a Creative Commons License.
ca | de | en | es | fi | fr | hu | jp | ms | nl | pl | pt | sv | th | zh
sf.net