|
|
Dlaczego świat potrzebuje Nutch, skoro wyszukiwarki są za darmo?Wyszukiwarek można używać za darmo podobnie jak programu telewizyjnego, ale tak jak i program tak też rezultaty wyszukiwania podlegają manipulacjom ze strony różnych kontrolujących je interesów. Jedyny sposób na to, żeby być pewnym co do obiektywności rezultatów wyszukiwania jest upublicznienie technologii, która służy do ich wytworzenia. Projekt Nutch pragnie udostępnić za darmo wysokiej jakości technologię wyszukiwania. Jak mogę pomóc?Jeśli chciałbyś przekazać darowiznę finansową, zajrzyj na stronę o darowiznach. Jeśli jesteś programistą, zajrzyj na stronę dla programistów. Jeśli masz jakieś inne sugestie, pytania lub uwagi, wyślij je na adres general@nutch.org. Jak organizację "non-profit" stać na utrzymywanie wyszukiwarki?Projekt Nutch to przede wszystkim oprogramowanie, a nie usługa. Instalacje Nutch na wielką skalę będą operowane prawdopodobnie przez przedsięwzięcia komercyjne, niezależne od tego projektu, zarabiające na ogłoszeniach lub czymś podobnym. Jeśli oprogramowanie Nutch okaże się wystarczająco dobre, być może również istniejące główne wyszukiwarki zaczną je stosować zamiast swojego obecnego kodu zamkniętego dla publiczności. Sam projekt Nutch może postanowić, że uruchomi system demonstracyjny na niewielką skalę, tak żeby ludzie mogli zobaczyć jak to naprawdę działa. Będzie to wymagało stosunkowo umiarkowanych funduszy. Projekt Nutch pewnie nigdy nie będzie w stanie obsługiwać instalacji na wielką skalę, tak żeby ludzie mogli jej używać jako swojej wyszukiwarki na co dzień. Zostawiamy to przedsięwzięcion komercyjnym, które mogą sobie na to pozwolić. Czy Nutch kiedykolwiek będzie tak dobry jak inne wyszukiwarki?Mamy nadzieję, że będzie lepszy. Przy pomocy deweloperów i naukowców z całego świata, mamy nadzieję przewyższyć jakość, którą jest w stanie zapewnić dowolna pojedyncza firma. Jak mogę zabronić robotowi Nutch indeksowania moich stron?Przeczytaj o tym na stronie informacyjnej dla webmasterów. Jak mogę zapewnić, że Nutch będzie indeksował moje strony?Nutch posługuje się katalogiem DMOZ Open Directory dla uzyskania początkowych adresów do indeksowania. Tak więc najlepszą metodą, żeby Nutch zaczął indeksować twoje strony, to umieścić je w katalogu Open Directory. Czy Nutch będzie wyszukiwarką o architekturze rozproszonej, P2P?Uważamy, że nie jest obecnie możliwe zbudowanie wyszukiwarki o architekturze peer-to-peer, która byłaby konkurencyjna dla istniejących wyszukiwarek. Byłaby ona po prostu zbyt wolna. Zwracanie wyników w czasie poniżej sekundy jest ważne - pozwala to ludziom szybko przeformułować zapytania tak, żeby częściej znaleźć to o co im chodzi. W skrócie, szybka wyszukiwarka to lepsza wyszukiwarka. Nie sądzę, żeby wiele osób chciało używać takiej wyszukiwarki, gdzie trzeba czekać dziesięć lub więcej sekund na otrzymanie wyników. Mimo to, jeśli ktoś chciałby rozpocząć sub-projekt Nutch-a w celu zbadania możliwości wyszukiwania rozproszonego, bardzo chętnie dodamy go. Nie sądzimy, żeby tego typu technologie mogły rozwiązać tak trudne problemy jakie Nutch musi rozwiązać, ale chętnie przyjmiemy dowód na to, że jesteśmy w błędzie. Czy Nutch będzie używał rozproszonego robota, tak jak Grub?Rozproszone indeksowanie może zaoszczędzić nieco przepustowości, ale na dłuższą metę te oszczędności nie są znaczące. Dobrze działająca wyszukiwarka wymaga więcej przepustowości żeby wysyłać wyniki wyszukiwania, niż wymaga tego jej robot indeksujący do ściągnięcia indeksowanych stron. Tak więc zastosowanie architektury rozproszonej robota nie zmniejsza ogólnego zapotrzebowania na pasmo. Głównym kosztem operowania wyszukiwarki nie jest indeksowanie, lecz wyszukiwanie. Czy technologia Open Source nie sprawi, że będzie łatwiej wyszukiwarkom manipulować wynikami?Wyszukiwarki bardzo starają się opracować takie algorytmy rankingu, które są odporne na manipulacje. A jednak firmy zapewniające "lepszy ranking" i tak są w stanie odtworzyć te algorytmy, i "poprawić" ranking ich stron. Na przykład, wiele serwisów korzysta z "ferm odnośników" w celu oszukania algorytmów wyszukiwarek opartych na liczbie połączeń do strony - a wyszukiwarki odpowiadają na to ulepszeniami swoich algorytmów, żeby zneutralizować wpływ "ferm odnośników". W przypadku wyszukiwarki opartej na technologii Open Source takie sytuacje też będą się zdarzały, ale w sposób jawny. Ta sytuacja podobna jest to szyfrowania i oprogramowania antywirusowego. Na dłuższą metę, publikacja takich algorytmów jako Open Source przyczynia się do ich wzmocnienia, bo więcej ludzi może przebadać kod źródłowy, żeby znaleźć usterki i zaproponować ulepszenia. Wierzymy więc, że wyszukiwarka Open Source może potencjalnie byc bardziej odporna na manipulację rankingami. Kiedy Nutch zacznie obsługiwać pliki graficzne, PDF itp.?Mamy nadzieję, że wkrótce. |
Except where otherwise noted, this site is licensed under a Creative Commons License. ca | de | en | es | fi | fr | hu | jp | ms | nl | pl | pt | sv | th | zh |
||