O NutchCzęste pytaniaDeweloperzyDarowizny
 
 
Tłumaczenia (i18n)

Strony projektu Nutch, włącznie ze stronami wyszukiwarki, są łatwe do przetłumaczenia na inny język.

Dla każdego języka istnieją trzy rodzaje informacji do przetłumaczenia:

  1. nagłówek strony: Jest to lista odnośników umieszczana na górze każdej strony.
  2. stała zawartość strony: Stanowi największą część stron projektu Nutch, i służy również jako dokumentacja, tak jak np. ta strona.
  3. zmienny tekst na stronie: Używany przy tworzeniu listy wyników wyszukiwania.

Każda z tych rzeczy opisana jest szczegółowo poniżej.

Wprowadzenie

Ogólnie rzecz biorąc, nie wszystkie części dokumentacji Nutch muszą zostać przetłumaczone. Najważniejsze rzeczy do przetłumaczenia to:

  1. nagłówek strony
  2. strona "about" / "o projekcie" (src/web/pages/lang/about.xml)
  3. strona "search" / "szukanie" (src/web/pages/lang/search.xml)
  4. strona "help" / "pomoc" (src/web/pages/lang/help.xml)
  5. tekst używany przy tworzeniu listy wyników (src/web/locale/org/nutch/jsp/search_język.properties)

Jeśli chciałbyś dostarczyć tłumaczenie, po prostu wyślij tych pięć plików na listę dev@nutch.org jako załącznik. Jeśli możesz przetłumaczyć więcej, też chętnie to przyjmiemy! Dla tych stron, których nie przetłumaczyłeś, użyj odnośników do ich wersji w jęz. angielskim. Weź inne tłumaczenia jako przykład jak to zrobić.

Nagłówek strony

Nagłówek stron Nutch umieszczany jest na górze każdej strony.

Nagłówek ten znajduje się w pliku src/web/include/język/header.xml gdzie język jest to kod IS0639 danego języka.

Format pliku nagłówka jest następujący:

  <header-menu>
    <item> ... </item>
    <item> ... </item>
  </header-menu>

Każdy element "item" zawiera zazwyczaj odnośnik HTML, po jednym na każdą stronę górnego poziomu danego tłumaczenia.

Na przykład plik nagłówka dla tłumaczenia w jęz. angielskim znajduje się w src/web/include/en/header.xml.

Stała Zawartość Strony

Stałe strony stanowią większą część zawartości stron Nutch, i są również użyte jako dokumentacja projektu. Są to pliki HTML wygenerowane z plików XML przy pomocy transformacji XSL. W trakcie tego procesu dołączany jest standardowy nagłówek i stopka strony, oraz opcjonalnie menu stron o poziom niżej.

Stała zawartość znajduje się w plikach src/web/pages/język/strona.xml, gdzie język jest to kod IS0639 języka, jak powyżej, a strona określa nazwę generowanej strony: docs/page.html.

Format pliku XML zawierającego treść strony jest następujący:

  <page>
    <title> ... </title>
    <menu>
      <item> ... </item>
      <item> ... </item>
    </menu>
    <body> ... </body>
  </page>
Element <menu> jest opcjonalny.

Zwróć uwagę na to, ze jeśli używasz kodowania znaków innego niż UTF-8 (standardowe dla plików XML), to musisz to zadeklarować. Tak samo jeśli używasz encji HTML musisz je również zadeklarować. Weź na wzór istniejące już tłumaczenia.

Na przykład strona "about" dla jęz. angielskiego znajduje się w pliku src/web/pages/en/about.xml.

Zmienna Zawartość Stron

Do wyświetlenia wyników wyszukiwania, jak również paru innych dynamicznych stron (ranking, kopia, wyjaśnienie, itd.) używa się stron Java Server Pages (JSP).

Posługują się one mechanizmem Javy Locale dla zapewnienia wielojęzyczności. Dla każdej pary strona/język istnieje plik w formacie Java properties, zawierający przetłumaczony tekst danej strony.

Pliki te znajdują się w src/web/locale/org/nutch/jsp/strona_język.xml gdzie strona jest nazwą strony JSP w src/web/jsp/ a język jest to kod IS0639 języka, jak powyżej.

Na przykład tekst w jęz. angielskim dla strony wyszukiwania "search" znajduje się w src/web/locale/org/nutch/jsp/search_en.properties. Jego zawartość to:

  title = search results
  search = Search
  hits = Hits <b>{0}-{1}</b> (out of {2} total matching documents):
  cached = cached
  explain = explain
  anchors = anchors
  next = Next

Każdy wiersz odpowiada fragmentowi tekstu ze strony z wynikami. Wiersz "hits" używa składni opisanej w dokumentacji klasy MessageFormat.

Zwróć uwagę na to, że te pliki property muszą używać kodowania ISO 8859-1 oraz zakodowanych znaków Unicode. Jeśli wpisałeś je przy użyciu innego kodowania, to musisz użyć programu native2ascii żeby dostosować ich kodowanie.

Generowanie Stron Statycznych

Jesli chcesz wygenerować statyczne strony, musisz mieć zainstalowane pakiety Java, Ant oraz źródła Nutch. Do zainstalowania najnowszej wersji oficjalnej Nutch możesz ściągnąć wersję z danego dnia, lub uzyskać ją za pomocą CVS.

Następnie wydaj polecenie:

  ant generate-docs
Ta dokumentacja wymaga więcej szczegółów. Czy ktoś mógłby podać listę wszystkich kroków wymaganych na tym etapie?

Kiedy już ten etap zadziała, spróbuj dodać katalogi i pliki z twoim tłumaczeniem nagłówka i niektórych stron statycznych.

Testowanie Stron Dynamicznych

Jeśli chcesz przetestować strony tworzone dynamicznie, musisz również mieć instalację serwera Tomcat.

Będziesz również potrzebować indeksu. Możesz ściągnąć próbkę, lub też utworzyć własny indeks postępując według podręcznika. Kiedy już będziesz miał indeks, postępuj według wskazówek w podręczniku dotyczących wyszukiwania.

Ta dokumentacja wymaga więcej szczegółów. Czy ktoś mógłby podać listę wszystkich kroków wymaganych na tym etapie?

    Creative Commons License
Except where otherwise noted,
this site is licensed under a Creative Commons License.
ca | de | en | es | fi | fr | hu | jp | ms | nl | pl | pt | sv | th | zh
sf.net