Heavy Metal auf Finnisch

Wer derzeit in der kompletten Wikipedia suchen will, hat es nicht leicht. Die konkrete Suchanfrage muss mitunter für viele Sprachen neu angepasst werden, in der Regel auch bei Namen. Wenn ich alle Inhalte über Helmut Kohl in Wikipedia finden will, hilft mir natürlich beispielsweise bei google folgende Anfrage:

Helmut Kohl site:wikipedia.org

Wer will, kann auch nach “Helmut Kohl” suchen und findet dann keinen “Helmut Josef Michael Kohl” mehr, dafür auch keinen “Helmut Fischer und Johannes Kohl”.

Der Artikel הלמוט קוהל in der hebräischen Wikipedia wird nur gefunden, weil in der Infobox auch seine Schreibweise auf lateinisch steht. 34 andere Treffer gehen unter und werden erst via

"הלמוט קוהל" site:he.wikipedia.org

gefunden. “” sind auch hier wieder Geschmackssache.

Mit einer Zeile in der Shell kann man aus einem einzelnen Dump der Wikipedia eine Liste der Interwikilinks extrahieren, die bei dieser Übersetzungsarbeit hilft. Das Resultat ist dann ungefiltert und hilft bei vielen Begriffen recht angenehm weiter:

Sozialstaat
    ca:Estat del benestar
    cs:Sociální stát
    en:Welfare state
    eo:Sociala Ŝtato
    es:Estado Social
    et:Heaoluriik
    fi:Hyvinvointivaltio
    fr:État-providence
    gl:Estado social
    he:מדינת רווחה
    it:Welfare state
    ja:福祉国家論
    ko:복지국가
    nl:Welvaartsstaat
    nn:Velferdsstat
    no:Velferdsstat
    pl:Państwo opiekuńcze
    pt:Estado do bem-estar social
    ru:Социальное государство
    sk:Štát blahobytu
    pl:Cătălin Hîldan
    ro:Cătălin Hîldan

Und jetzt sind wir eigentlich schon mittendrin in dem typischen Anwendungsszenario:

  1. Ich tippe meinen Suchbegriff ein (z.B. Keuchhusten)
  2. Der Suchbegriff wird in x Sprachen übersetzt ( en:Pertussis, es:Tos ferina, fi:Hinkuyskä,fr:Coqueluche,he:שעלת,hu:Szamárköhögés..)
  3. Zu jedem Paar der Übersetzung wird in der Wikipedia-Sprachausgabe gesucht: Keuchhusten site:de.wikipedia.org, Pertussis site:en.wikipedia.org, Tos ferina site:es.wikipedia.org…)
  4. Die Suchtreffer werden zurückübersetzt (en, es, hu) und in einer gemeinsamen Trefferliste dargestellt.

Nicht nur darum freue ich mich auf die Arbeit von Daniel.

Tags: , ,

Comments are closed.