Posts Tagged ‘prince’

Jahrbuch reloaded

Thursday, January 22nd, 2009

Auf meta.wikimedia.org wird seit 2004 an einer Liste gebastelt, die derzeit genau 1000 Einträge umfasst: Artikel, die jede Wikipedia (-Sprachausgabe) haben sollte. Man kann durchaus mit guten Gründen das Ziel, eine für die ganze Welt, alle Sprachen und Länder und Kulturen “verbindliche” Liste von 1000 Basis-Artikeln zu definieren durchaus kritisieren, ganz zu schweigen von der konkreten Umsetzung. Die aktuelle Liste “Version 1.1″ umfasst derzeit Artikel folgender “Rubriken”, wenn man die Kategorienwahl der Autoren dieser Liste als Maßstab nimmt:

  • 216 Biographien
  • 40 Geschichte
  • 148 Geographie
  • 77 Gesellschaft
  • 150 Kultur
  • 245 (Natur-)Wissenschaft
  • 71 Technologie
  • 31 Nahrungsmittel
  • 22 Mathemathik

Auch hier kann man ordentlich herumkritisieren, etwa an dem eindimensionalen Verständnis einer Kategorienzuweisung für einen einzelnen Artikel.

Das schöne an einer in einer Sprache verfassten Liste von 1000 der approximativ “zentralsten” Artikel ist, dass die Chancen steigen, möglichst viele dieser Artikel einer jeweiligen Sprache zu finden. Das Werkzeug der Wahl ist dabei die Interwikilink-Liste. Wer will, kann sie sich auch herunterladen. Eine erste Aufwertung findet sich auch, die Liste der Sprachen, sortiert nach dem Zustand dieser 1000 Artikel. Dieser Ansatz riskiert, jene Artikel zu übersehen, die zwar in einer Sprache schon existieren, aber noch nicht in der englischsprachigen Wikipedia verlinkt sind.

Mit einer solchen halbwegs stabilen Liste kann man auch den Jahrbuch-Ansatz noch einmal neu aufziehen: Nicht die Artikelnamen ändern sich, sondern die Inhalte werden jeweils neu gerendert. Für ein großartiges Werkzeug für diese Aufgabe halte ich wahlweise PrinceXML oder die collections-MediaWiki extension. Ersteres hat den Vorteil, sehr schöne Resultate zu liefern, collections hingegen ist unter einer freien Lizenz verwendbar.

Schöner lesen mit XML-Prinzen

Sunday, January 11th, 2009

2004 stellte Thomas Karcher in Wikipedia das Projekt “WikiReader” vor: Einzelne Wikipedia-Inhalte beispielsweise zum Thema Schweden werden zusammenkopiert, hübsch gemacht, ggf. korrekturgelesen und dann als PDF oder gedruckte Ausgabe verteilt.

Seitdem gab es diverse Ansätze und technische Konzepte (wiki2pdf, wiki2xml, pediapress (code), pdfwwe), um (Media)Wiki-Text nach PDF und hübsch zu exportieren. Gestern habe ich durch Zufall einen neuen Ansatz entdeckt, den Kenner vielleicht schon aus anderen Zusammenhängen längst kennen: PrinceXML.

Prince liefert ein paar Beispiele, die ich persönlich für die beste mir bekannte Umsetzung von HTML/XHTML/XML nach PDF halte. Darunter sind auch drei Wikipedia-Artikel (United States, Norway und Soviet Union) aus der englischsprachigen Ausgabe.

Prince wird für private Zwecke kostenfrei zum Download für diverse Plattformen angeboten, kommerzielle Nutzung hingegen wird etwas teurer.

Der größte deutschsprachige Wikipedia-Artikel (Geschichte Polens) rendert auf meinem Notebook in 26 Sekunden durch, heraus kommt ein 65 Seiten starkes PDF, das natürlich noch kleinere Macken in der Umsetzung hat. Ein professioneller Layouter wird hier unendlich schönere Ergebnisse liefern. Vermutlich wäre auch noch einiges auf Seiten von Wikipedia verbesserungsfähig, um das Ergebnis noch weiter zu verschönern.

Ich empfehle Prince zum uneingeschränkten Herumspielen.

Screenshot von Prince: Geschichte Polens

Screenshot von Prince: Geschichte Polens