Da ich mein DokuWiki auf Lange Sicht nach Hugo umziehen möchte, habe ich mir verschiedene Möglichkeiten angesehen, die Daten zu exportieren und ins Format Markdown zu überführen, welches in Hugo verwendet wird.
DokuWiki-to-Markdown-Converter
Aufruf:
find path/to/pages/ -name "*.txt" -exec php convert.php '{}' \;
Danach gibt es sowohl die alten .txt-Dateien als auch die neuen .md-Dateien in pages/
. Jetzt können wir die alten Dateien löschen:
find path/to/pages/ -name "*.txt" -execdir rm '{}' \;
Das Ergebnis ist eine Verzeichnisstruktur von pages
, die nur noch .md-Dateien ohne Front Matter
enthält.
Pro und Kontra von DokuWiki-to-Markdown-Converter
- Pro
- Konvertiert Tabellen
- Konvertiert ins
Github flavored Markdown
- Konvertiert eingebettete Bilder, auch mit Bildbeschreibungen.
- Kontra
- Das Tool erstellt kein Front Matter.
- Keine Konvertierung von Fußnoten.
- Leerzeile auch zwischen zusammen gehörigen Listen
- Hat Probleme bei Titeln von Tabellen (gibt es keine Überschrift, dann wird die erste Zeile zur Überschrift).
DokuWiki-to-Hugo
Aufruf:
python src/main.py --dir='path/to/pages/'
Das Ergebnis ist eine neue Verzeichnisstruktur von pages
, die nur noch .md-Dateien ohne Front Matter
enthält.
Pro und Kontra von DokuWiki-to-Hugo
- Pro
- Erzeugt Front Matter, allerdings im TOML-Format
- Kontra
- Bei mir wurde nur das Front Matter zur exportierten Datei hinzugefügt, jedoch keinerlei Konvertierung der Dateiinhalte vorgenommen.
- Selbst wenn es funktionieren würde, so gibt es nur Konvertierungen für relativ wenige Elemente.
Pandoc
Aufruf:
find path/to/pages/ -iname "*.txt" -exec pandoc --wrap=none -s --from=dokuwiki --to=gfm -o "{}.md" '{}' \;
Der Parameter --wrap=none
ist wichtig, da sonst in jeder Zeile nach 72 Zeichen ein Zeilenumbruch eingefügt wird. Dokumentation dazu gibt es hier im Bereich “wrap”.
Pro und Kontra von Pandoc
- Pro
- Konvertiert Fußnoten und viele andere Dinge.
- Kontra
- Kein Front-Matter (natürlich nicht, ist ein Konverter, kein Hugo-Exporter). Der lässt sich aber rudimentär selbst einfügen.
- Konvertiert eingebettete Bilder in img-Tags statt in die Markdown-Syntax.
Fazit
Pandoc gefällt mir von den getesteten Möglichkeiten am besten. Wie ich das genau benutzt habe, um die Inhalte meines Wikis zu exportieren, schreibe ich in einem eigenen Blogbeitrag und werde diesen hier verlinken.
Kommentare
Bisher gibt es hier keine Kommentare.
Kommentar oder Anmerkung für diesen Blogbeitrag
Öffentlicher Kommentar per E-Mail: Hier klicken
Nicht öffentliche Anmerkung per E-Mail: Hier klicken
Sonstige Kontaktaufnahme: Kontakt