🔒
Es gibt neue verfügbare Artikel. Klicken Sie, um die Seite zu aktualisieren.
Ältere BeiträgeHaupt-Feeds

LanguageTool auf eigenem Server installieren

19. Dezember 2021 um 11:45

Wie ihr schon im ersten Teil dieser kleinen Artikelserien zu LanguageTool lesen konntet, ist die Integration einer bestmöglichen Rechtschreibkorrektur in ein System gar nicht so einfach. Betreut man mehrere Rechner im Netz oder soll LanguageTool im Browser ohne den proprietären Dienst des kommerziellen Projekts funktionieren, lohnt es sich daher, selbst einen LanguageTool-Server aufzusetzen. So funkt LanguageTool weniger ins Netz und eure Texte bleiben vollständig unter eurer Kontrolle. Es braucht nur einen kleinen Rechner im eigenen LAN mit ausreichend freiem Speicherplatz, mindestens 4 GByte solltet ihr übrig haben. Optional installiert ihr euch den Server auf der eigenen Workstation.

Ursprünglich hatte ich auch gedacht, dass LanguageTool eine ideale Ergänzung für meinen Raspberry Pi wäre, der hier im LAN bereits als File-, Drucker- und Scan-Server sowie generell als stromsparende eierlegende Wollmilchsau arbeitet. Doch hier wirds leider hakelig: LanguageTool benötigt zwingend ein 64 Bit-System als Basis. Das bietet die vierte Generation des Raspberry Pi zusammen mit der ARM64-Version des Raspberry Pi OS zwar, doch am Ende scheitert es an Java-Bibliotheken, die auch auf dieser Version des Betriebssystems nur in der 32 Bit-Version vorliegen. Auf die Situation gehe ich am Ende des Artikels ein. Im Folgenden nutze ich einen kleinen Server auf Basis von Debian.

Installation von LanguageTool

Für den LanguageTool-Server benötigt ihr ein Linux-System mit einer Java-Runtime-Umgebung. Auf einem Debian-basiertem System, wie etwa auch Ubuntu oder Linux Mint, spielen die folgenden Kommandos alles Nötige ein. Die Installation der N-Gramm-Daten (zum Erkennen von Schreibfehler wie „viel“ statt „fiel“, „seit“ statt „seid“ oder „Stil“ statt „Stiel“) ist optional. Sie verbessert die Erkennung von oft falsch geschrieben Wörter, schaufelt allerdings nochmal ein paar Gigabyte mehr an Daten auf den Rechner. Für optimale Ergebnisse würde ich diesen Schritt allerdings nicht übergehen und zumindest die N-Gramm-Daten für Deutsch einspielen.

### Installation von LanguageTool:
$ sudo apt install default-jre-headless unzip
$ sudo apt install hunspell hunspell-de-de hunspell-en-us
$ wget https://languagetool.org/download/LanguageTool-stable.zip
$ unzip LanguageTool-stable.zip
$ sudo mv LanguageTool-*.*/ /opt/LanguageTool
$ rm LanguageTool-stable.zip
### Installation der N-Gramm-Daten für Deutsch (~3,5 GByte):
$ sudo mkdir /opt/LanguageTool/ngrams
$ wget https://languagetool.org/download/ngram-data/ngrams-de-20150819.zip
$ sudo unzip ngrams-de-20150819.zip -d /opt/LanguageTool/ngrams
$ rm ngrams-de-20150819.zip
### Installation der N-Gramm-Daten für Englisch (~8,0 GByte):
$ wget https://languagetool.org/download/ngram-data/ngrams-en-20150817.zip
$ sudo unzip ngrams-en-20150817.zip -d /opt/LanguageTool/ngrams
$ rm ngrams-en-20150817.zip
### LanguageTool benötigt über 3 GByte Speicherplatz:
$ du -hs /opt/LanguageTool
3.4G	/opt/LanguageTool

Für einen ersten Test wechselt ihr nun auf dem Terminal in das Installationsverzeichnis unter /opt/LanguageTool des LanguageTool-Archivs. Das zweite Kommando aus dem folgenden Listing startet dann testweise die Server-Komponente von LanguageTool. Der Dienst lauscht auf Port 8081 auf Anfragen, mehr braucht es bei diesem Schritt auch noch nicht. Mit der Tastenkombination [Strg]+[C] beendet ihr den Dienst und kehrt wieder auf die Shell zurück.

$ cd /opt/LanguageTool
$ java -cp languagetool-server.jar org.languagetool.server.HTTPServer --port 8081
2021-12-17 20:47:34.423 +0100 INFO  org.languagetool.server.DatabaseAccessOpenSource Not setting up database access, dbDriver is not configured
2021-12-17 19:47:34 +0000 WARNING: running in HTTP mode, consider running LanguageTool behind a reverse proxy that takes care of encryption (HTTPS)
2021-12-17 19:47:37 +0000 Setting up thread pool with 10 threads
2021-12-17 19:47:37 +0000 Starting LanguageTool 5.5 (build date: 2021-10-02 12:33:00 +0000, 5e782cc) server on http://localhost:8081...
2021-12-17 19:47:37 +0000 Server started

Damit LanguageTool jetzt die von euch optional installierten N-Gramm-Daten integriert, erstellt ihr nun mit einem Editor wie Nano unterhalb des Ordners /opt/LanguageTool die Konfigurationsdatei languagetool.cfg. Als Inhalt fügt ihr die Ausgabe nach dem im folgenden Listing eingefügten Kommando cat languagetool.cfg ein. Mit der Tastenkombination [Strg]+[O] und [Eingabe] speichert ihr die Änderung des Editors ab, mit [Strg]+[O] geht es dann zurück auf die Shell. Selbstverständlich könnt ihr auch jeden anderen Editor verwenden.

$ sudo nano /opt/LanguageTool/languagetool.cfg
$ cat languagetool.cfg
languageModel=/opt/LanguageTool/ngrams/

LanguageTool-Server automatisch starten

Damit der LanguageTool-Server nun automatisch mit dem Rechner hochfährt, legt ihr eine sogenannte Unit für Systemd an. Dazu übertragt ihr den Inhalt aus dem folgenden Listing in die noch zu erstellende Datei /etc/systemd/system/languagetool.service. Orientiert euch beim Aufruf des Editors an der Nano-Zeile im vorhergehenden Listing. Alle Pfade beziehen sich auf den bei der Installation gewählten Ordner /opt/LanguageTool. Habt ihr ein anderes Installationsziel gewählt, müsst ihr die Pfade selbstverständlich in der Unit-Datei anpassen.

[Unit]
Description=LanguageTool
After=syslog.target
After=network.target

[Service]
Type=simple
User=languagetool
Group=nogroup
WorkingDirectory=/opt/LanguageTool
ExecStart=/usr/bin/java -cp /opt/LanguageTool/languagetool-server.jar org.languagetool.server.HTTPServer --config languagetool.cfg --port 8081 --allow-origin "*" --public
Restart=always
#Environment=USER= HOME=/opt/LanguageTool

[Install]
WantedBy=multi-user.target

Damit LanguageTool nicht mit Root-Rechten oder mit den Rechten eures Benutzers laufen muss, legt ihr nun noch einen eigenen System-Benutzer mit dem Namen languagetool an, ein Home-Verzeichnis braucht er nicht. Er muss sich auch nicht anmelden, daher wird auch kein Passwort gesetzt. Anschließend lasst ihr Systemd seine Konfiguration neu einlesen und aktiviert das Starten des LanguageTool-Servers. Danach ruft ihr den Dienst einmal von Hand auf und lässt euch zur Kontrolle den Status ausgeben. Der Dienst sollte sich mit active (running) zurückmelden und auch die ersten Logeinträge ausgeben.

$ sudo adduser --system --no-create-home languagetool
$ sudo systemctl daemon-reload
$ sudo systemctl enable languagetool
$ sudo systemctl start languagetool
$ sudo systemctl status languagetool
● languagetool.service - LanguageTool
● languagetool.service - LanguageTool
     Loaded: loaded (/etc/systemd/system/languagetool.service; disabled; vendor preset: enabled)
     Active: active (running) since Sat 2021-12-18 00:36:38 CET; 4s ago
   Main PID: 4763 (java)
      Tasks: 14 (limit: 2314)
     Memory: 72.3M
        CPU: 1.569s
     CGroup: /system.slice/languagetool.service
             └─4763 /usr/bin/java -cp /opt/LanguageTool/languagetool-server.jar org.languagetool.server.HTTPServer --config languagetool.cfg --port 8081 --allow-origin * --public

Dez 18 00:36:38 lui-test systemd[1]: Started LanguageTool.
Dez 18 00:36:39 lui-test java[4763]: 2021-12-18 00:36:39.486 +0100 INFO  org.languagetool.server.DatabaseAccessOpenSource Not setting up database access, dbDriver is not configured
Dez 18 00:36:39 lui-test java[4763]: 2021-12-17 23:36:39 +0000 WARNING: running in HTTP mode, consider running LanguageTool behind a reverse proxy that takes care of encryption (HTTPS)
Dez 18 00:36:39 lui-test java[4763]: 2021-12-17 23:36:39 +0000 WARNING: running in public mode, LanguageTool API can be accessed without restrictions!
Dez 18 00:36:40 lui-test java[4763]: 2021-12-17 23:36:40 +0000 Setting up thread pool with 10 threads
Dez 18 00:36:40 lui-test java[4763]: 2021-12-17 23:36:40 +0000 Starting LanguageTool 5.5 (build date: 2021-10-02 12:33:00 +0000, 5e782cc) server on http://localhost:8081...
Dez 18 00:36:40 lui-test java[4763]: 2021-12-17 23:36:40 +0000 Server started

Chrome/Firefox und LibreOffice konfigurieren

Im Gegensatz zur LanguageTool-Erweiterung für LibreOffice arbeiten die Browser-Erweiterungen für Chrome und Firefox in der Standardkonfiguration immer mit dem kommerziellen Backend des Dienstes zusammen. Um nun euren eigenen LanguageTool-Server in die Einstellungen einzutragen, öffnet ihr (unter Chrome) über das Menü mit den drei Punkten rechts oben den Eintrag Weitere Tools | Erweiterungen. Dort sucht ihr dann die Karte zur Grammatik- und Rechtschreibprüfung – LanguageTool heraus und tippt auf den Button Details, im nächsten Dialog dann weiter auf die Optionen. In den Einstellungen zu LanguageTool angekommen, müsst ihr euch via Ausloggen vom Dienst abmelden. Danach könnt ihr unter Experimentelle Einstellungen (nur für Profis) die URL zum eigenen LanguageTool-Server in der Art http://Server-IP:Port/v2 eintragen.

Nach der Installation tragt ihr euren LanguageTool-Server in Chrome oder Firefox ein.

Ähnlich funktioniert die Konfiguration auch mit der LanguageTool-Erweiterung für LibreOffice. Hier öffnet ihr über den Menüeintrag Extras | LanguageTool | Optionen… die Einstellungen. Die URL zu eurem Server tragt ihr dann im Reiter Allgemein ein. Im Gegensatz zur Konfiguration der Browser-Erweiterung kommt hier allerdings kein /v2 an das Ende der URL. Es genügt die Server-IP zusammen mit der Nummer des Ports einzutippen. Das N-Gramm-Verzeichis (wie im Screenshot abgebildet) müsst ihr nicht zwingend lokal abspeichern. Nutzt ihr einen Server mit eigenen N-Gramm-Daten, ist dieser Schritt natürlich nicht nötig.

Auch die LanguageTool-Erweiterung kann man auf einen den eigenen Server umleiten.

LanguageTool auf einem Raspberry Pi

Im Prinzip erfüllt der Raspberry Pi die Anforderungen von LanguageTool: Ausreichend Speicherplatz lässt sich mit einer entsprechend großen Speicherkarte schaffen. Auch die Rechenkapazität der vierten Generation des Mini-Rechners genügt vollkommen. Und der Raspberry Pi 4 lässt sich zusammen mit der ARM64-Version des Raspberry Pi OS auch mit 64 Bit fahren, den Server gibt es nur in einer 64-Bit-Version. Die Installation und der Aufruf funktioniert daher auch, schiebt man allerdings die ersten Texte zur Korrektur auf den Raspberry Pi, dann meldet das System Probleme mit Hunspell und BridJ.

pi@raspberrypi:/opt/LanguageTool $ java -cp /opt/LanguageTool/languagetool-server.jar org.languagetool.server.HTTPServer --config languagetool.cfg --port 8081 --allow-origin "*" --public
[...]
/tmp/BridJExtractedLibraries1395486954380915815/libbridj.so: Kann die Shared-Object-Datei nicht öffnen: Datei oder Verzeichnis nicht gefunden (Possible cause: can't load AMD 64-bit .so on a AARCH64-bit platform))
[...]
Caused by: java.lang.RuntimeException: Could not create hunspell instance. Please note that LanguageTool supports only 64-bit platforms (Linux, Windows, Mac) and that it requires a 64-bit JVM (Java).

Die Thematik wird bereits im Github des LanguageTool-Projekts diskutiert. Dort gibt auch einen Patch für BridJ sowie einen Workaround für Hunspell — ich habe beides allerdings hier bei mir nicht zum Laufen gebracht. Wer noch ein wenig mehr Experimentieren möchte, dem würde ich zu diesem Docker-Image für LanguageTool von Erik van Leeuwen raten. Es soll auch auf ARM64 laufen, also auch auf einem Raspberry Pi der vierten Generation. Ich habe hier bei mir allerdings LanguageTool inzwischen zufriedenstellend auf einem kleinen Intel Nuc laufen, von daher habe ich mich nicht weiter mit dem Betrieb von LanguageTool auf einem Raspberry Pi beschäftigt.

Rechtschreib- und Grammatikkorrektur mit LanguageTool

02. Dezember 2021 um 16:37

Egal ob Browser, Texteditor oder der LibreOffice Writer: Praktisch jedes Programm unter Linux, das Texte verarbeiten kann, beziehungsweise muss, bringt eine integrierte Funktion zur Rechtschreibprüfung und Hilfen für Korrekturen mit. Diese funktionieren in der Regel recht gut, meist lassen sich auch Texte in unterschiedliche Sprachen korrigieren. Doch oft geht die Korrektur nicht über einfache Tippfehler hinaus. Dabei unterkringelt die Rechtschreibprüfung zwar offensichtliche Schreibpfehler, sie kann aber nicht vermittelten, das man das dass doch besser korrigieren sollte oder dass man auch bei die grammatikalischen Fällen aufpassen sollte. Ich denke, ihr fühlt, was ich meine.

In anderen Worten: Oft genügt es nicht, das eigene Geschreibe lediglich auf Tippfehler zu prüfen, für einen ordentlichen Text sollte man auch die Grammatik und ein paar Stilregeln im Blick behalten. Dabei hilft das Open-Source-Programm LanguageTool mit Plugins für den Browser und wichtigen Programmen wie das LibreOffice. LanguageTool wird allerdings erst mit einem eigenen Server so richtig frei. Ohne diesen wandern zum Beispiel beim Browser-Plugin alle Texte durchs Netz und auch der Funktionsumfang ist eingeschränkt, solange man kein Abonnement abschließt. Der dafür nötige Server kann auf dem eigenen Rechner oder zentral im Netz auf einem Mini-Computer wie dem Raspberry Pi laufen.

Damit der Artikel nicht jegliche Dimensionen sprengt, teile ich die Thematik auf: In diesem ersten Beitrag geht es um die Nutzung von LanguageTool im Web-Frontend des Dienstes oder als Browser-Erweiterung. Zudem behandelt der Beitrag die Installation als eigenständiges Programm sowie die Integration in LibreOffice. Der zweite Teil erklärt dann abschließend die Installation von LanguageTool als Server im eigenen Netzwerk. Das lohnt sich nicht nur für Bastler, die gerne alle Dienste in eigener Regie betreiben, sondern auch für „normale“ Nutzer, da der eigene LanguageTool-Server die Privatsphäre schützt.

LanguageTool im Browser und Web

Prinzipiell könnt ihr LanguageTool direkt über die Homepage des Projekts nutzen. Dazu müsst ihr einfach euren Text per Copy&Paste in das Textfeld auf der Webseite übertragen. Ohne Account und Abonnement lassen sich so Texte mit bis zu 10.000 Zeichen korrigieren. Erstellt ihr euch einen kostenlosen Account, könnt ihr auch Dokumente im DOCX-Format (also dem von Microsoft Office) hochladen und direkt auf der Webseite korrigieren. Das überarbeitete Dokument lässt sich dann wieder als DOCX-Dokument herunterladen. Unter Linux funktioniert das auch mit LibreOffice Writer: Ob dabei allerdings jedwede Formatierung erhalten bleibt, dafür möchte ich nicht meine Hand ins Feuer legen. Für LibreOffice gibt es eine bessere Lösung, doch dazu gleich mehr.

Das LanguageTool lässt sich auch ohne Installation nutzen: Die Webseite erlaubt den Upload von Microsoft-Office-Dateien.

Um jetzt Texte direkt im Browser mit LanguageTool zu korrigieren, benötigt ihr eine Erweiterung. Diese gibt es ganz offiziell für Chrome/Chromium und Firefox, sowie Browser, die auf einem der drei Programme aufbauen. Nach der Installation klinkt sich die LanguageTool-Erweiterung bei Textfeldern direkt in den Editor ein. Das kleine orangefarbene Symbol rechts unter den Absätzen weist euch auf zusätzliche Korrekturvorschläge hin, die über Rechtschreib- und Grammatikfehler hinausgehen und eher den Schreibstil behandel. Optional aktiviert ihr noch den akribischen Modus, der die sprachliche Präzision, die Schriftform oder den Ton bewertet. Mit einem kostenpflichtigen Premium-Zugang prüft LanguageTool auch Namen und Anreden sowie Zahlen, wie etwa IBAN- oder ISBN-Nummern. Der Dienst kostet stolze 20 Euro pro Monat (bei monatlicher Zahlung und monatlicher Kündigung) oder 60 Euro pro Jahr, dann aber nur im Turnus eines Jahres kündbar.

Beim Einsatz der Erweiterung in der Standardkonfiguration sollte euch allerdings bewusst sein, dass jede Eingabe in ein Textfeld, egal auf welcher Webseite, an die Server von LanguageTool übermittelt wird. Nicht wirklich ideal, wenn man ein wenig auf seine Privatsphäre im Netz achtet. Ihr könnt lediglich einzelne Domains von der Online-Rechtsschreibkorrektur ausschließen: Unter Chrome zum Beispiel öffnet ihr dafür über das Menü rechts oben den Eintrag Weitere Tools | Erweiterungen. Dort klickt ihr bei Grammatik- und Rechtschreibprüfung – LanguageTool auf Details und im folgenden Dialog dann auf Optionen. In der Konfiguration habt ihr dann die Möglichkeit einzelne Regeln zu de-/aktivieren, die bevorzugten Sprachen einzustellen und eben aber auch Domains von der Rechtschreibkorrektur auszuschließen.

Mit einer Erweiterung integriert ihr LanguageTool in den Browser. Der akribische Modus prüft dann auch den Schreibstil und Ton des Textes.
In den Einstellungen von LanguageTool könnt ihr die Rechtschreibprüfung konfigurieren und auch Domains gezielt von der Prüfung ausschließen.

Auch wenn der Dienst in meinen Augen zu den sympathischeren seiner Zunft gehört und dem Nutzer einen echten Mehrwert bietet, lautet daher meine Empfehlung: Ihr könnt euch einen eigenen LanguageTool-Server aufsetzen, entweder lokal auf dem eigenen Rechner oder in einem Netzwerk auf einem kleinen Server, etwa einem Raspberry Pi. So bleiben eure Texte stets unter eurer Kontrolle. Sorgen um eure Privatsphäre müsste ich euch so nicht mehr machen. Wie ihr den Server aufsetzt und die Erweiterung entsprechend anpasst, darauf gehe ich im zweiten Teil diese Mini-Artikelserie ausführlich ein. Doch zunächst noch einen Blick auf LibreOffice, denn dort lässt sich die Rechtschreibkorrektur von LanguageTool ebenfalls per Erweiterung ergänzen.

LanguageTool als eigenständiges Programm

Der Open-Source-Aspekt kommt zum Tragen, sobald man den Dienst als Anwendung lokal auf dem eigenen Rechner installiert. Das Programm gibt es bei manchen Distributionen in den Paketquellen (etwa bei Arch Linux oder Manjaro). Auf anderen Distributionen wie Ubuntu oder Linux Mint muss man die Anwendung von Hand einspielen. Die dazugehörigen Archive findet man auf der Homepage von LanguageTool, inzwischen sind die Links zum Downloadbereich ein wenig versteckt. Damit man das Programm ausführen kann, müsst ihr zuvor eine Java-Laufzeitumgebung installieren. Die Paketverwaltung von Arch erledigt das bei der Installation des Pakets languagetool automatisch, bei Ubuntu und Co. müsst ihr das selbst erledigen.

### LanguageTool unter Arch oder Manjaro installieren. Diese
### Distributionen führen das Programm direkt in ihren Paketquellen:
$ sudo pacman -S languagetool

### Bei der Installation von LanguageTool auf anderen Distros müsst ihr
### zuerst abklären, ob bereits Java auf dem Rechner installiert ist.
### Falls das erste Kommando einen Fehler ausgibt, dann spielt ihr über
### das zweite die Laufzeitumgebung ein.
$ java --version
openjdk 11.0.12 2021-07-20
OpenJDK Runtime Environment (build 11.0.12+7-Ubuntu-0ubuntu3)
OpenJDK 64-Bit Server VM (build 11.0.12+7-Ubuntu-0ubuntu3, mixed mode, sharing)
$ sudo apt install default-jre-headless
### Die folgenden Kommandos holen LanguageTool aus dem Netz, extrahieren
### das Archiv und rufen dann die JAR-Datei mit dem Programm auf.
$ wget https://languagetool.org/download/LanguageTool-stable.zip
$ unzip LanguageTool-stable.zip
$ java -jar LanguageTool-5.5/languagetool.jar

Stellt sich nur die Frage: Lohnt sich diese Aktion überhaupt? Ich glaube, dass nur die wenigsten Nutzer werden das Programm als Standalone-Anwendung verwenden werden. Die Installation der eigenständigen Anwendung braucht es daher nur in den allerseltensten Fällen — ich habe sie hier nur der Vollständigkeit halber eingebaut. Wer Texte im Browser schreibt, wird wohl kaum seine Texte per Copy&Paste zwischen der Anwendung und dem Browser hin- und herkopieren. Und für Autoren, die mit zum Beispiel mit LibreOffice arbeiten, gibt es ebenso eine leistungsfähige Erweiterung für das Office-Paket. Von daher: Haltet euch nicht mit der Java-Version von LanguageTool auf und springt gleich zum nächsten Schritt.

LanguageTool gibt es auch als eigenständiges Programm für Linux. Die Solo-Anwendung verarbeitete allerdings nur Texte im TXT-Format.

LanguageTool für LibreOffice

Für die Integration von LanguageTool in LibreOffice benötigt ihr wieder eine Erweiterung. Diese bekommt ihr in Form einer 150 MByte großen OXT-Datei aus dem offiziellen Download-Bereich von LibreOffice. Damit das System die Erweiterung jedoch ausführen kann, benötigt ihr zunächst noch eine Java-Laufzeitumgebung, die in der Regel nicht von Haus aus unter Linux installiert ist. Das nachfolgende Listing demonstriert die Installation für Ubuntu oder Arch Linux und deren Derivate. Unter Arch Linux könnt ihr alternativ gleich die Erweiterung plus deren Abhängigkeiten aus dem AUR installieren. Das spart ein wenig Arbeit und automatisiert die Updates, wenn es mal eine neue Version des LanguageTool-Plugins gibt.

### Installation der Java-Runtime unter Ubuntu, Linux Mint, Debian:
$ sudo apt install libreoffice-java-common

### Installation der Java-Runtime unter Arch Linux oder Manjaro:
$ sudo pacman -S jre-openjdk
### Alternativ die LanguageTool-Erweiterung aus dem AUR einspielen:
$ yay -S libreoffice-extension-languagetool

Damit sollte sich die Erweiterung ohne Fehlermeldungen in LibreOffice installieren lassen. Startet daher den Writer und öffnet aus dem Menü Extras den Extensions-Manager. Dort tippt ihr auf Hinzufügen und wählt über den Dateidialog die aus dem Netz heruntergeladenen Datei LanguageTool-5.5.1.oxt aus — Dieser Schritt ist nur nötig, wenn ihr die Erweiterung von Hand und nicht wie bei Arch Linux oder Manjaro über die Paketverwaltung installiert habt. Nach einem Neustart des Office-Programms sollte die LanguageTool-Rechtschreibung automatisch aktiv sein.

Bevor ihr die Rechtschreibprüfung nutzt, solltet ihr auf jeden Fall mal in die Einstellungen schauen. Tippt dazu auf ein falsch geschriebenes Wort und öffnet den Punkt LanguageTool Optionen. Optional legt das Plugin auch ein eigenes Menü unter Extras an. In den Einstellungen könnt ihr die einzelnen Grammatik- und Stilregeln de-/aktivieren und so nicht nur Fehler im Text finden, sondern auch den Schreibstil verbessern. Falls ihr immer wieder an unterschiedlichen Dokumenten arbeitet, etwa an wissenschaftlichen Papers und persönlichen Briefen, könnt ihr die unterschiedlichen Einstellungen als Profil abspeichern und je nach Bedarf mit wenigen Klicks aktivieren.

Auch für LibreOffice gibt es LanguageTool als Plugin. Die Erweiterung kommt im Vergleich zum Browser-Plugin ohne Internetzugang aus.

Im Vergleich zum Browser-Plugin von LanguageTool für Chrome oder Firefox, benötigt die Integration in LibreOffice keine ständige Internetanbindung. Genauer gesagt: Sie braucht gar keinen Zugang zum Internet. Damit gibt es auch keine Bedenken bezüglich der Gefährdung der Privatsphäre, alle Texte und Daten bleiben auf dem eigenen Rechner. Die Rechtschreibkorrektur innerhalb von LibreOffice funktioniert trotzdem. Optional kann sich aber auch die LibreOffice-Erweiterung an einen LanguageTool-Server im Netz ankoppeln, die entsprechende Konfiguration findet ihr im Optionen-Dialog innerhalb des Reiters Allgemein. Der Weg empfiehl sich, wenn man nicht auf allen Rechnern die umfangreich anfallenden Daten installieren möchte, besonders wenn man noch die zusätzlichen N-gram Datensätze verwenden möchte.

Optional: Die N-Gramm-Datenbank

Die Wikipedia versteht untern dem Begriff N-Gramm das Ergebnis der Zerlegung eines Textes in einzelne Fragmente. Anhand einer großen Datenbank lassen sich mit dieser Technik dann falsch genutzte Wörter wie „viel“ statt „fiel“, „seit“ statt „seid“, „Rad“ statt „Rat“ oder „Stil“ statt „Stiel“ durch die Analyse des Kontextes herausfinden. Herkömmliche Textkorrekturen würden diese Fehler nicht markieren, da die Wörter an sich ja nicht falsch geschrieben sind. LanguageTool geht in der Dokumentation ein wenig ausführlicher auf die Funktionsweise ein, eine Liste aller für Deutsch gesammelten Kombinationen könnt ihr euch im Github-Repository der LanguageTool-Entwickler ansehen.

Diese Datenbank ist nicht in der LanguageTool-Erweiterung für LibreOffice enthalten, unter anderem um den Platzverbrauch nicht unnötig in die Höhe zu treiben. Unter Arch Linux oder Manjaro lässt sie sich aus dem AUR installieren, auf anderen Systemen müsst ihr sie von Hand ins System (im Beispiel nach /usr/local/share/ngrams) kopieren. Aber Achtung: Alleine die Datenbank für Deutsch spült über drei Gigabyte an Daten in das System. Unter Arch integriert die Paketverwaltung die Daten danach automatisch in das LibreOffice-Plugin, auf anderen System kontrolliert ihr unter Extras | LanguageTool | Optionen… | Allgemein | N-Gramme-Verzeichnis die Angabe des Pfads.

### N-Gramm-Daten unter Arch Linux aus dem AUR installieren:
$ yay -S languagetool-ngrams-de

### N-Gramm-Daten von Hand nach /usr/local/share/ngrams laden:
$ wget https://languagetool.org/download/ngram-data/ngrams-de-20150819.zip
$ sudo mkdir /usr/local/share/ngrams
$ sudo unzip ngrams-de-20150819.zip -d /usr/local/share/ngrams
$ rm ngrams-de-20150819.zip
### Die Deutschsprachige N-Gramm-Datenbank benötigt 3 GByte Platz:
$ du -h /usr/local/share/ngrams/de
925M	/usr/local/share/ngrams/de/2grams
91M	/usr/local/share/ngrams/de/1grams
2,1G	/usr/local/share/ngrams/de/3grams
3,1G	/usr/local/share/ngrams/de

Damit sollte LanguageTool bei euch nun im Browser und in LibreOffice funktionieren. Im nächsten Schritt steht die Installation und Konfiguration des LanguageTool-Servers an. Entweder auf dem eigenen Server oder zentral als Dienst im lokalen Netzwerk. Dieser Schritt ist kein Muss, ihr gewinnt nicht an Funktionalität, doch besonders in Kombination mit der Browser-Erweiterung schützt ein eigener LanguageTool-Server die Privatsphäre, da eure Texte nicht mehr in der „Cloud“ korrigiert werden. Der Artikel ist inzwischen online, schaut also auch mal unter LanguageTool als Server installieren rein.

  • Es gibt keine weiteren Artikel
❌