Von sensiblen Firmenpleiten und sieglosen Begonien
Als ich vor rund 20 Jahren als Student an der Uni damit anfing, für meine Referate und Studienarbeiten einen Computer einzusetzen, da glaubten meine Mitstudenten noch skeptisch spötteln zu können: “Aber schreiben musst Du immer noch selbst?” Dabei hat die gestrige Ausgabe von Business-PC Daily es wieder einmal gezeigt – das Problem beim Einsatz eines Computers und einer Textverarbeitung ist nicht das Schreiben, sondern das Lesen. Das Korrekturlesen, genauer gesagt.Vermutlich sind Sie auch über eine seltsame Formulierung gegen Ende des Editorials der gestrigen Ausgabe gestolpert. Da war plötzlich die Rede von “sensiblen Firmenpleiten”, wo natürlich “sensible Firmendaten” gemeint waren. Doch dergleichen hat Open Office – mit dem ich meine Text schreibe – nicht im Repertoire. Daher hat das Programm beim abschließenden Korrekturdurchgang statt “Firmendaten” den Begriff “Firmenpleiten” angeboten und ich hab dieses Wort in einem unachtsamen Moment einfach übernommen.
In einer früheren Ausgabe von Business-PC Daily habe ich mich über die mitunter abenteuerliche Rechtschreibkorrektur von Word amüsiert – da gebietet schon die einfache Fairness den Hinweis, dass Open Office in diesem Punkt nicht besser ist, sondern ebenfalls mit den seltsamsten Vorschlägen aufzuwarten weiß, die zwischen “amüsant” bis “rätselhaft” liegen.
Natürlich setzen die Programmierer von Open Office andere Korrekturalgorithmen ein als die Microsoft-Mannen, doch das hilft ihnen auch nicht weiter. Einfache Buchstabendreher werden problemlos erkannt und als möglicher Fehler moniert, doch sobald die Rechtschreibkorrektur unbekannte Begriffe analysieren muss, liegt sie zuverlässig daneben. Während Word mit mehr oder weniger Glück versucht, die Schreibweise eines unbekannten Wortes zu erraten und davon ausgehend Korrekturvorschläge auch für die Begriffe anbietet, die das Programm nicht in seiner Datenbank hat, scheint man sich bei Open Office mit einem einfachen Schreibweisenvergleich zu begnügen, der ab dem gemeinsamen Auftauchen von vier aufeinanderfolgenden Buchstaben greift.
Das reicht, wie gesagt, für einfache und typische Tippfehler, versagt aber in praktisch allen anderen Fällen und liefert bestenfalls skurrile Vorschläge.
Für den Firmennamen “Hitachi” schlug mir das System zum Beispiel folgende Begriffe vor: “Rachitis”, “Stachlig”, “Fachidiot” und “Brachial”. Mit “Terabyte” kann es auch nicht viel anfangen und schlägt folgende Korrekturen vor: “Megabyte”, “Gigabyte”, “Presbyter”, “Steuerbyte”, “Datenbyte” und, man staune, “Theaterabend”.
Sobald sich ein Substantiv auch als Zusammensetzung von Substantiv und Verb lesen lässt, wählt Open Office diese Variante und schlägt zum Beispiel für das oben benutzte Wort “Studienarbeiten” die Schreibweise “Studien arbeiten” vor. Statt “aufzuwarten” hätte Open Office lieber ein “auf zuwarten” (was immer das heißen mag), aus der Stadt “San Diego” wird “sieglos” oder “Begonie” und der sprichwörtliche “Katzensprung” wird wahlweise zum “Seitensprung”, zur “Datensprungweite” oder zu “Angesprungenes”. Bei fast allen Vorschlägen ist erkennbar, wie der Algorithmus funktioniert und auch da, wo es das Programm auf rätselhafte Weise aus der Kurve zu tragen scheint, offenbart ein etwas genauerer Blick, dass die sich Fähigkeiten zur Wortanalyse offensichtlich im Auffinden von gleichen Buchstabenfolgen erschöpfen (die Open Office übrigens gerade in “Buchstaben folgen” korrigieren wollte).
So ist der Vorschlag, für “Terabyte” lieber “Presbyter” oder “Theaterabend” zu benutzen leicht dadurch zu erklären, dass in dem einen Fall die Buchstabenfolge “byte”, in dem anderen “erab” als gemeinsamer Wortbestandteil auftaucht. Für den Vornamen “Lawrence” bietet Open Office “Trenchcoat” an und auch dieser Korrekturvorschlag verdankt sich dem gemeinsamen Auftauchen einer Buchstaben-Viererkette, in diesem Fall: “renc”.
Kurz: Auch bei Open Office ist die Rechtschreibkorrektur nur eine Hilfestellung des Programms, die einem bei der mühseligen Arbeit des Korrigierens ein wenig unter die Arme greifen kann. Ansonsten gilt nach wie vor: Lesen muss man immer noch selbst.
