Frag ein Sprachmodell: Wie viele R hat das englische Wort „Strawberry"?
Die häufigste Antwort: zwei. Die richtige: drei.
Der Grund ist simpel und gleichzeitig irritierend: Sprachmodelle verarbeiten keine Buchstaben. Sie verarbeiten Bruchstücke — Silben, Wortteile, manchmal ganze Wörter am Stück. Das einzelne Zeichen ist für sie unsichtbar, solange niemand sie zwingt hinzuschauen.
Im Deutschen funktioniert das genauso. „Erdbeere" hat zwei E am Anfang und eins am Ende — aber frag mal eine KI, wie viele es insgesamt sind. Die Chancen stehen gut, dass die Antwort falsch ist.
Buchstaben zählen: eine Aufgabe für Erstklässler. Und ein ungelöstes Problem für Sprachmodelle.
— Franz