Home Previous Zeitschrift 2002/07 Next Up Index
 
  Inhalt:
 
 
 
Autor

 

Lesbarkeit und Verständlichkeit von Texten
(Teil 2) 

Im ersten Teil ging es um generelle Probleme von Lesbarkeitsformeln. In diesem Teil werden Vorbereitungen beschrieben, die dazu notwendig sind, diese Formeln sachgerecht anzuwenden.

Software für Lesbarkeitsformeln gibt es nicht viel, für die deutsche Sprache fast gar nicht, obwohl es einige Formeln gibt, die für die deutsche Sprache entwickelt wurden:

Amdahls Verständlichkeitsindex:
avi = 180.0-( (dwortzahl/drec) + ( (dsizages/dwortzahl)*58.5) )

Dieser Index gilt für alle Textsorten und ist daher unproblematisch in der Anwendung. Die Resultate liegen zwischen x und y, damit gilt: je höher der Wert, desto verständlicher ist der Text.

Fucks Verständlichkeitsindex:
fucks = avwort*(dgesbytes/dwortzahl)

Dieser Index ist nicht gebräuchlich, ist aber ohne großen Aufwand berechenbar.

Deutscher SMOG-Index von Bamberger: 
gsmog=sqrt(syl3words)-2    

Bamberger hat in seinem Standardwerk zusammen mit Vanecek den SMOG-Index von McLaughin auf die deutsche Sprache angepasst.

Text-Redundanz-Index von Kuntzsch:
tri= (0.449*des) - (2.467*dsaz) - (0.937*dfw) - 14.417

Kuntzsch hat in einer Magisterarbeit an der Universität Mainz diesen Index für Zeitungskommentare entwickelt. Dabei berücksichtigt er Fremdwörter, isbesondere Wörter, die aus dem Griechischen oder Lateinischen stammen.
 
Lesbarkeitsindex von unbekannt: 
li= 224.6814-(79.83*logf( (dgesbytes/dwortzahl)+1) ) - (12.24* (logf (avwort+1))) - 1.20*(dfw/drec)

1. Wiener Sachtextformel:
wstf = (0.1935* (syl3words/dwortzahl)) + (0.1672* avwort) +
         (0.1297 * ( (char6words/dwortzahl)) ) - (0.0327 * (des/drec) )
        
Bamberger und Vanecek haben viele Lesbarkeitsformeln entwickelt, diese ist die bekannteste. Das Ergebnis ist das Lesealter in Jahren.        

Dabei bedeuten:
 

dwortzahl: Anzahl der Wörter im Text
drec: Anzahl der Sätze im Text
dsizages: Anzahl der Silben im Text
avwort:  Wörter pro Satz (Wörter/Sätze)
syl3words: Anzahl der Wörter mit 3 oder mehr Silben
des: Anzahl der einsilben Wörter
dsaz:  Anzahl der Satzzeichen
dfw: Anzahl der Fremdwörter
char6words:  Anzahl der Wörter mit 6 oder mehr Zeichen
sqrt:  Quadratwurzel
logf:  Logarithmus

Diese Formeln stehen exemplarisch für viele andere. Fast in jeder Formel werden Wörter, Sätze und Silben gezählt. Natürlich könnte man alles selbst auszählen, und für kleine Texte dauert das auch nicht besonders lange. Wenn man aber immer wieder Texte, auch umfangreichere hat, ist der Einsatz entsprechender Software sinnvoll.
 
Spezielle Software zum Bestimmen der Lesbarkeit mittels Formeln ist mir nicht bekannt. Eine amerikanische Firma hat zwar ein Programm, aber nur mit Formeln für die englische Sprache.  Für die deutsche Sprache ist es unbrauchbar, weil keine entsprechenden Lesbarkeitsformeln implementiert sind.

Das Unix-Kommando style kennt einige Lesbarkeitsformeln und kann auch mit Dateien umgehen, aber eine Version für Windows ist unbekannt, und es ist nur eine einzige Formel für Deutsch (1. WSTF) eingebaut. Somit kommt auch dieses Programm für den täglichen Einsatz nicht in Frage.

Im Laufe der letzten 20 Jahre habe ich ein Textanalyseprogramm namens TextQuest (die MS-DOS Version heißt Intext) entwickelt, das auch ein Modul Lesbarkeitsanalyse mit den entsprechenden Formeln enthält. Dieses geht davon aus, dass die Datei schon so vorliegt, dass die einzelnen Fälle Sätze sind. Dieses kann man erreichen, indem man mit einem Editor oder einer Textarbeitung sämtliche Punkte (.) in Zeilenenden umwandelt (mit Suchen und Ersetzen). Da aber nicht jeder Punkt ein Satzendezeichen ist, muß die Datei manuell noch einmal durchgesehen werden, damit nicht jeder Abkürzungspunkt als Satzende gezählt wird, denn das würde das Ergebnis einer Lesbarkeitsanalyse verfälschen. Das Ergebnis wird dann als reine Textdatei mit Zeilenenden gespeichert. Das sind eigentlich alle Vorbereitungen, die man treffen muß. Die nächsten Schritte sind die Erzeugung einer Systemdatei, und danach steht einer Lesbarkeitsanalyse nichts mehr im Wege.

Die Datei wird komplett gelesen und die entsprechenden Variablen gezählt. Problematisch kann der Silbenzählalgorithmus sein, denn Silben zu zählen hört sich leicht an: einfach die Vokale zählen, dann ist man damit fertig. Bei diesem Verfahren werden aber viele Wörter zu lang, insbesondere die, die Diphtonge (Vokalkombinationen) enthalten. Zur Validierung des Silbenzählalgorithmus kann eine Protokolldatei angefordert werden, die das Wort und die gezählten Silben enthält. Die Silben selbst werden nicht aufgeführt; das wäre nur bei einem 
Silbentrennungsprogramm sinnvoll. Auch Zahlen werden meist korrekt gezählt, und je nach Textsorte sind zwischen 98 und 100 % aller Wörter die Silben korrekt gezählt.

Bei einigen Lesbarkeitsformeln werden Wortlisten verarbeitet, so bei einigen Formeln von Bamberger und Vanecek und beim TRI von Kuntzsch. Die Fremdwörter (TRI) werden durch Indikatoren wie griechische oder lateinische Vor- und Nachsilben (z.B. anti, ismus) entdeckt, und auch hier gibt es eine Protokolldatei zur Validierung der Ergebnisse. Weiterhin werden sämtliche Werte der Variablen ausgegeben, die für die Berechnung der Formeln wichtig sind. Somit ist eine manuelle Berechnung möglich, ohne selbst zählen zu müssen.

Bei einigen Formeln ist es mit der reinen Formelberechnung aber nicht getan, weil sie Konstanten enthalten oder eine bestimmte 
Stichprobengröße erfordern, z.B. der TRI von Kuntzsch. Bei solchen Formeln müssen die Resultate auf die jeweilige Stichprobengröße normiert werden. TextQuest gibt sowohl die Rohwerte als auch die normierten Werte aus.

Wenn man die Werte der Lesbarkeitsformeln hat, kann man aus diesen Werten erste Schlüsse ziehen. Es wird aber in der Regel erforderlich sein, Vergleichswerte für andere Texte zu haben, und wenn man eigene Texte verständlicher schreiben möchte, Hinweise darauf zu bekommen, wo eventuell Schwächen liegen könnten.
Das Lesbarkeitsanalysemodul von TextQuest gibt daher nicht nur die Werte der Lesbarkeitsformeln und der diesen zugrundeliegenden Variablen aus, sondern schreibt in eine Journaldatei mit, welche Sätze Schwierigkeiten machen. Kriterien dafür sind:

  • die Satzlänge in Wörtern,
  • die Komplexität eines Satzes, festgemacht an der Anzahl der Satzzeichen,
  • die Kompliziertheit eines Satzes, festgemacht an der Anzahl der Klammern,
  • die Länge der Wörter und
  • der Anteil der Fremdwörter.
Für alle Kriterien sind Werte vorgegeben, die aber verändert werden können.

TextQuest bietet in seinem Lesbarkeitsanalysemodul zum einen eine Vielzahl von Lesbarkeitsformeln für diverse Textsorten, zum anderen auch Diagnosefunktionen, um die Verständlichkeit selbst geschriebener Texte zu erhöhen.
 
 

Dr. Harald Klein


zurück zu Teil 1
 

Zum Seitenanfang
 

© ADOLPH Verlag GmbH - Letztes Update 03.05.2004