Dieser Text wurde von Hans Brügelmann verfasst. Die DGLS veröffentlicht den Text mit freundlicher Genehmigung von Herrn Brügelmann unter Hinweis auf den ursprünglichen Link. Es handelt sich um eine Stellungnahme zu folgender Veröffentlichung:
Kuhl, T. (2020): Rechtschreibung in der Grundschule. Eine empirische Untersuchung der Auswirkungen verschiedener Unterrichtsmethoden. Springer: Wiesbaden.
Kurzfassung (Stand: 8.5.2020)
Bei der Publikation handelt sich um eine Dissertation, die als Qualifikationsleistung zwar anders zu bewerten ist als die Studie eines Forschungsinstituts, aber da die Untersuchung von der Betreuerin schon vorweg als „Bonner Studie“für die öffentliche Diskussion instrumentalisiert wurde, ist eine intensivere Auseinandersetzung mit ihrer begrenzten Aussagekraft notwendig. Die erst jetzt vorgelegte ausführliche Darstellung bestätigt die im Herbst 2018 vorgetragenen Vorbehalte gegenüber dem forschungsmethodischen Status der Ergebnisse. Damit bleiben die Einschränkungen der Aussagekraft der Studie und des Geltungsanspruchs der Folgerungen, die von der Betreuerin in ihren Vorveröffentlichungen gezogen wurden, bestehen. Das zentrale Problem der Studie ist die Unklarheit des Gegenstandes: Schon konzeptuell werden die verglichenen Ansätze nicht sauber definiert und unterschiedlich gruppiert. Darüber hinaus bleiben der Unterricht selbst, dem die Ergebnisse zugerechnet wer-den sollen, und sein Umfeld eine „black box“. Im Einzelnen beeinträchtigen die folgenden Schwächen die Aussagekraft der Studie – teils schon für die Bonner Stichprobe selbst, vor allem aber für eine Verallgemeinerung der Daten:
1. Auf der konzeptionellen Ebene unterscheidet der Autor fünf Ansätze: traditionelle und moderne Fibel, „Lesen durch Schreiben“, Spracherfahrungsansatz und Rechtschreibwerkstatt. In der empirischen Untersuchungverglichen werden drei Ansätze: Fibel (wobei die beiden verschiedenen Lehrgänge nicht unterschieden werden), „Lesen durch Schreiben“ und Rechtschreibwerkstatt. Die Folgerungen kontrastieren verallgemeinernd nur noch zwei Ansätze: „Fibel-Didaktik“ und „offene Methoden“. Nicht deckungsgleich ist deshalb das Verhältnis zwischen dem, was analysiert, dem, was konkret untersucht wurde, und dem, was in den zu oft verallgemeinernden Folgerungen bewertet wurde, z. B. Fibelunterricht als „direkte Instruktion“, „Lesen durch Schreiben“ und Rechtschreibwerkstatt als „selbstgesteuertes Lernen“.
2. Die Darstellung der Ansätze folgt bereits auf der Konzept-Ebene unterschiedlichen Logiken: Während bei den Fibel-Lehrgängen zwischen traditionellen und modernen Ansätzen unterschieden wird, stammt die letzte zu „Lesen durch Schreiben“ zitierte Publikation aus dem Jahr 2001, die Weiterentwicklung dieses Ansatzes in den letzten 20 Jahren wird nicht berücksichtigt. Bei den fibellosen Ansätzen wird zu Recht zwischen „Lesen durch Schreiben“, Rechtschreibwerkstatt und Spracherfahrungsansatz unterschieden (wobei letzterer allerdings nicht in die empirische Untersuchung eingeht), während die Tobi-Fibel und die Bausteine-Fibel trotz ihrer konzeptionellen Unterschiede als einAnsatz zusammengefasst und gemeinsam bewertet werden. Zudem werden die Urteile noch darüber hinaus verallgemeinert, als ob mit der Studie eine Bewertung „der“ Fibellehrgänge insgesamt möglich wäre, obwohl diese ein didaktisch und methodisch ähnlich breites Spektrum an Varianten umfassen wie die sog. „offenen“ Ansätze.
3. Da der Unterricht nicht beobachtet wurde, die Lehrer*innen auch nicht ersatzweise zu ihrem konkreten Vorgehen befragt worden sind, ist anhand der Daten nicht nachvollziehbar, wie weit sich die Ansätze, die auf der Konzept-Ebene einander gegenübergestellt wurden, und der Unterricht tatsächlich decken, so dass die erhobenen Effekte einer „black box“ zugerechnet werden müssen. Das gilt schon für den Anfangsunterricht, aber erst recht für den Rechtschreibunterricht in den Jahren danach. Über ihn wurden nicht einmal auf der Konzept-Ebene Informationen erhoben, die nötig wären, um tragfähige Aussagen über die Ursachen von Effekten machen zu können.
4. Bei den verglichenen Kindern handelt es sich weder um Zufalls- noch um gezielt (nach inhaltlichen Kriterien) ausgewählte Stichproben. Ihre soziale Zusammensetzung ist unklar und die Vergleichbarkeit der Lernvoraussetzungenund der Lernbedingungender Kinder für die verschiedenen Ansätze nicht zureichend gesichert. Vor allem im Längsschnitt hätte der Sozialstatus als Ko-Variate einbezogen werden müssen, wenn die Kinder schon nicht über die Ansätze hinweg parallelisiert werden konnten. Das wäre in einer Stadt wie Bonn besonders wichtig gewesen, wo die (in die Studie einbezogene) andere Muttersprache sowohl mit einem akademischen als auch mit einem schulfernen Milieu assoziiert sein kann, also nicht für eine bestimmte soziale Herkunft steht.
5. Die Auswertung der Daten ist unvollständig. Schon Tabellen zur Größe der verschiedenen Stichproben fehlen, die man sich – soweit überhaupt möglich – selbst zusammenstellen muss. Außerdem fehlen für die verschiedenen Teilstudien Übersichten über Grunddaten der einzelnen Ansätze wie Muttersprache, Geschlecht, Sozialstatus. Für die Rechtschreibleistung im Längsschnitt, aber auch für die Lese- und Schreibbefragung sind die Rohdaten nicht ausgewiesen. Inhaltlich fehlt eine Auswertung auf Klassen- statt nur auf Schüler*innen-Ebene. So kann der Einfluss des Faktors Lehrer*in nicht eingeschätzt werden, der nach anderen Studien oft zu einer großen Streuung der Effekte innerhalb der Ansätze führt. Auch kann nicht nach Bedingungen für erfolgreichen Unterricht mit „Lesen durch Schreiben“ bzw. der Rechtschreibwerkstatt und Gründen für schwächere Leistungen von einzelnen Fibel-Klassen gesucht werden.
6. Die Ergebnisse werden nur intern verglichen, nicht aber auf die Normen der Hamburger Schreibprobe bezogen. Nach diesem bundesweit repräsentativen Maßstab entsprechen „Lesen durch Schreiben“-Kinder in Kuhls Studie schon zum Ende des Anfangsunterrichts und über die Grundschulzeit hinweg der bundesdeutschen Norm. Sogar der Anteil besonders leistungsschwacher Schüler*innen ist niedrigerals in der Bonner Gesamtstichprobe – besonders auffällig in Klasse 1 und 2. Die „Ausreißer“ bilden die (zusammengefassten) Fibel-Klassen (nach oben) und die Rechtschreibwerkstatt-Klassen (nach unten). Insofern wäre zu fragen, welche besonderen Bedingungen in diesen beiden Fällen zu den erwartungswidrigen Ergebnissen geführt haben (spezifische Stärken/ Schwächen der eingesetzten Methoden; Zusammensetzung der Schülerschaft; Engagement/ Kompetenz der Lehrer*innen).
7. Für die Bewertung der Leistungen bleibt die Wahl des Maßstabs (richtige Grapheme) begründungsbedürftig. So wurden die unterschiedlichen Ansprüche an das Schreibniveau Ende Klasse 1/2 (alphabetische Strategie) und die Entfaltung dieser Basiskompetenz durch orthographische und morphematische Strategien (Klasse 2-4) bei der Auswertung nicht berücksichtigt.
8. Die äußerst knappe Darstellung des Forschungsstands in Kap. 1.10 beschränkt sich auf deutschsprachige Studien und dabei zusätzlich auf vergleichende Evaluationen. In der lediglich tabellarischen Übersicht werden sie zudem unvollständig und durch fehlende Kommentierung zum Teil unzutreffend vorgestellt. Bei der Einordnung der Ergebnisse wurden der deutschsprachige und der internationale Forschungsstand nur einseitig berücksichtigt. Weder die Grundlagenforschung zum Schriftspracherwerb noch neuere Experimentalstudien werden diskutiert, die die Bedeutung des lautorientierten Schreibens in der Anfangsphase für die spätere Rechtschreibentwicklung belegen.
9. Zum Schluss: Wer sich ein Bild von den Stärken und Schwächen der in dieser Studie untersuchten Ansätze machen will, sollte den Hinweis des Autors ernst nehmen, dass die Rechtschreibleistung in einem Wörter- und Satz-Diktat nur ein Teil-Aspekt schulischer Ziele ist; die inhaltliche, sprachliche und orthographische Qualität freier Texte, die Entwicklung der Lesefähigkeit, aber auch übergreifendeKompetenzen wie die Förderung der Selbstständigkeit der Schüler*innen wurden in der Studie (bewusst) nicht erfasst.
Es bleibt festzuhalten: Die Anforderungen an eine Dissertationsstudie, deren Logistik bei Kuhl durchaus ein beachtliches Niveau erreicht hat, sind andere als an besser ausgestattete Untersuchungen, die mit Hilfe von Drittmitteln durchgeführt werden können. Aber entsprechend vorsichtig hätten die Folgerungen aus den unter diesen eingeschränkten Bedingungen gewonnenen Daten sein müssen. Eine empirische Grundlage für das teilweise in den Medien geforderte und von einigen Ministerien auch umgesetzte Verbot von „Lesen durch Schreiben“ oder generell eines lautorientierten Schreibens im Anfangsunterricht liefert auch diese Untersuchung nicht. Vielmehr stellt sich die Frage, warum in dieser Studie zwei Methoden, die beide mit dem lautorientierten Schreiben beginnen, so unterschiedlich abgeschnitten haben. Diese unterschiedlichen Ergebnisse machen noch einmal deutlich, dass es nicht um das OB geht, sondern auf das WIE ankommt, das leider in dieser Studie nicht untersucht wurde.
Christoph Jantzen
Gibt es eigentlich Mitgliederinnen? Geschlechtersensitive Sprache
Hanna Sauerborn
Frage des Monats: Leseflüssigkeit fördern
Erika Altenburg
Frage des Monats: Leseflüssigkeit fördern
Sabine Birck
Frage des Monats: Leseflüssigkeit fördern
Hans Brügelmann
Frage des Monats: Leseflüssigkeit fördern