Gütekriterien für die Leistungsbeurteilung
Um Schülerleistungen fair zu bewerten, müssen sie zuvor gemessen werden. Zentrale Gütekriterien verringern die Gefahr, bei der Beurteilung von Leistungen ungenaue Maßstäbe anzulegen.

Die Bewertung von Schülerleistungen stellt ein zentrales Aufgabenfeld der Lehrkräfte dar. Manche Kollegen vertreten jedoch die These, dass Noten niemals objektiv sein können. Der ein oder andere Schüler weiß sicherlich auch zu berichten, dass es bei manchen Kollegen scheinbar einfacher ist, eine gute Note zu erhalten, während es bei anderen nur defizitäre Noten gibt.
Wenn Leistungen beurteilt werden sollen, so müssen diese zuvor gemessen werden. Um jedoch von einer angemessenen Beurteilung sprechen zu können, müssen somit Gütekriterien der Leistungsmessung Verwendung finden. Die Fachliteratur nennt hierbei i. d. R. die Kriterien der Objektivität, Reliabilität und Validität.
Kriterien: Objektivität, Reliabilität und Validität
Von einer objektiven Beurteilung kann dann gesprochen werden, wenn das Testergebnis unabhängig vom Beurteiler ausfällt. Ziel muss es somit sein, dass unterschiedliche Beurteiler immer zu demselben Ergebnis der Leistungsbeurteilung gelangen. Hierbei wird deutlich, dass gebundene Aufgabenformate, wie beispielsweise Multiple-Choice-Fragen, oder die Korrektur eines Diktates das Kriterium der Objektivität relativ einfach erfüllen, während der Ermessensspielraum bei frei formulierten Antworten größer ist. Erwartungshorizonte und klar formulierte Kriterien der Beurteilung können hier unterstützend wirken.
Das Kriterium der Reliabilität (Zuverlässigkeit) fragt nach der Testgenauigkeit. Je mehr voneinander unabhängige Einzelaufgaben zu einem Lernziel gestellt werden, desto zuverlässiger ist auch das erzielte Testergebnis. Wenn ein Deutschlehrer beispielweise die korrekte Unterscheidung zwischen „das“ und „dass“ überprüfen möchte, bietet sich eher ein Lückentext an, in dem jede der beiden Formen mehrmals eingesetzt werden muss. Ein Diktat, bei dem jede Form nur ein- oder zweimal vorkommt, würde hingegen nur eingeschränkt aussagefähig für das zu überprüfende Merkmal sein. Ähnliches kennen wir aus dem Mathematikunterricht, bei dem oft Folgeaufgaben gestellt werden. Der Schüler, der die ersten Aufgaben nicht oder nicht korrekt lösen kann, kann seine Fähigkeiten bei Folgeaufgaben oft ebenfalls nicht nachweisen, auch wenn er diese u. U. korrekt lösen könnte, hätte er nicht zuvor die falschen Ergebnisse erzielt.
Die Validität (Gültigkeit) ist dann gegeben, wenn auch wirklich das gemessen wird, was gemessen werden soll. Oft ist gerade der Zeitfaktor hier ein großes Problem: Ein Schüler mit geringerer Schreibgeschwindigkeit kann die Deutscharbeit möglicherweise nur deshalb nicht vollständig — und somit „richtig“ — bearbeiten, weil er die Aufgaben in der vorgegebenen Zeit nicht geschafft hat. Wenn aber nicht die Schreibgeschwindigkeit, sondern eine bestimmte fachliche Kompetenz überprüft werden soll, wäre dieser Test in diesem Fall nicht valide; der Schüler wird voraussichtlich nur mit einer mittleren Note bewertet, obwohl er die Kompetenzen erfolgreich erworben hat.
In diesem Sinne muss auch ein klarer Abgleich zwischen unterrichtlicher Realität und Testverfahren vorherrschen. Wenn der Geschichtsunterricht vor allem auf das Verstehen der fachlichen Zusammenhänge ausgerichtet war, kann ein anschließender Test nicht vordergründig auf historische Einzelfakten ausgerichtet sein. „Es muss ein enger Zusammenhang zwischen dem konkreten Unterricht und seiner Überprüfung bestehen, der auch für die Schüler klar erkennbar ist. Nur dann ist die Überprüfung fair und nur dann kann sie zu validen Ergebnissen führen!“, schreibt Wengert (Wengert, Hans Gert: Leistungsbeurteilung in der Schule. In: Bovet, Gislinde/ Huwendiek, Volker (Hrsg.): Leitfaden Schulpraxis – Pädagogik und Psychologie für den Lehrberuf, 5. überarbeitete und erweiterte Auflage. Berlin 2008, S. 324-349,hier S. 332.)
Fazit: Sicherlich kann man einwenden, dass Bewertungen auch immer situativen oder persönlichen Einflüssen unterliegen. Eine Bewusstmachung zentraler Gütekriterien der Leistungsmessung kann hier jedoch hilfreich sein und mögliche Messfehler schon im Vorfeld verringern.
Mehr zu Ratgeber Unterricht