Was sind die drei Gütekriterien?

Die drei klassischen Gütekriterien der quantitativen Forschung sind Objektivität, Reliabilität und Validität. Objektivität bedeutet, dass das Ergebnis unabhängig von der durchführenden Person ist. Reliabilität steht für die Zuverlässigkeit, also dass eine Wiederholung der Messung zum gleichen Ergebnis führt. Validität bedeutet, dass tatsächlich das gemessen wird, was gemessen werden soll.

Was ist der Unterschied zwischen Reliabilität und Validität?

Reliabilität fragt, ob eine Messung zuverlässig und wiederholbar ist – ob also bei einer Wiederholung dasselbe herauskommt. Validität fragt, ob die Messung das Richtige erfasst. Eine Messung kann reliabel sein, ohne valide zu sein: Sie liefert dann stabile Werte, misst aber das falsche Merkmal. Umgekehrt gilt: Ohne Reliabilität ist keine volle Validität möglich.

In welcher Reihenfolge bauen die Gütekriterien aufeinander auf?

Objektivität ist die Voraussetzung für Reliabilität, und Reliabilität ist die Voraussetzung für Validität. Wenn das Ergebnis schon von der durchführenden Person abhängt, kann es nicht stabil sein. Und was nicht zuverlässig misst, kann auch nicht zuverlässig das Richtige messen. Die Reihenfolge ist deshalb kein Zufall.

Wie kann ich die Gütekriterien in meiner Umfrage verbessern?

Zeige allen Teilnehmenden denselben Fragetext in gleicher Reihenfolge (Objektivität), formuliere die Fragen klar und eindeutig und mache vorab einen Pretest (Reliabilität) und decke das Thema in seiner ganzen Breite ab, statt nur einen Teilaspekt zu messen (Validität). Schon kleine Anpassungen bei der Gestaltung wirken sich deutlich aus.

Gelten Objektivität, Reliabilität und Validität auch in der qualitativen Forschung?

Die drei klassischen Kriterien stammen aus der quantitativen Forschung mit standardisierten Erhebungen. In der qualitativen Forschung passen sie nur eingeschränkt, weshalb dort teils eigene Gütekriterien genutzt werden, etwa die Nachvollziehbarkeit oder die Transparenz des Vorgehens. Die Grundidee bleibt gleich: Die Qualität der Erkenntnisse soll überprüfbar sein.

Objektivität, Validität, Reliabilität - Gütekriterien einfach erklärt

Aktualisiert am

22.05.2026

Autor:

Marco

Lesezeit:

7 Min.

Wenn du eine Umfrage oder einen Fragebogen erstellst, willst du am Ende Ergebnisse, auf die du dich verlassen kannst. Genau hier kommen die drei Gütekriterien Objektivität, Validität und Reliabilität ins Spiel. Sie sind sozusagen der Qualitäts-TÜV für jede Messung – egal ob du eine Studie für deine Bachelorarbeit schreibst, eine Kundenbefragung auswertest oder die Stimmung im Team einfangen willst.

Klingt erst mal nach trockener Theorie aus dem Statistik-Seminar. Ist es aber nicht. Hinter den drei Begriffen stecken sehr praktische Fragen: Bekomme ich das gleiche Ergebnis, egal wer die Auswertung macht? Misst mein Fragebogen wirklich das, was ich messen will? Und käme bei einer Wiederholung ungefähr dasselbe heraus? Wir zeigen dir, was Objektivität, Validität und Reliabilität genau bedeuten, wie sie zusammenhängen und woran du in deiner eigenen Umfrage erkennst, ob deine Daten etwas taugen – mit einfachen Beispielen und ohne Formel-Wust.

Unser Tipp: empirio.ai - Kostenlos mit KI Umfragen erstellen 🚀

Hier erstellst du kostenlos eine moderne Online-Umfrage. Mit den vielen KI-Funktionen klappt das Erstellen, Bearbeiten und Auswerten der Umfrage im Handumdrehen. Und alle Daten werden sicher in der EU gespeichert.

Jetzt kostenlos Umfrage erstellen

Inhalte in diesem Artikel:

Was sind Gütekriterien? Definition und Überblick
Objektivität: Unabhängig von der durchführenden Person
Reliabilität: Wie zuverlässig und stabil ist die Messung?
Validität: Misst du wirklich, was du messen willst?
Wie die drei Gütekriterien zusammenhängen
Gütekriterien in der eigenen Umfrage verbessern: Checkliste

Was sind Gütekriterien? Definition und Überblick

Gütekriterien sind Maßstäbe, mit denen sich die Qualität einer wissenschaftlichen Messung beurteilen lässt. Sie beantworten die Frage: Wie gut misst mein Instrument – also mein Fragebogen, mein Test oder meine Befragung – eigentlich das, was es messen soll?

In der empirischen Forschung haben sich drei Hauptgütekriterien etabliert: Objektivität, Reliabilität und Validität. Sie bauen logisch aufeinander auf und bilden zusammen das Fundament für vertrauenswürdige Daten.

Der Grundgedanke dahinter ist einfach: Eine Messung soll unabhängig von der Person sein, die sie durchführt (Objektivität). Sie soll zuverlässig und stabil sein (Reliabilität). Und sie soll tatsächlich das Richtige erfassen (Validität). Erst wenn alle drei erfüllt sind, kannst du dich auf deine Ergebnisse stützen.

Ein Bild, das hilft:
Stell dir eine Küchenwaage vor. Objektiv ist sie, wenn sie dasselbe Gewicht anzeigt, egal wer draufschaut. Reliabel ist sie, wenn sie bei derselben Packung Mehl immer wieder denselben Wert zeigt. Und valide ist sie nur dann, wenn sie wirklich das Gewicht misst – und nicht versehentlich die Temperatur.

Wichtig zu wissen: Die Reihenfolge ist kein Zufall. Objektivität ist die Voraussetzung für Reliabilität, und Reliabilität wiederum ist die Voraussetzung für Validität. Ohne das erste Kriterium kann das nächste nicht voll erfüllt sein. Genau diese Logik schauen wir uns jetzt Schritt für Schritt an.

Übrigens: Diese drei klassischen Kriterien stammen aus der quantitativen Forschung mit standardisierten Erhebungen. In der qualitativen Forschung gelten teils andere Maßstäbe – wenn du dazu mehr wissen willst, findest du die Details in unserem Beitrag zu den Gütekriterien qualitativer Forschung.

Objektivität: Unabhängig von der durchführenden Person

Objektivität bedeutet, dass die Ergebnisse einer Messung nicht davon abhängen, wer sie durchführt, auswertet oder interpretiert. Anders gesagt: Verschiedene Personen sollten beim selben Vorgehen zum selben Ergebnis kommen.

Die Objektivität wird üblicherweise in drei Phasen unterteilt:

Durchführungsobjektivität: Das Ergebnis ist unabhängig davon, wer die Befragung leitet. Erreichst du zum Beispiel, indem alle Teilnehmenden dieselben Fragen in gleicher Reihenfolge und ohne mündliche Erklärungen bekommen.
Auswertungsobjektivität: Egal wer die Antworten auswertet, es kommt dasselbe heraus. Bei Multiple-Choice-Fragen ist das fast automatisch der Fall, bei offenen Antworten brauchst du klare Auswertungsregeln.
Interpretationsobjektivität: Die Schlussfolgerungen aus den Daten fallen bei verschiedenen Personen gleich aus. Hier helfen festgelegte Vergleichswerte oder Auswertungsschemata.

Praxisbeispiel:
Du fragst in einer Mitarbeiterbefragung „Wie zufrieden bist du mit deinem Arbeitsplatz?“ mit einer Skala von 1 bis 5. Diese Frage ist gut objektiv auswertbar – eine 4 bleibt eine 4, egal wer die Tabelle anschaut. Würdest du stattdessen fragen „Erzähl mal, wie es dir bei der Arbeit geht“, müsstest du die freien Texte interpretieren, und schon schleicht sich Spielraum ein.

Typischer Fehler:
Mündliche Zusatzhinweise an einzelne Teilnehmende. Sobald du einer Person die Frage erklärst und einer anderen nicht, ist die Durchführungsobjektivität dahin. Online-Umfragen haben hier einen klaren Vorteil: Alle sehen exakt denselben Wortlaut.

Ein starker Hebel für mehr Objektivität ist die Standardisierung. Je stärker dein Fragebogen standardisiert ist, desto weniger Einfluss hat die durchführende Person. Wie das konkret funktioniert, erklären wir im Detail beim standardisierten Fragebogen.

Reliabilität: Wie zuverlässig und stabil ist die Messung?

Reliabilität beschreibt die Zuverlässigkeit einer Messung. Eine Messung ist reliabel, wenn sie unter gleichen Bedingungen wiederholbar zum gleichen Ergebnis führt. Misst du zweimal dasselbe, sollte ungefähr dasselbe herauskommen – vorausgesetzt, das, was du misst, hat sich nicht verändert.

Der Unterschied zur Objektivität: Objektivität fragt „Spielt die Person eine Rolle?“, Reliabilität fragt „Ist das Ergebnis stabil und frei von zufälligen Schwankungen?“

In der Forschung gibt es mehrere Wege, Reliabilität zu prüfen:

Wiederholungs-Reliabilität (Retest): Dieselbe Messung wird zu zwei Zeitpunkten durchgeführt und verglichen.
Paralleltest-Reliabilität: Zwei gleichwertige Versionen eines Fragebogens liefern vergleichbare Ergebnisse.
Interne Konsistenz: Fragen, die dasselbe Konstrukt messen sollen, hängen sinnvoll zusammen.

Praxisbeispiel:
Bleiben wir bei der Mitarbeiterzufriedenheit. Wenn dieselbe Person den Fragebogen heute und nächste Woche ausfüllt und sich an ihrer Situation nichts geändert hat, sollten die Antworten ähnlich ausfallen. Springt der Wert ohne erkennbaren Grund von 2 auf 5, deutet das auf ein Reliabilitätsproblem hin – zum Beispiel auf eine missverständliche Frage.

Typische Reliabilitäts-Killer:

Mehrdeutige oder unklare Formulierungen, die mal so und mal anders verstanden werden
Doppelte Verneinungen, über die Teilnehmende stolpern
Suggestivfragen, die die Antwort in eine Richtung schieben
Zu lange Fragebögen, bei denen die Konzentration nachlässt

Ein praktisches Mittel, um die Reliabilität schon vor dem Start zu verbessern, ist ein Pretest. Dabei testest du deinen Fragebogen an wenigen Personen und findest Stolperstellen, bevor sie die echten Daten verfälschen. Wie du so einen Test sinnvoll aufsetzt, zeigen wir dir beim Pretest für Fragebogen. Wer den Begriff komplett durchdringen möchte, findet alle Details im Artikel zur Reliabilität.

Validität: Misst du wirklich, was du messen willst?

Validität ist das wichtigste der drei Gütekriterien – und gleichzeitig das anspruchsvollste. Eine Messung ist valide (gültig), wenn sie tatsächlich das misst, was sie messen soll. Nicht etwas Ähnliches, nicht etwas Verwandtes, sondern genau das gemeinte Merkmal.

Das klingt selbstverständlich, ist es aber nicht. Du kannst einen Fragebogen haben, der objektiv und reliabel ist und trotzdem am Thema vorbeimisst.

Praxisbeispiel:
Du willst die Kundenzufriedenheit messen, fragst aber fast nur danach, wie schnell die Lieferung war. Deine Skala ist objektiv auswertbar und liefert stabile Werte – sie ist also objektiv und reliabel. Trotzdem misst du nicht die gesamte Zufriedenheit, sondern nur einen kleinen Ausschnitt davon. Die Messung ist nicht valide.

In der Methodenlehre werden mehrere Validitätsarten unterschieden. Drei davon begegnen dir am häufigsten:

Inhaltsvalidität: Decken deine Fragen das Thema in seiner Breite ab? Eine Zufriedenheitsbefragung sollte mehrere Facetten abfragen, nicht nur eine.
Kriteriumsvalidität: Stimmen deine Ergebnisse mit einem unabhängigen Außenkriterium überein? Sagt dein Test zum Beispiel etwas vorher, das sich später bestätigt?
Konstruktvalidität: Misst dein Instrument das theoretische Konstrukt dahinter (etwa „Motivation“ oder „Zufriedenheit“) sauber ab und grenzt es von anderen ab?

Typischer Fehler:
Vom Messergebnis auf etwas zu schließen, das gar nicht erhoben wurde. Ein hoher Wert bei „Weiterempfehlungsbereitschaft“ sagt etwas über die Loyalität aus – aber nicht automatisch über jeden Aspekt der Zufriedenheit. Sauber bleibt, wer nur das interpretiert, was die Fragen wirklich abdecken.

Validität entsteht zu einem großen Teil schon bei der Konzeption: bei der Auswahl und Formulierung der Fragen. Genau deshalb lohnt es sich, von Anfang an sorgfältig vorzugehen. Praktische Hilfe dazu findest du in unserem Leitfaden zum Fragebogen erstellen, und die ausführliche Begriffserklärung gibt es im Artikel zur Validität.

Wie die drei Gütekriterien zusammenhängen

Objektivität, Reliabilität und Validität sind keine gleichberechtigten Nachbarn, sondern bauen aufeinander auf. Diese Reihenfolge ist der Schlüssel, um die Kriterien wirklich zu verstehen.

Die Aufbau-Logik in einem Satz:
Objektivität ist die Voraussetzung für Reliabilität, und Reliabilität ist die Voraussetzung für Validität.

Warum? Wenn das Ergebnis schon davon abhängt, wer die Messung durchführt (keine Objektivität), kann es kaum stabil und wiederholbar sein (keine Reliabilität). Und was nicht zuverlässig misst, kann auch nicht zuverlässig das Richtige messen (keine Validität).

Umgekehrt gilt diese Kette aber nicht. Eine Messung kann objektiv und reliabel sein, ohne valide zu sein – das Lieferzeit-Beispiel aus dem vorigen Kapitel zeigt genau das. Stabile, eindeutige Werte sind also kein Beweis dafür, dass du das Richtige misst.

Das klassische Dartscheiben-Bild:

Reliabel, aber nicht valide: Alle Pfeile landen dicht beieinander – aber nicht im Zentrum. Die Messung ist stabil, trifft aber das falsche Ziel.
Valide, aber nicht reliabel: Die Pfeile streuen rund um die Mitte. Im Durchschnitt stimmt es, aber die einzelnen Treffer schwanken stark.
Reliabel und valide: Alle Pfeile sitzen eng im Zentrum. Das ist das Ziel.

Ein objektiver, zuverlässiger Fragebogen, der am Thema vorbeimisst, liefert dir präzise – aber wertlose – Zahlen.

Für deine eigene Umfrage heißt das: Kümmere dich zuerst um klare, standardisierte Bedingungen (Objektivität), dann um eindeutige, verständliche Fragen (Reliabilität) und prüfe schließlich, ob deine Fragen das Thema wirklich vollständig abdecken (Validität).

Ein Hinweis zur Abgrenzung: Die Gütekriterien sagen etwas über die Qualität deiner Messung aus – nicht darüber, ob deine Ergebnisse auf eine größere Gruppe übertragbar sind. Das ist eine eigene Frage, nämlich die der Repräsentativität. Wann eine Umfrage repräsentativ ist, erklären wir separat.

Gütekriterien in der eigenen Umfrage verbessern: Checkliste

Du musst kein Statistik-Profi sein, um in deiner Umfrage solide Werte zu erreichen. Die meisten Probleme entstehen bei der Gestaltung – und genau da kannst du am einfachsten gegensteuern. Hier eine praktische Checkliste, geordnet nach den drei Kriterien.

Für mehr Objektivität:

Allen Teilnehmenden exakt denselben Fragetext und dieselbe Reihenfolge zeigen
Auf mündliche Zusatzerklärungen verzichten – die Frage muss für sich allein verständlich sein
Klare Auswertungsregeln festlegen, besonders bei offenen Antworten
Wo möglich, geschlossene Fragen mit eindeutigen Antwortoptionen nutzen

Für mehr Reliabilität:

Fragen einfach, kurz und eindeutig formulieren
Doppelte Verneinungen und Suggestivfragen vermeiden
Den Fragebogen nicht überladen – Konzentration lässt mit der Länge nach
Vor dem Start einen Pretest mit ein paar Personen machen

Für mehr Validität:

Vorab überlegen: Was genau will ich eigentlich messen?
Das Thema in seiner Breite abdecken, nicht nur einen bequemen Teilaspekt
Nur das interpretieren, was die Fragen tatsächlich erfassen
Im Zweifel eine zweite Person über den Fragebogen schauen lassen

Ein durchgehendes Beispiel:
Angenommen, du befragst Kundinnen und Kunden zur Zufriedenheit. Du gibst allen denselben Online-Fragebogen mit identischem Wortlaut (Objektivität), formulierst jede Frage klar und testest sie vorab an fünf Personen (Reliabilität) und deckst mehrere Bereiche ab – Produkt, Service, Preis, Lieferung – statt nur die Lieferzeit (Validität). Damit hast du an allen drei Stellschrauben gedreht und bekommst Daten, auf die du dich stützen kannst.

Wenn du nicht bei null anfangen möchtest: In unserer Vorlagen-Sammlung findest du fertige Fragebögen für viele Anlässe, die du direkt anpassen kannst – ein guter Startpunkt, um die hier genannten Punkte gleich richtig umzusetzen.

Autor des Artikels

Marco

Marco ist Teil unseres Experten-Teams. Seit 2018 führt er erfolgreich Umfragen in Unternehmen durch und teilt seine Erfahrungen hier bei Online-Umfrage.org.