Ratgeber >
Gütekriterien: Definition & Beispiele

Gütekriterien: Definition & Beispiele

Aktualisiert am 
29.05.2026
Autor: 
Marco
Lesezeit: 
9 Minuten

Du willst eine Umfrage machen und fragst dich, ob deine Ergebnisse später wirklich aussagekräftig sind? Genau dafür gibt es die Gütekriterien. Sie sind der Qualitätscheck für jeden Fragebogen, jede Studie und jedes Messinstrument. Wenn deine Umfrage Objektivität, Reliabilität und Validität erfüllt, kannst du dich auf deine Daten verlassen. Wenn nicht, hilft dir auch die schönste Auswertung nicht weiter.

Wir zeigen dir, was die Gütekriterien genau bedeuten, wie du sie an konkreten Beispielen erkennst und wie du sie für deine eigene Online-Umfrage sicherstellst. Du bekommst klare Definitionen, praxisnahe Beispiele und typische Fehler, die du vermeiden solltest. Egal, ob du für die Uni forschst, eine Mitarbeiterbefragung planst oder Kundenfeedback einholst – am Ende weißt du, ob dein Fragebogen wissenschaftlichen Standards standhält.

Unser Tipp: empirio.ai - Kostenlos mit KI Umfragen erstellen 🚀

Hier erstellst du kostenlos eine moderne Online-Umfrage. Mit den vielen KI-Funktionen klappt das Erstellen, Bearbeiten und Auswerten der Umfrage im Handumdrehen. Und alle Daten werden sicher in der EU gespeichert.

Jetzt kostenlos Umfrage erstellen
Inhalte in diesem Artikel:

Was sind Gütekriterien? Definition einfach erklärt

Gütekriterien sind die Maßstäbe, mit denen die Qualität einer Messung beurteilt wird. Sie zeigen, ob ein Fragebogen, ein Test oder eine wissenschaftliche Studie überhaupt verlässlich misst, was sie messen soll. In der empirischen Forschung sind sie der zentrale Qualitätscheck – ohne sie wäre jedes Ergebnis bloß eine Vermutung.

Kurz definiert:
Gütekriterien sind festgelegte Eigenschaften, die ein Messinstrument erfüllen muss, damit die Ergebnisse wissenschaftlich brauchbar sind. Sie gelten für Fragebögen, psychologische Tests, Interviews und jede Form der Datenerhebung.

Warum sie so wichtig sind:
Stell dir vor, du befragst 500 Kunden zur Zufriedenheit mit deinem Produkt – und kommst zu dem Ergebnis: „Alles super." Wenn du nicht weißt, ob deine Fragen objektiv formuliert waren, ob du bei einer Wiederholung dasselbe Ergebnis bekämst und ob du wirklich Zufriedenheit gemessen hast (und nicht etwa Höflichkeit), ist das Ergebnis wertlos. Genau hier setzen die Gütekriterien an.

Sie sorgen dafür, dass:

  • deine Daten unabhängig von der Person sind, die misst
  • du bei einer Wiederholung ähnliche Ergebnisse erhältst
  • du tatsächlich misst, was du vorhast zu messen

In der quantitativen Forschung sind die Gütekriterien klar definiert. In der qualitativen Forschung gibt es eigene, angepasste Kriterien, weil sich Standardisierung dort schwerer umsetzen lässt. Mehr dazu erfährst du im Vergleich zu den Gütekriterien qualitativer Forschung.

Die drei Hauptgütekriterien im Überblick

Die drei Hauptgütekriterien stammen ursprünglich aus der psychologischen Testtheorie und bilden heute den Standard für jede wissenschaftliche Messung. Sie heißen Objektivität, Reliabilität und Validität – und bauen aufeinander auf.

Ein einfaches Bild: Objektivität ist die Voraussetzung für Reliabilität, und Reliabilität ist die Voraussetzung für Validität. Wenn du am Anfang patzt, kippt alles Weitere.

Objektivität – unabhängig von der Person

Objektivität bedeutet, dass dein Ergebnis nicht davon abhängt, wer die Untersuchung durchführt, wer auswertet oder wer interpretiert. Drei Personen, dieselben Daten – und alle kommen zum selben Ergebnis.

Beispiel: Bei einer Online-Umfrage über ein Tool wie empirio.ai erfasst die Plattform alle Antworten automatisch und wertet sie standardisiert aus. Es gibt keinen Interviewer, der durch seine Stimme, Mimik oder Nachfragen die Antworten beeinflusst. Das ist ein klarer Pluspunkt für die Objektivität.

Reliabilität – zuverlässig wiederholbar

Reliabilität heißt: Wenn du dieselbe Messung unter denselben Bedingungen wiederholst, bekommst du dasselbe Ergebnis. Das Instrument misst also zuverlässig, nicht zufällig.

Beispiel: Du misst die Mitarbeiterzufriedenheit heute mit einem standardisierten Fragebogen. Eine Woche später, ohne Zwischenfälle, lieferst du die gleiche Befragung erneut aus. Wenn die Werte stark schwanken, obwohl sich nichts geändert hat, ist die Reliabilität gering. Mehr Details findest du im Artikel zur Reliabilität.

Validität – misst, was es soll

Validität ist das anspruchsvollste der drei Kriterien. Sie beantwortet die Frage: Misst dein Fragebogen tatsächlich das, was er messen soll – und nicht etwas anderes?

Beispiel: Du willst die Arbeitszufriedenheit messen, fragst aber vor allem nach dem Gehalt. Damit erhebst du womöglich die Gehaltszufriedenheit, nicht die generelle Arbeitszufriedenheit. Das Ergebnis ist verzerrt. Eine ausführliche Erklärung findest du im Artikel zur Validität.

So bauen die drei aufeinander auf

Ohne Objektivität ist Reliabilität schwer möglich – verschiedene Auswerter würden allein durch ihre Subjektivität unterschiedliche Werte produzieren. Ohne Reliabilität wiederum kann Validität nicht funktionieren – wenn die Messung zufällig schwankt, kann sie unmöglich konstant das Richtige erfassen.

Eine kompakte Übersicht aller drei Kriterien gibt es auch in unserem Artikel zu den quantitativen Gütekriterien.

Objektivität, Reliabilität, Validität an Beispielen erklärt

Damit die Theorie greifbar wird, hier drei durchgehende Beispiele aus typischen Umfrage-Situationen. Jedes Beispiel zeigt, wie ein Gütekriterium in der Praxis aussieht – und was passiert, wenn es verletzt wird.

Beispiel 1: Mitarbeiterbefragung im Unternehmen

Objektivität: Alle Mitarbeitenden bekommen denselben anonymen Online-Fragebogen mit identischen Fragen und Antwortoptionen. Niemand wird zusätzlich interviewt, niemand muss mündlich antworten. Die Auswertung läuft automatisiert. So spielt es keine Rolle, ob HR, der Vorstand oder eine externe Beratung später die Daten anschaut – das Ergebnis bleibt gleich.

Reliabilität: Du misst die Zufriedenheit im Frühjahr und im Herbst mit demselben Fragebogen. Wenn sich im Unternehmen nichts Grundlegendes verändert hat, sollten die Werte ähnlich liegen. Springen sie ohne erklärbaren Grund von 8,2 auf 4,1, stimmt etwas mit der Messung nicht.

Validität: Du willst herausfinden, wie zufrieden die Mitarbeitenden mit ihrer Führungskraft sind. Wenn du nur nach dem Gehalt fragst, misst du etwas anderes. Erst wenn du gezielt Fragen zur Führung stellst – etwa zu Feedback, Vertrauen und Erreichbarkeit – ist die Messung valide.

Beispiel 2: Kundenzufriedenheitsbefragung

Ein Online-Shop will wissen, ob seine Kunden zufrieden sind und schickt nach jedem Kauf eine Umfrage raus.

  • Verletzte Objektivität: Der Geschäftsführer ruft persönlich an und fragt: „Sie waren doch zufrieden, oder?" – Höfliche Antworten verzerren das Bild.
  • Verletzte Reliabilität: Heute wird gefragt „Wie zufrieden waren Sie?", nächste Woche „Würden Sie uns weiterempfehlen?". Beide Fragen messen Ähnliches, aber nicht identisch. Die Werte schwanken.
  • Verletzte Validität: Der Fragebogen misst Lieferzeit, Preis und Versand – aber nicht das, was Kunden wirklich umtreibt: Produktqualität und Service. Die Ergebnisse beantworten am Ende eine andere Frage als die ursprünglich gestellte.

Wenn du eine Kundenbefragung sauber aufsetzen willst, helfen dir auch unsere Fragebogen-Vorlagen als Startpunkt.

Beispiel 3: Wissenschaftliche Umfrage in einer Bachelorarbeit

Du untersuchst, wie Studierende digitale Lernformate bewerten.

  • Objektivität: Du nutzt einen standardisierten Fragebogen, den alle Teilnehmenden identisch ausfüllen.
  • Reliabilität: Du testest den Fragebogen vorher mit einem Pretest an einer kleinen Gruppe und prüfst, ob die Antworten konstant sind.
  • Validität: Du fragst nicht nur „Wie gefällt dir die Plattform?", sondern dröselst das Konstrukt „Bewertung digitaler Lernformate" in konkrete Aspekte auf: Nutzbarkeit, Lernerfolg, Motivation. So misst du wirklich, was du messen willst.

Welche Arten von Validität gibt es?

Validität ist nicht gleich Validität. In der Praxis unterscheidet man mehrere Unterarten, weil ein Messinstrument auf verschiedene Weisen „treffsicher" sein kann. Wer das einmal verstanden hat, kann Fragebögen deutlich gezielter konstruieren.

Inhaltsvalidität

Die Inhaltsvalidität fragt: Decken die Fragen das gesamte Themenfeld ab? Beispiel: Wenn du Kundenservice messen willst, sollten Erreichbarkeit, Freundlichkeit, Kompetenz und Reaktionszeit alle vertreten sein – nicht nur ein Aspekt.

Kriteriumsvalidität

Hier geht es um den Zusammenhang zwischen dem Testergebnis und einem äußeren Kriterium. Beispiel: Ein Auswahltest sagt voraus, wie gut jemand im Job performt. Stimmt diese Vorhersage, ist die Kriteriumsvalidität hoch.

Man unterscheidet hier oft:

  • Konkurrente Validität: Test und Kriterium werden gleichzeitig erhoben
  • Prognostische Validität: Der Test sagt ein späteres Verhalten vorher

Konstruktvalidität

Die Konstruktvalidität prüft, ob ein theoretisches Konstrukt (z. B. „Selbstwirksamkeit") wirklich erfasst wird. Sie ist das schwierigste Validitätskriterium, weil viele Konstrukte abstrakt sind.

Interne und externe Validität

  • Interne Validität: Sind die gemessenen Zusammenhänge ursächlich auf das untersuchte Merkmal zurückzuführen – oder gibt es Störvariablen? Wichtig bei Experimenten.
  • Externe Validität: Lassen sich die Ergebnisse auf andere Personen, Situationen oder Zeitpunkte übertragen? Hier kommt das Thema Repräsentativität ins Spiel.

Praxistipp

Du musst nicht jede Form der Validität für jede Umfrage prüfen. Für die meisten Anwendungen reicht es, wenn die Inhaltsvalidität sauber durchdacht ist und du theoretisch begründen kannst, warum deine Fragen das Konstrukt abbilden.

Nebengütekriterien – diese Qualitätsmerkmale solltest du auch kennen

Neben den drei Hauptgütekriterien gibt es eine Reihe von Nebengütekriterien. Sie sind keine Pflicht, sondern Kür – aber sie machen den Unterschied zwischen einem ordentlichen und einem wirklich guten Fragebogen.

Normierung

Normierung bedeutet, dass es Vergleichswerte gibt, an denen ein Einzelergebnis eingeordnet werden kann. Klassisch in psychologischen Tests: Wer einen Intelligenztest macht, bekommt einen Wert relativ zur Vergleichsgruppe.

In der Umfragepraxis taucht das oft bei standardisierten Skalen auf. Beispiel: Ein NPS-Wert von 30 ist erst dann aussagekräftig, wenn du weißt, wie deine Branche im Durchschnitt liegt. Mehr dazu im Artikel zum Net Promoter Score.

Ökonomie

Ein Fragebogen sollte mit vertretbarem Aufwand durchführbar sein. Wenn die Befragung 90 Minuten dauert und die Auswertung Wochen, ist das praktisch kaum tragbar. Online-Umfragen erfüllen dieses Kriterium meist gut – sie sind günstig, skalierbar und schnell ausgewertet.

Nützlichkeit

Misst du etwas, das wirklich relevant ist? Ein hochreliables Instrument, das aber niemanden interessiert, hat wenig praktischen Wert. Die Nützlichkeit zwingt dich dazu, immer wieder zu fragen: Brauchen wir diese Daten wirklich?

Vergleichbarkeit

Wenn ähnliche Studien existieren, sollte dein Fragebogen vergleichbare Ergebnisse erlauben. Das spricht oft dafür, etablierte Skalen wie die Likert-Skala zu nutzen, statt jedes Mal neue Frageformate zu erfinden.

Zumutbarkeit

Ein eher neueres Nebenkriterium: Belastet die Befragung die Teilnehmenden zu sehr? Wer fünf Seiten lang sensible Fragen beantwortet, bricht ab oder antwortet ungenau. Zumutbarkeit ist auch ein wichtiger Hebel für die Rücklaufquote.

Fairness

Fairness fragt, ob keine Gruppe systematisch benachteiligt wird – etwa durch unverständliche Sprache, kulturelle Annahmen oder unzugängliche Formate. In Mitarbeiterbefragungen ein zentrales Thema.

So stellst du die Gütekriterien in deiner Umfrage sicher

Jetzt wird es praktisch. Damit deine Umfrage objektiv, reliabel und valide ist, brauchst du keinen Methodik-Doktortitel – aber ein paar bewährte Schritte. Hier ist die konkrete Vorgehensweise, die in den meisten Fällen ausreicht.

Schritt 1: Theorie vor Praxis

Bevor du eine einzige Frage formulierst, beschreibe genau, was du messen willst. Was bedeutet „Kundenzufriedenheit" für dich? Aus welchen Aspekten setzt sie sich zusammen? Diese Vorarbeit bestimmt später deine Validität.

Schritt 2: Standardisierter Aufbau

Nutze einen klar strukturierten Fragebogen, der für alle Teilnehmenden gleich abläuft. Online-Umfragen sind dafür perfekt: identische Reihenfolge, identische Antwortmöglichkeiten, keine subjektiven Interviewer-Einflüsse. Wie der Aufbau aussieht, zeigen wir im Artikel zum Fragebogen erstellen.

Schritt 3: Pretest durchführen

Der Pretest ist dein wichtigster Qualitätshebel. Lass 5 bis 15 Personen den Fragebogen vorab ausfüllen und frag nach:

  • Sind die Fragen verständlich?
  • Werden Begriffe einheitlich interpretiert?
  • Wie lange dauert die Befragung?

Ein guter Pretest deckt Reliabilitäts- und Validitätsprobleme auf, bevor du sie an 500 Teilnehmende ausspielst.

Schritt 4: Klare Skalen verwenden

Verwende etablierte Antwortformate wie die Likert-Skala mit eindeutig benannten Stufen. Vermeide unklare Mittelkategorien oder Skalen ohne neutralen Punkt, wenn dieser sinnvoll wäre.

Schritt 5: Auswertung standardisieren

Lege vor der Auswertung fest, wie du codierst, gewichtest und auswertest. So bleibt das Ergebnis nachvollziehbar und reproduzierbar – auch wenn jemand anders die Daten anschaut.

Schritt 6: Stichprobe sauber definieren

Eine valide Umfrage braucht eine passende Stichprobe. Wenn du nur Personen befragst, die ohnehin zufrieden sind, ist deine externe Validität dahin. Mehr zur sauberen Stichprobenziehung findest du im Artikel zur repräsentativen Umfrage.

Typische Fehler, die Gütekriterien zerstören

  • Suggestivfragen: „Sind Sie auch der Meinung, dass…?" – tötet Objektivität und Validität gleichzeitig
  • Doppelte Fragen: „Wie zufrieden sind Sie mit Preis und Qualität?" – misst zwei Dinge gleichzeitig
  • Unklare Begriffe: „Wie oft" ohne Zeitangabe – jede Person interpretiert anders
  • Zu lange Fragebögen: Teilnehmende klicken durch, ohne nachzudenken – Reliabilität sinkt
  • Fehlende Antwortkategorien: Wer keine passende Option findet, klickt irgendwas an

Eine ausführliche Liste typischer Fehler findest du in unserem Artikel zu den häufigsten Fehlern bei Umfragen.

Praxis-Tipp zum Schluss

Du musst nicht jedes Gütekriterium auf Hochschulniveau prüfen. Wer einen sauberen Pretest macht, standardisiert auswertet und seine Fragen ernsthaft auf Validität durchdenkt, hat die wichtigsten Hebel schon gezogen. Für viele Umfragen reicht das aus, um wissenschaftlich vertretbar zu arbeiten.

Autor des Artikels

Marco

Marco ist Teil unseres Experten-Teams. Seit 2018 führt er erfolgreich Umfragen in Unternehmen durch und teilt seine Erfahrungen hier bei Online-Umfrage.org.

Häufige Fragen

Was sind Gütekriterien einfach erklärt?

Welche drei Gütekriterien gibt es?

Was ist der Unterschied zwischen Reliabilität und Validität?

Welche Nebengütekriterien gibt es?

Wie überprüfe ich die Gütekriterien meiner Umfrage?

Online-Umfragen einfach mit KI erstellen

Hero VactorHero VactorHero VactorHero Vactor