Wenn alles 4 oder 5 Sterne bekommt, ist nichts wirklich wichtig. Rangfolge-Fragen zwingen die Befragten zur Auswahl - und genau dort kommen die wahren Prioritäten zum Vorschein.
Bewertungsskalen messen Intensität. Rangfolgen messen Priorität. Wenn du Kompromisse brauchst, liefern Bewertungen diese nicht. Menschen häufen ihre Bewertungen oft oben an, und am Ende hast du zehn Punkte, die alle 4,2 von 5 Punkten haben. Rangfolgen zwingen sie zur Entscheidung, und diese Entscheidung macht die Daten ehrlich.
Wann man es nutzt
Nutze Rangfolge-Fragen, wenn du wissen musst, was an erster Stelle steht, nicht nur, was gut ist:
- Funktionen priorisieren - “Welche Verbesserungen sind dir am wichtigsten?”
- Botschaften testen - “Welches Wertversprechen kommt am besten an?”
- Roadmaps informieren - “Ordne diese Probleme nach ihrer Auswirkung auf deine Arbeit”
- Ideen vergleichen - “Welche Konzepte bevorzugst du?”
- Ressourcen zuweisen - “Wo sollten wir als Nächstes investieren?”
- Zielgruppen segmentieren - Unterschiedliche Gruppen ranken unterschiedlich, und dieser Unterschied ist die Erkenntnis
Rangfolge-Methoden
Vier Methoden. Jede eignet sich für eine andere Listengröße und einen anderen Kontext. Das System wählt eine basierend auf der Anzahl deiner Optionen aus, oder du wählst sie manuell.
Drag & Drop (Sortieren)
Befragte ziehen Elemente in ihre bevorzugte Reihenfolge. Einfach, vertraut, schnell.
Nutze es für 5 oder weniger Elemente. Darüber hinaus platzieren die Leute die Top 2-3 sorgfältig und ziehen den Rest einfach an zufällige Stellen, um fertig zu werden. Die Mitte einer langen Drag-and-Drop-Liste ist Rauschen, kein Signal.
Paarweiser Vergleich
Zwei Elemente gleichzeitig. Wähle das bessere. Wiederholen.
Das spiegelt wider, wie Menschen natürlich entscheiden. Zwei Optionen zu vergleichen geht schnell und fühlt sich mühelos an. Im Hintergrund erhält jede Option eine Gewinnrate, basierend darauf, wie oft sie gewählt wurde, was aus einfachen binären Entscheidungen ein vollständiges Ranking erzeugt.
Du wählst zwischen “vollständigem” paarweisem Vergleich (jedes mögliche Paar wird gezeigt) oder “partiellem” (jeder Befragte sieht eine Stichprobe). Bei 10 Optionen gibt es 45 Paare; bei 20 sind es 190. Der partielle Vergleich verteilt die Arbeit auf die Befragten, sodass niemand über alle Kombinationen abstimmen muss.
Nutze es für 6-15 Optionen. Es kann sich repetitiv anfühlen, wenn du einer Person zu viele Vergleiche zeigst - halte die Anzahl der Paare pro Befragtem in einem vernünftigen Rahmen.
MaxDiff (Best-Worst-Skalierung)
Befragte sehen kleine Teilmengen (3-5 Optionen gleichzeitig) und wählen aus jedem Set das wichtigste und das unwichtigste Element. Nach mehreren Runden mit verschiedenen Kombinationen werden die Stimmen zu einem vollständigen Ranking verrechnet.
Jeder Bildschirm liefert zwei Datenpunkte - ein “Best”- und ein “Worst”-Signal - sodass MaxDiff pro Bildschirm doppelt so viele Informationen extrahiert wie der paarweise Vergleich. Es bewältigt lange Listen, da die Befragten nie das gesamte Set auf einmal sehen.
Die Rohwerte basieren auf den Best- und Worst-Auswahlen und werden dann zum Vergleich normalisiert.
Nutze es für 8+ Optionen. Der Idealbereich liegt bei 10-30 Elementen, wobei 3-5 pro Bildschirm angezeigt werden.
Der Haken: Die Befragten müssen mit allen Optionen vertraut sein. Das Beste auszuwählen erfordert nur das Erkennen einer starken Option. Das Schlechteste auszuwählen erfordert das Verständnis aller Optionen. Wenn der Bekanntheitsgrad variiert, raten die Befragten - und Raten wird zu Rauschen.
Budgetzuweisung
Gib den Befragten einen festen Punktepool und lass sie ihn verteilen. Auch bekannt als Konstantsumme.
Dies ist die einzige Methode, die die Größenordnung erfasst. Paarweiser Vergleich und MaxDiff sagen dir, dass Befragte A gegenüber B bevorzugen. Die Budgetzuweisung sagt dir, dass sie 40 Punkte für A und 5 für B ausgeben würden - ihnen ist A also achtmal wichtiger.
Der Kompromiss: Menschen neigen dazu, die meisten Punkte auf ein Element zu setzen und den Rest ohne viel Nachdenken zu verstreuen. Überinterpretiere kleine Unterschiede zwischen niedrig bewerteten Elementen nicht. Halte die Liste unter 8 Optionen - 100 Punkte auf 15 Elemente aufzuteilen ist mehr Arithmetik als Forschung.
Welche Methode sollte ich wählen?
| Methode | Am besten für | Optionen | Aufwand für Befragte |
|---|---|---|---|
| Drag & Drop | Schnelles Ranking kurzer Listen | 2-5 | Niedrig |
| Paarweise | Mittlere Listen, mobilfreundlich | 6-15 | Niedrig pro Stimme |
| MaxDiff | Lange Listen, Forschungsprojekte | 8-30+ | Mittel |
| Budget | Wenn die Größenordnung zählt | 3-8 | Höher |
Einfache Regeln: Weniger als 6 Elemente, nutze Drag-and-Drop. Zwischen 6 und 15, nutze den paarweisen Vergleich. Darüber hinaus nutze MaxDiff - es sei denn, du musst wissen, wie viel wichtiger eine Option als eine andere ist; in diesem Fall nutze Budgetzuweisung mit einer kurzen Liste.
Konfigurationsoptionen
- Algorithmus - Lass es auf
auto, es sei denn, du hast einen Grund, es zu überschreiben. Das System wählt die Methode, die zu deiner Listengröße passt und die Ermüdung der Befragten minimiert. - Modus (Paarweise) -
fullzeigt jedem Befragten jedes mögliche Paar.partialnimmt eine Stichprobe und verteilt die Abdeckung auf die Befragten. Standard istpartial, was du für die meisten Umfragen möchtest. - Elemente pro Bildschirm (MaxDiff) - Wie viele Optionen in jeder Teilmenge erscheinen, 3-10. Standard ist
min(5, Listengröße). Niedrigere Werte sind einfacher für die Befragten; höhere Werte extrahieren mehr Daten pro Bildschirm. - Zielansichten pro Element (MaxDiff, Paarweise partiell) - Wie oft jede Option über alle Bildschirme hinweg erscheint, 1-10. Standard ist 3. Das System reduziert dies automatisch auf 2, wenn die resultierende Umfrage 20 Bildschirme überschreiten würde.
Ergebnisse interpretieren
Rankings zu sammeln ist die halbe Arbeit. Sie richtig zu lesen, ist die andere Hälfte.
Alle Methoden produzieren unterschiedliche Rohwerte - Gewinnraten, Best-Worst-Differenzen, Punktsummen, Positionsreihenfolgen. Um Ergebnisse unabhängig von der Methode vergleichbar zu machen, normalisieren wir alles auf eine Skala von 0-100. Ein Element mit einem Wert von 85 bedeutet dasselbe, egal ob es aus einem paarweisen Vergleich, MaxDiff oder einer Budgetzuweisung stammt. Das ermöglicht es dir, Methoden zwischen Umfragen zu wechseln oder Ergebnisse verschiedener Rangfolge-Fragen zu vergleichen, ohne deine Lesart der Zahlen neu kalibrieren zu müssen.
- Kleine Lücken zwischen mittelplatzierten Elementen sind oft statistisches Rauschen. Große Lücken an der Spitze oder am Ende sind dort, wo Entscheidungen fokussiert werden sollten.
- Werte sind relativ, nicht absolut. Ein Wert von 85 bedeutet, dass diese Option im Vergleich zu den anderen in deiner Liste hoch gerankt wurde. Es bedeutet nicht, dass 85% der Leute sie wollen. Ändere die Liste, und die Werte verschieben sich.
- Budget-Ergebnisse zeigen die Größenordnung, andere nicht. Paarweiser Vergleich und MaxDiff sagen dir die Reihenfolge. Budget sagt dir, wie viel mehr eine Sache zählt als eine andere. Eine 10-Punkte-Lücke zwischen zwei Elementen bei der Budgetzuweisung ist aussagekräftig. Die gleiche Lücke in normalisierten paarweisen Werten ist es vielleicht nicht.
- Segmentiere, bevor du schlussfolgerst. Gesamtrankings verbergen oft die wahre Geschichte. Deine Power-User und Gelegenheitsnutzer ranken dieselbe Liste möglicherweise in umgekehrter Reihenfolge. Schließe die Ergebnisse nach Zielgruppensegment auf, bevor du Entscheidungen triffst.
Bewährte Methoden
Schreibe vergleichbare Optionen
Alle Elemente sollten von der gleichen Art sein. Das Mischen von Funktionen mit Fehlerbehebungen und Geschäftszielen ergibt ein Ranking, nach dem niemand handeln kann. “Schnellere Suche” und “Besseres Onboarding” sind vergleichbar. “Schnellere Suche” und “Login-Fehler beheben” sind es nicht.
Halte Listen fokussiert
Jede Option, die du hinzufügst, kostet Aufmerksamkeit der Befragten und fügt den Ergebnissen Rauschen hinzu. Füge nur Elemente hinzu, bei denen du tatsächlich handeln würdest. Wenn eine Option auf dem letzten Platz landet und du sie trotzdem nicht streichen würdest, lass sie weg.
Achte auf Positionsverzerrung
Beim Drag-and-Drop neigen Elemente oben dazu, dort zu bleiben. Randomisiere die Startreihenfolge, damit die Position nicht zu einer versteckten Variable in deinen Daten wird.
Passe die Methode an das Gerät an
Paarweiser Vergleich und MaxDiff funktionieren gut auf Telefonen. Drag-and-Drop ist auf kleinen Bildschirmen schwieriger - das Ziehen auf dem Handy ist fummelig. Budgetzuweisung erfordert Konzentration, die dir ein Befragter am Handy im Bus nicht geben wird.