50 Proben in zwei Wochen sensorisch zu testen — ohne teures Labor — klingt auf den ersten Blick nach einer Herkulesaufgabe. Ich habe das mehrfach für Hersteller und Start-ups umgesetzt und möchte hier meine pragmatische, erprobte Vorgehensweise teilen. Ziel ist: belastbare, nutzbare Daten mit kleinem Budget, schneller Implementierung und möglichst geringer organisatorischer Reibung.
Warum 50 Proben? Wann macht das Sinn?
Bevor ich in die Methode eintauche, eine kurze Klarstellung: 50 Proben treten meist in drei Fällen auf:
Viele Rezeptvarianten oder Rohstoff-Split-Tests (z. B. verschiedene Fettquellen, Süßungsmittel und Verpackungsgrößen kombiniert).Iterative Testserien über mehrere Sessions (Version A–E × 10 Produktvarianten).Vergleich vieler Lieferantenproben oder internationaler Varianten.Wenn die Fragestellung eher feinmotorische Unterschiede abfragt (feine Geschmacksskalierung), braucht es weniger, aber besser trainierte Panelist:innen. Bei groben Vorlieben (liking, purchase intent) reichen Consumer-Tests.
Grundprinzipien meiner Vorgehensweise
Segmentieren: Nicht alle 50 Proben in einer einzigen Session prüfen — das overburdens die Wahrnehmung.Mix aus heuristischen Schnelltests und tieferen Tests: Kombination aus CATA (Check-All-That-Apply), hedonic scales, discriminative tests und Home-Use-Tests.Standardisierung statt teurer Infrastruktur: Mobile Teststationen, einfache Portionierkits, klare SOPs (Standard Operating Procedures).Praktischer Ablauf — Zwei-Wochen-Plan
Ich teile die 50 Proben in Blöcke und nutze mehrere Testformate parallel. Beispiel-Schema:
| Tag 1–3 | Screening im zentralen Ort (CLT): 10 Proben, N=80 Konsumenten, Fokus: Liking + Purchase Intent |
| Tag 4–6 | Sensorische Expertenrunde: 12 Proben, kleines trained panel (N=8–12), Fokus: Deskriptive Attribute + Identifikation von Off-Flavours |
| Tag 7–10 | Home-Use-Test (HUT): 20 Proben rotierend, N=150 Konsumenten (je Probenpaar 30–40), Fokus: Alltagstauglichkeit, Re-Evaluation nach Nutzung |
| Tag 11–14 | Online CATA & Follow-up: Alle Proben in Random-Steps, N=200, Fokus: Attribut-Mapping, Segmentierung |
Wie ich Probenpooling und Randomisierung handhabe
Wichtig ist, die kognitive Last zu reduzieren. Ich folge diesen Regeln:
Maximal 6–8 Proben pro Session pro Person. Mehr verschlechtert die Differenzierungsfähigkeit.Jede Probe wird von mehreren Subgruppen bewertet (Crossed design). So braucht nicht jede:r jede Probe, aber jede Probe erhält genügend Bewertungen (mind. 30–40 für Consumer-Liking; 8–12 für descriptive).Randomisierte Blockpläne: Ich generiere einfache Randomisierungen mit Excel oder kostenlosen Tools (z. B. OpenLab, R-Shiny-Scripts), um Reihenfolge- und Positionseffekte zu streuen.Welche Testmethoden ich kombiniere
Für schnelle, fundierte Resultate verwende ich:
Hedonic 9-Punkt-Skala für Liking und Purchase Intent — robust und einfach zu erklären.CATA (Check-All-That-Apply) zur Attributerfassung — ermöglicht Multidimensionale Profilierung ohne aufwändiges Training.Discriminative Tests (Triangle oder Duo-Trio) bei kritischen Entscheidungen, ob eine Rezeptur wirklich anders wahrnehmbar ist.Home-Use-Tests für Produkte, die im Alltag bewertet werden sollen (z. B. Convenience, Brotaufstriche). Oft liefern HUTs insights zu Verpackungsfunktionalität und reheating behavior.Rekrutierung: woher die Panelist:innen kommen
Ich setze auf eine Mischung:
Bestehende Kundendatenbanken der Auftraggeber (wenn vorhanden).Lokale Rekrutierung über Social Ads (Facebook/Instagram) mit kurzen Screening-Formularen — kostengünstig und schnell.Universitätsstudenten für descriptive Panels (gegen Aufwandsentschädigung). Sie sind verlässlich und lernfähig.Freie Plattformen (z. B. Prolific, UserTesting) für spezifische Zielgruppen, wenn Demografie wichtig ist.Equipment und Logistik mit geringem Budget
Du brauchst keine aufwändige Booth-Infrastruktur. Ich nutze:
Mobile Tische, einfache Sichtschutz-Trennwände (Plexiglas oder Pappaufsteller).Standardisierte Probenbehälter (transparent oder opaque je nach Bedarf), Portionierungslöffel, Wasser für Mundspülung.Tablets oder QR-Codes, die zu Google Forms / SurveyMonkey / Qualtrics führen. Für komplexere Erhebungen nutze ich Gorilla oder Compusense, aber oft reicht ein gut aufgebautes Google-Form.Eindeutige Probe-Codes und stapelbare Boxen für sichere Lagerung.Datenanalyse — pragmatisch und aussagekräftig
Kein teures Statistik-Paket nötig. Meine Minimal-Analyse umfasst:
Deskriptive Statistik (Mittelwerte, Standardabweichung).ANOVA/Kruskal-Wallis für Liking-Vergleiche; Post-hoc-Bonferroni oder Dunn-Test bei nicht-parametrischen Daten.Chi-Quadrat / Cochran für CATA-Daten, sowie PMI (Product-Market-Index) für Kaufwahrscheinlichkeit.R oder SPSS für Fortgeschrittene; Excel plus kostenlose R-Skripte reichen oft. Visualisierungen: Spiderplots für descriptive Panels, Barplots für Liking, Heatmaps für CATA-Matrizen.KPIs und Reporting — was ich messe
Liking (Durchschnitt + % „gefällt sehr“) — Haupt-KPI bei Market-Fit-Checks.Purchase Intent (Likert-Skala) und Price Sensitivity.Attribute-Frequenzen (CATA) und Off-Flavor-Reports (Expertenpanel).Time-to-insight: wie schnell kann Produktion reagieren? (Tage seit Testabschluss)Typische Fehler und wie ich sie vermeide
Zu viele Proben pro Person: Splitten!Unklare Instruktionen: Ich schreibe kurze, bebilderte SOPs und zeige ein Demo-Video am Testtag.Verwechselte Probencodes: doppelte Kontrolle beim Verpacken + Fotodokumentation.Nicht-analysierbare Daten: Pflichtfelder in Online-Formen erzwingen, Logikprüfungen einbauen (z. B. Alter 18–75).Praxisbeispiel kurz
Für einen Mittelständler habe ich 48 Varianten eines Aufstrichs in 10 Tagen getestet: 8 zentrale CLT-Sessions (je 6 Proben), 2 trained-panels für off-flavours, und einen HUT für Alltagsfeedback. Ergebnis: wir reduzierten auf 6 Finalisten, konnten Rezeptkosten um 7 % senken und hatten nach 3 Wochen eine marktreife Version. Kostentreiber waren hauptsächlich Logistik und Incentives — nicht das Test-Setup selbst.
Wenn Sie möchten, beschreibe ich gern ein konkretes Design für Ihr Produkt (z. B. Getränke vs. Bakery), inklusive Budgetplan, Screener-Vorlage und Randomisierungs-Template — so sparen Sie Zeit und vermeiden Anfängerfehler.