Pivní blok
Pivní blok
K rozpětí hodnocení při degustacích
[středa, 12. červen 2013]
K napsání tohoto bloku mě inspirovala poznámka v diskusi pod jedním z reportů z minulých degustací Pivní revizní komise (PRK), která upozorňovala na přílišný rozptyl v hodnocení piv různými degustátory. Rozhodl jsem se tedy využit veřejně dostupných dat a porovnat vyrovnanost hodnocení v degustacích mezi PRK a První pivní extraligou (PPE).
PRK je partička lidí, kteří mají rádi pivo a jsou po odborné stránce degustátory nevzdělanými (až na jednu výjimku). Prostě jen máme rádi pivo a většina z nás už pár set různých značek piv vypila. O složení PPE nemám moc informací, ale má mezi čtenářstvem punc odborníků a tak předpokládám, že naprostá většina jejích členů má degustátorské zkoušky a lze je tedy považovat za odborníky.
Pro analýzu jsem využil dostupná data z celkem 11 degustací českých ležáků PPE z let 2011-2012. Je třeba zdůraznit, že v poslední době PPE bohužel nezveřejňuje, jak jednotliví degustátoři hodnotili. Dále jsem využil výsledky z 8 degustací PRK, při kterých se hodnotily světlé ležáky. Ostatní čtyři degustace (IPA, bocky a pšenice) jsem pro lepší srovnatelnost výsledků vyřadil již před analýzou.
Shrnutí dostupných dat je v tabulce. Porovnáváno je bodové rozpětí v hodnocení každého piva, přičemž např. pivo hodnocené pouze čtyřkami a pětkami má rozpětí dvou bodů.
Komise Degustace Počet degustovaných piv Počet degustátorů Bodové rozpětí hodnocení u jednotlivých piv
Bodové rozpětí | hodnocení u | jednotlivých piv
| ||||
Komise | Degustace | Počet deg. piv | Počet degustátorů | min | max | průměr±s.e.
|
PRK | Porodnice | 11 | 10 | 3 | 8 | 5.18±0.48
|
PRK | Vítězné ležáky | 9 | 7 | 3 | 5 | 3.89±0.26
|
PRK | Vítězné středočeské | 8 | 8 | 3 | 6 | 4.63±0.42
|
PRK | Druhé kolo středočeské | 9 | 10 | 3 | 7 | 5.11±0.42
|
PRK | První kolo středočeské | 8 | 9 | 3 | 7 | 4.50±0.46
|
PRK | Pražské mini | 10 | 8 | 4 | 7 | 5.20±0.36
|
PRK | Pivotéky | 8 | 8 | 3 | 5 | 4.13±0.30
|
PRK | Nevěřící Tomášové | 10 | 7 | 3 | 7 | 4.50±0.34
|
PPE | Druhé semifinále 2012 | 10 | 8 | 3 | 5 | 4.20±0.20
|
PPE | První kolo 2012 | 11 | 8 | 3 | 6 | 4.18±0.30
|
PPE | Druhé kolo 2012 | 11 | 8 | 2 | 6 | 3.50±0.31
|
PPE | Finále 2011 | 10 | 8 | 3 | 5 | 4.30±0.21
|
PPE | Semifinále B 2011 | 10 | 8 | 3 | 5 | 4.00±0.21
|
PPE | Semifinále A 2011 | 10 | 8 | 3 | 5 | 4.30±0.26
|
PPE | Páté kolo 2011 | 10 | 8 | 3 | 6 | 4.40±0.34
|
PPE | Čtvrté kolo 2011 | 10 | 8 | 3 | 6 | 4.30±0.30
|
PPE | Třetí kolo 2011 | 10 | 8 | 3 | 6 | 4.50±0.31
|
PPE | Druhé kolo 2011 | 10 | 8 | 4 | 6 | 4.70±0.26
|
PPE | První kolo 2011 | 10 | 8 | 3 | 7 | 4.50±0.40 |
A nyní šťavnatá statistika. V případě PRK je minimální bodové rozpětí 3 a maximální 8, v případě PPE je to 2 a 7. Histogram bodového rozpětí pro obě skupiny degustátorů je na obrázku. Je patrné, že v obou skupinách je nejvíce zastoupeno bodové rozpětí 4 a 5. V průměru je v případě PRK rozpětí hodnocení jednoho piva 4.58±0.19 bodů, v případě PPE 4.25±0.08 bodů. Výpočet průměrů váží skutečnost, že hodnocení piv v rámci jedné degustace není vzájemně nezávislé, protože v rámci jedné degustace působí stejné faktory, které příště můžou být jiné, a hlavně se piva porovnávají vůči sobě navzájem. Průměrné hodnoty se průkazně liší (hierarchická analýza rozptylu, F= 7.565, df=1,181, p=0.007), PPE tedy hodnotí piva v porovnání s PRK s menším rozpětím bodů a mezi degustátory tak panuje větší shoda názoru na jednotlivá piva. Hodnoty střední chyby odhadů průměrů (číslo za ±) ukazuje, že „rozptyl“ je v případě bodového hodnocení jednoho piva menší u PPE než u PRK. Variabilita mezi jednotlivými degustacemi PPE zároveň není průkazně odlišná od nuly (χ2, QT=10.96, df=10, p=0.360), což znamená, že PPE piva hodnotí mezi jednotlivými degustacemi zhruba se stejným bodovým rozpětím. Oproti tomu variabilita průkazně odlišná od nuly v případě PRK (χ2, QT=15.08, df=7, p=0.035) ukazuje, že PRK hodnotí piva pokaždé s jiným rozpětím bodů.
Závěry:
PPE hodnotí české ležáky s menším bodovým rozpětím hodnocení každého piva, než je tomu v případě PRK, a jejich hodnotitelský výkon je stabilní mezi jednotlivými degustacemi. To je dobře, jedná se o profesionály. Přesto se v jejich degustacích vyskytují výrazné rozdíly v hodnocení jednotlivých piv (6 až 7 bodů). Oproti tomu amatérská PRK vykazuje ve svých hodnoceních piv větší bodové rozpětí a v čase jsou (ne)soulady v hodnocení nevyrovnané. To může být způsobeno řadou důvodů (kromě toho, že se jedná o amatéry jako takové): 1) amatérští degustátoři snadněji podléhají momentálním náladám; 2) každý k Rosťovu dilematu přistoupí jinak a tak se stane, že někdo hodnotí, jestli mu pivo chutná, druhý zase, jestli chutná tak, jak má; 3) PPE hodnotí průmyslové lahváče, které mají potenciálně uniformnější chuť, než piva z minipivovarů hodnocená PRK; 4) PRK hodnotí různý počet piv a účastní se různý počet degustátorů, zatímco PPE má počet vždy stabilní; 5) v rámci PRK se nešetří devítkami a občas se vyskytne i jednička (zásluhou Kejny), což se v případě PPE nestalo ani jednou. Výsledky nijak neovlivňují fakt, že nás ochutnávání prostě baví.
Popisek obrázku: Histogram hodnot rozpětí v hodnocení jednotlivých piv v degustacích PPE a PRK. Výška sloupečku ukazuje počet opakování (frekvenci výskytu) jednotlivých hodnot rozpětí.
Pidat reakci
Magister
neděle, 23. červen 2013
22:07
Díky. To muselo dát práci. Je to poučné.
napsal(a): Magister (magister(a)ppe.cz) [Odpovědět]