Takže jste byli požádáni, abyste vypočítali rozptyl pomocí Excelu, ale nejste si jisti, co to znamená nebo jak to udělat. Nebojte se, je to snadný koncept a ještě jednodušší proces. Za chvíli z vás bude profík na variace!
Co je variance?
„Variance“ je způsob, jak měřit průměrnou vzdálenost od průměru. „Průměr“ je součet všech hodnot v datové sadě dělený počtem hodnot. Rozptyl nám dává představu o tom, zda hodnoty v tomto souboru dat mají v průměru tendenci držet se rovnoměrně na střední hodnotě, nebo zda se rozptylují všude.

Matematicky není rozptyl tak složitý:
- Vypočítejte střední hodnotu souboru hodnot. Chcete-li vypočítat průměr, vezměte součet všech hodnot dělený počtem hodnot.
- Vezměte každou hodnotu ve svém souboru a odečtěte ji od průměru.
- Odmocni výsledné hodnoty (pro zrušení záporných čísel).
- Sečtěte všechny umocněné hodnoty dohromady.
- Vypočítejte střední hodnotu umocněných hodnot, abyste získali rozptyl.
Takže jak vidíte, není to těžké vypočítat hodnotu. Pokud však máte stovky nebo tisíce hodnot, trvalo by to věčnost dělat ručně. Je tedy dobře, že Excel dokáže proces automatizovat!
K čemu používáte rozptyl?
Variance sama o sobě má řadu využití. Z čistě statistického hlediska je to dobrý zkratkový způsob, jak vyjádřit, jak rozprostřená je sada dat. Investoři používají rozptyl k odhadu rizika dané investice.
Například když vezmete hodnotu akcie za určité časové období a vypočítáte její rozptyl, získáte dobrou představu o její volatilitě v minulosti. Za předpokladu, že minulost předpovídá budoucnost, by to znamenalo, že něco s nízkým rozptylem je bezpečnější a předvídatelnější.

Můžete také porovnat rozptyly něčeho v různých časových obdobích. To může pomoci odhalit, kdy jiný skrytý faktor něco ovlivňuje a mění jeho rozptyl.
Rozptyl také silně souvisí s další statistikou známou jako standardní odchylka. Pamatujte, že hodnoty použité k výpočtu rozptylu jsou na druhou. To znamená, že rozptyl není vyjádřen ve stejné jednotce původní hodnoty. Směrodatná odchylka vyžaduje použití druhé odmocniny rozptylu, aby se hodnota vrátila na původní jednotku. Takže pokud byly údaje v kilogramech, pak je standardní odchylka také.
Výběr mezi populací a rozptylem vzorku
V Excelu existují dva podtypy rozptylu s mírně odlišnými vzorci. Který z nich byste si měli vybrat, závisí na vašich datech. Pokud vaše data zahrnují celou „populaci“, měli byste použít rozptyl populace. V tomto případě „populace“ znamená, že máte všechny hodnoty pro každého člena cílové skupiny populace.

Pokud se například díváte na váhu leváků, pak populace zahrnuje každého jednotlivce na Zemi, který je levák. Pokud jste je všechny zvážili, použili byste populační rozptyl.
Samozřejmě, v reálném životě se obvykle spokojíme s menším vzorkem z větší populace. V takovém případě byste použili výběrový rozptyl. Rozptyl populace je stále praktický u menších populací. Společnost může mít například několik set nebo několik tisíc zaměstnanců s údaji o každém zaměstnanci. Představují „populaci“ ve statistickém smyslu.
Výběr správného vzorce rozptylu
V Excelu jsou tři vzorové vzorce rozptylu a tři vzorce rozptylu populace:
- VAR , VAR.S a VARA pro výběrový rozptyl.
- VARP , VAR.P a VARPA pro rozptyl populace.
VAR a VARP můžete ignorovat. Tyto jsou zastaralé a existují pouze kvůli kompatibilitě se staršími tabulkami.
Zbývají tedy VAR.S a VAR.P, které slouží k výpočtu rozptylu sady číselných hodnot, a VARA a VARPA, které obsahují textové řetězce.

VARA a VARPA převedou jakýkoli textový řetězec na číselnou hodnotu 0, s výjimkou „TRUE“ a „FALSE“. Ty jsou převedeny na 1 a 0 v tomto pořadí.
Největší rozdíl je v tom, že VAR.S a VAR.P přeskakují jakékoli nečíselné hodnoty. Tím se tyto případy vyloučí z celkového počtu hodnot, což znamená, že střední hodnota se bude lišit, protože střední hodnotu vydělíte menším počtem případů.
Jak vypočítat rozptyl v Excelu
Vše, co potřebujete k výpočtu rozptylu v Excelu, je sada hodnot. V níže uvedeném příkladu použijeme VAR.S, ale vzorec a metody jsou naprosto stejné bez ohledu na to, který vzorec rozptylu použijete:
- Za předpokladu, že máte připravený rozsah nebo samostatnou sadu hodnot, vyberte prázdnou buňku podle svého výběru.

- Do pole vzorce zadejte =VAR.S(XX:YY) , kde hodnoty X a Y budou nahrazeny prvním a posledním číslem buněk v rozsahu.

- Stiskněte Enter pro dokončení výpočtu.

Případně můžete zadat konkrétní hodnoty, v takovém případě vzorec vypadá jako =VAR.S(1,2,3,4) . S čísly nahrazenými čímkoli, co potřebujete k výpočtu rozptylu. Takto můžete ručně zadat až 254 hodnot, ale pokud nemáte jen hrstku hodnot, je téměř vždy lepší zadat data do rozsahu buněk a poté použít verzi vzorce pro rozsah buněk, o které jsme se zmínili výše.
Můžete excelovat na, Er, Excel
Výpočet rozptylu je užitečný trik pro každého, kdo potřebuje udělat nějakou statistickou práci v Excelu. Pokud by však některá z terminologií aplikace Excel, kterou jsme použili v tomto článku, byla matoucí, zvažte vyzkoušení výukového programu základů aplikace Microsoft Excel – Naučte se používat Excel .
Pokud jste na druhou stranu připraveni na více, podívejte se na Přidání trendové linie lineární regrese do bodového grafu aplikace Excel , abyste si mohli představit rozptyl nebo jakýkoli jiný aspekt souboru dat ve vztahu k aritmetickému průměru.
Lze odchylky ignorovat?
Rozptyl je jedním z nejužitečnějších nástrojů v teorii pravděpodobnosti a statistice. Používá se k měření variability souboru dat. Rozptyl však nelze ve statistice ignorovat, protože pomáhá vyhodnotit variabilitu dat a vyvodit důležité závěry o vztahu mezi proměnnými. Pokud budete odchylky ignorovat, mohou vám uniknout důležité informace o vašich datech a vést k zavádějícím výsledkům. Takže je nejlepší neignorovat rozptyl ve vašich statistikách.