Takže ste boli požiadaní, aby ste vypočítali rozptyl pomocou Excelu, ale nie ste si istí, čo to znamená alebo ako to urobiť. Nebojte sa, je to jednoduchý koncept a ešte jednoduchší proces. Za chvíľu budete profesionálom na variácie!
Čo je rozptyl?
„Variancia“ je spôsob merania priemernej vzdialenosti od priemeru. „Priemerná hodnota“ je súčet všetkých hodnôt v množine údajov vydelený počtom hodnôt. Rozptyl nám dáva predstavu o tom, či hodnoty v tomto súbore údajov majú v priemere tendenciu držať sa rovnomerne priemeru alebo či sú rozptýlené po celom mieste.
Matematicky, rozptyl nie je taký zložitý:
- Vypočítajte strednú hodnotu súboru hodnôt. Ak chcete vypočítať priemer, zoberte súčet všetkých hodnôt vydelený počtom hodnôt.
- Vezmite každú hodnotu vo svojom súbore a odpočítajte ju od priemeru.
- Umocnite výsledné hodnoty (na vymazanie záporných čísel).
- Spočítajte všetky hodnoty na druhú.
- Vypočítajte priemer druhých mocnín, aby ste získali rozptyl.
Takže ako vidíte, nie je ťažké vypočítať túto hodnotu. Ak však máte stovky alebo tisíce hodnôt, manuálna práca by trvala večnosť. Takže je dobré, že Excel dokáže automatizovať proces!
Na čo používate rozptyl?
Rozptyl sám o sebe má množstvo využití. Z čisto štatistického hľadiska je to dobrý skrátený spôsob, ako vyjadriť, ako je množina údajov rozložená. Investori používajú rozptyl na odhad rizika danej investície.
Napríklad, ak vezmete hodnotu akcie za určité časové obdobie a vypočítate jej rozptyl, získate dobrú predstavu o jej volatilite v minulosti. Za predpokladu, že minulosť predpovedá budúcnosť, by to znamenalo, že niečo s nízkym rozptylom je bezpečnejšie a predvídateľnejšie.
Môžete tiež porovnať odchýlky niečoho v rôznych časových obdobiach. To môže pomôcť odhaliť, kedy niečo ovplyvňuje iný skrytý faktor, ktorý mení jeho rozptyl.
Rozptyl tiež úzko súvisí s ďalšou štatistikou známou ako štandardná odchýlka. Pamätajte, že hodnoty použité na výpočet rozptylu sú umocnené na druhú. To znamená, že rozptyl nie je vyjadrený v rovnakej jednotke pôvodnej hodnoty. Smerodajná odchýlka vyžaduje odmocnenie z rozptylu, aby sa hodnota vrátila na pôvodnú jednotku. Takže ak boli údaje v kilogramoch, potom je štandardná odchýlka tiež.
Výber medzi populáciou a rozptylom vzorky
V Exceli existujú dva podtypy rozptylu s mierne odlišnými vzorcami. Ktorý z nich by ste si mali vybrať, závisí od vašich údajov. Ak vaše údaje zahŕňajú celú „populáciu“, mali by ste použiť rozptyl populácie. V tomto prípade „populácia“ znamená, že máte všetky hodnoty pre každého člena cieľovej skupiny populácie.
Napríklad, ak sa pozeráte na váhu ľavákov, potom populácia zahŕňa každého jednotlivca na Zemi, ktorý je ľavák. Ak ste ich všetky zvážili, použili by ste rozptyl populácie.
Samozrejme, v reálnom živote sa zvyčajne uspokojíme s menšou vzorkou z väčšej populácie. V takom prípade by ste použili vzorový rozptyl. Rozptyl populácie je stále praktický pri menších populáciách. Napríklad spoločnosť môže mať niekoľko stoviek alebo niekoľko tisíc zamestnancov s údajmi o každom zamestnancovi. Predstavujú „populáciu“ v štatistickom zmysle.
Výber správneho vzorca rozptylu
V Exceli sú tri vzorové vzorce rozptylu a tri vzorce rozptylu populácie:
- VAR , VAR.S a VARA pre rozptyl vzorky.
- VARP , VAR.P a VARPA pre rozptyl populácie.
VAR a VARP môžete ignorovať. Tieto sú zastarané a existujú len kvôli kompatibilite so staršími tabuľkami.
Zostávajú VAR.S a VAR.P, ktoré slúžia na výpočet rozptylu množiny číselných hodnôt, a VARA a VARPA, ktoré obsahujú textové reťazce.
VARA a VARPA skonvertujú akýkoľvek textový reťazec na číselnú hodnotu 0, s výnimkou „TRUE“ a „FALSE“. Tie sa prevedú na 1 a 0.
Najväčší rozdiel je v tom, že VAR.S a VAR.P preskočia akékoľvek nečíselné hodnoty. Tým sa tieto prípady vylúčia z celkového počtu hodnôt, čo znamená, že priemerná hodnota sa bude líšiť, pretože priemernú hodnotu vydelíte menším počtom prípadov.
Ako vypočítať rozptyl v Exceli
Všetko, čo potrebujete na výpočet rozptylu v Exceli, je súbor hodnôt. V nižšie uvedenom príklade použijeme VAR.S, ale vzorec a metódy sú úplne rovnaké bez ohľadu na to, ktorý vzorec rozptylu použijete:
- Za predpokladu, že máte pripravený rozsah alebo samostatnú množinu hodnôt, vyberte prázdnu bunku podľa vlastného výberu.
- Do poľa vzorca zadajte =VAR.S(XX:YY) , kde hodnoty X a Y budú nahradené prvým a posledným číslom buniek v rozsahu.
- Stlačte Enter na dokončenie výpočtu.
Prípadne môžete zadať konkrétne hodnoty, v takom prípade vzorec vyzerá ako =VAR.S(1,2,3,4) . S číslami nahradenými čímkoľvek, čo potrebujete na výpočet rozptylu. Takto môžete ručne zadať až 254 hodnôt, ale pokiaľ nemáte len niekoľko hodnôt, je takmer vždy lepšie zadať údaje do rozsahu buniek a potom použiť verziu rozsahu buniek vzorca, o ktorom sme hovorili vyššie.
Môžete excelovať v, Er, Excel
Výpočet rozptylu je užitočným trikom pre každého, kto potrebuje urobiť nejakú štatistickú prácu v Exceli. Ak je však niektorá z terminológií programu Excel, ktorú sme použili v tomto článku, mätúca, zvážte vyskúšanie kurzu Základy programu Microsoft Excel – Naučte sa používať Excel .
Ak ste na druhej strane pripravení na viac, pozrite si Pridanie trendovej čiary lineárnej regresie do grafu Excel Scatter Plot , aby ste si mohli vizualizovať rozptyl alebo akýkoľvek iný aspekt súboru údajov vo vzťahu k aritmetickému priemeru.