Taigi jūsų buvo paprašyta apskaičiuoti dispersiją naudojant „Excel“, bet nesate tikri, ką tai reiškia ir kaip tai padaryti. Nesijaudinkite, tai paprasta koncepcija ir dar paprastesnis procesas. Greitai būsite variacijos profesionalas!
Kas yra dispersija?
„Variantas“ yra būdas išmatuoti vidutinį atstumą nuo vidurkio. „Vidurkis“ yra visų duomenų rinkinio verčių suma, padalyta iš reikšmių skaičiaus. Variantas leidžia suprasti, ar to duomenų rinkinio reikšmės vidutiniškai vienodai prilimpa prie vidurkio, ar išsisklaido po visą vietą.
Matematiškai dispersija nėra tokia sudėtinga:
- Apskaičiuokite reikšmių aibės vidurkį. Norėdami apskaičiuoti vidurkį, paimkite visų reikšmių sumą, padalytą iš verčių skaičiaus.
- Paimkite kiekvieną savo rinkinio vertę ir atimkite ją iš vidurkio.
- Padėkite gautas reikšmes kvadratu (kad panaikintumėte neigiamus skaičius).
- Sudėkite visas kvadratines vertes kartu.
- Apskaičiuokite kvadratinių verčių vidurkį, kad gautumėte dispersiją.
Taigi, kaip matote, tai nėra sunku apskaičiuoti. Tačiau, jei turite šimtus ar tūkstančius reikšmių, tai užtruks amžinai, kad tai padarytumėte rankiniu būdu. Taigi gerai, kad „Excel“ gali automatizuoti procesą!
Kam naudojate dispersiją?
Pats dispersija turi daugybę naudojimo būdų. Žvelgiant vien iš statistinės perspektyvos, tai geras trumpas būdas išreikšti duomenų rinkinio paskirstymą. Investuotojai naudoja dispersiją, kad įvertintų tam tikros investicijos riziką.
Pavyzdžiui, įvertinę akcijų vertę per tam tikrą laikotarpį ir apskaičiavę jos dispersiją, gausite gerą supratimą apie jos kintamumą praeityje. Darant prielaidą, kad praeitis numato ateitį, tai reikštų, kad kažkas su maža dispersija yra saugesnis ir labiau nuspėjamas.
Taip pat galite palyginti kažkokius skirtumus skirtingais laikotarpiais. Tai gali padėti nustatyti, kada kitas paslėptas veiksnys daro įtaką kažkam, keičia jo dispersiją.
Variacija taip pat yra stipriai susijusi su kita statistika, žinoma kaip standartinis nuokrypis. Atminkite, kad vertės, naudojamos dispersijai apskaičiuoti, yra kvadratinės. Tai reiškia, kad dispersija neišreiškiama tuo pačiu pradinės vertės vienetu. Standartiniam nuokrypiui reikia paimti kvadratinę dispersijos šaknį, kad vertė būtų grąžinta į pradinį vienetą. Taigi, jei duomenys buvo kilogramais, tada standartinis nuokrypis taip pat yra.
Pasirinkimas tarp populiacijos ir imties dispersijos
„Excel“ yra du dispersijos potipiai su šiek tiek skirtingomis formulėmis. Kurį pasirinkti, priklauso nuo jūsų duomenų. Jei jūsų duomenys apima visą „populiaciją“, turėtumėte naudoti populiacijos dispersiją. Šiuo atveju „populiacija“ reiškia, kad jūs turite visas vertybes kiekvienam tikslinės gyventojų grupės nariui.
Pavyzdžiui, jei žiūrite į kairiarankių žmonių svorį, tada į populiaciją įeina kiekvienas kairiarankis žmogus Žemėje. Jei pasvėrėte juos visus, naudotumėte populiacijos dispersiją.
Žinoma, realiame gyvenime dažniausiai pasitenkiname mažesne imtimi iš didesnės populiacijos. Tokiu atveju turėtumėte naudoti imties dispersiją. Populiacijos dispersija vis dar praktiška mažesnėms populiacijoms. Pavyzdžiui, įmonėje gali būti keli šimtai ar keli tūkstančiai darbuotojų, turinčių duomenis apie kiekvieną darbuotoją. Jie atstovauja „populiacijai“ statistine prasme.
Tinkamos dispersijos formulės pasirinkimas
Programoje „Excel“ yra trys imties dispersijos formulės ir trys populiacijos dispersijos formulės:
- VAR , VAR.S ir VARA imties dispersijai.
- VARP , VAR.P ir VARPA populiacijos dispersijai.
Galite nepaisyti VAR ir VARP. Jos yra pasenusios ir skirtos tik suderinamumui su senomis skaičiuoklėmis.
Belieka VAR.S ir VAR.P, kurios skirtos skaitinių reikšmių rinkinio dispersijai apskaičiuoti, ir VARA ir VARPA, kurios apima teksto eilutes.
VARA ir VARPA konvertuos bet kurią teksto eilutę į skaitinę reikšmę 0, išskyrus „TRUE“ ir „FALSE“. Jie atitinkamai konvertuojami į 1 ir 0.
Didžiausias skirtumas yra tas, kad VAR.S ir VAR.P praleidžia visas neskaitines reikšmes. Tai reiškia, kad šie atvejai neįtraukiami į bendrą reikšmių skaičių, o tai reiškia, kad vidutinė reikšmė skirsis, nes padalijate iš mažesnio atvejų skaičiaus, kad gautumėte vidurkį.
Kaip apskaičiuoti dispersiją „Excel“.
Viskas, ko jums reikia norint apskaičiuoti dispersiją programoje „Excel“, yra reikšmių rinkinys. Toliau pateiktame pavyzdyje naudosime VAR.S, tačiau formulė ir metodai yra visiškai tokie patys, neatsižvelgiant į tai, kurią dispersijos formulę naudojate:
- Darant prielaidą, kad turite paruoštą diapazoną arba atskirą reikšmių rinkinį, pasirinkite tuščią pasirinktą langelį .
- Formulės lauke įveskite =VAR.S(XX:YY) , kur X ir Y reikšmės pakeičiamos pirmuoju ir paskutiniu diapazono langelių numeriais.
- Paspauskite Enter , kad užbaigtumėte skaičiavimą.
Arba galite nurodyti konkrečias reikšmes. Tokiu atveju formulė atrodo taip =VAR.S(1,2,3,4) . Skaičiai pakeičiami bet kokiais, kurių reikia dispersijai apskaičiuoti. Galite rankiniu būdu įvesti iki 254 reikšmių, tačiau, nebent turite tik keletą reikšmių, beveik visada geriau įvesti duomenis langelių diapazone ir tada naudoti pirmiau aptartos formulės langelių diapazono versiją.
Galite Excel adresu, Er, Excel
Dispersijos skaičiavimas yra naudingas triukas, kurį reikia žinoti visiems, kuriems reikia atlikti statistinį darbą „Excel“. Bet jei kuri nors iš šiame straipsnyje naudotų „Excel“ terminų buvo paini, apsvarstykite galimybę peržiūrėti „Microsoft Excel“ pagrindų mokymo programą – „Mokymasis naudotis Excel“ .
Kita vertus, jei esate pasirengęs daugiau, peržiūrėkite linijinės regresijos tendencijos linijos pridėjimą prie Excel sklaidos diagramos , kad galėtumėte vizualizuoti dispersiją ar bet kurį kitą duomenų rinkinio aspektą, palyginti su aritmetiniu vidurkiu.
Ar galima nepaisyti dispersijos?
Sklaida yra viena iš naudingiausių tikimybių teorijos ir statistikos įrankių. Jis naudojamas duomenų rinkinio kintamumui matuoti. Tačiau statistikoje dispersijos negalima ignoruoti, nes ji padeda įvertinti duomenų kintamumą ir padaryti svarbias išvadas apie kintamųjų ryšį. Jei nepaisysite dispersijos, galite praleisti svarbią informaciją apie savo duomenis ir gauti klaidinančių rezultatų. Taigi geriausia neignoruoti statistikos skirtumų.