Kaip apskaičiuoti statistikos dispersiją

Turinys:

Anonim

Viena iš pagrindinių statistikos sąvokų yra vidurkis, arba aritmetinis vidurkis, skaičių. Vidutinis reiškia duomenų rinkinio centrinę vertę. The dispersijos duomenų rinkinio matavimai rodo, kiek šio duomenų rinkinio elementai yra išskirstyti iš vidurkio. Duomenų rinkiniai, kuriuose visi numeriai yra arti vidurkio, turi mažą dispersiją. Tie rinkiniai, kuriuose numeriai yra daug didesni arba mažesni už vidutinę, turės didelį dispersiją.

Apskaičiuokite duomenų rinkinio vidurkį

Apskaičiuokite kvadratinius skirtumus

Kitas žingsnis apima skirtumą tarp kiekvieno duomenų rinkinio elemento ir vidurkio. Kadangi kai kurie elementai bus didesni už vidurkį, o kai kurie bus mažesni, dispersijos apskaičiavimas naudoja skirtumų kvadratą.

1 diena Pardavimai - vidutinė pardavimo apimtis: 62 000 JAV dolerių - 65414,29 doleriai = (- $ 3,414.29); (-3,414,29)2 = 11,657,346.94

2 diena Pardavimai - vidutinė pardavimų suma: 64 800 JAV dolerių - 65414,29 $ = (- $ 614.29); (-614.29)2 = 377,346.94

3 diena Pardavimai - vidutinis pardavimas: $ 62,600 - $ 65414.29 = (- $ 2,814.29); (-2,814,29)2 = 7,920,204.08

4 diena Pardavimai - vidutinė pardavimų suma: 69 200 USD - 65414,29 $ = (+ $ 3,785.71); (+3,785,71)2 = 14,331,632.65

5 diena Pardavimai - vidutinė pardavimo suma: 66 000 JAV dolerių - 65414,29 doleriai = (+ $ 585,71); (+585.71)2 = 343,061.22

6 diena Pardavimai - vidutinė pardavimo kaina: 63,900 USD - 65414,29 $ = (- - $ 1514.29); (-1,514,29)2 = 2,293,061.22

7 diena Pardavimai - vidutinė pardavimų suma: 69 400 JAV dolerių - 65414,29 doleriai = (+ $ 3,985.71); (+3,985,71)2 = 15,885,918.37

PASTABA: Kvadratiniai skirtumai nėra matuojami doleriais. Šie skaičiai naudojami kitame etape apskaičiuojant dispersiją.

Skirtumas ir standartinis nuokrypis

Dispersija yra apibrėžiama kaip kvadratinių skirtumų vidurkis.

11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43

52,808,571.43/7 = 7,544,081.63

Kadangi dispersija naudoja skirtumo kvadratą, dispersijos kvadratinė šaknis suteiks aiškesnį faktinio sklaidos rodiklį. Statistikoje dispersijos kvadratinė šaknis yra vadinama standartinis nuokrypis.

SQRT (7,544,081,63) = 2,746,65 USD

Skirtumai ir standartinis nuokrypis

Tiek dispersijos, tiek standartiniai nuokrypiai yra labai naudingi statistinei analizei. Dispersija matuoja bendrą duomenų grupės sklaidą iš vidurkio. Standartinis nuokrypis padeda aptikti nuokrypiaiarba duomenų rinkinio elementai, kurie pernelyg nutolę nuo vidurkio.

Pirmiau pateiktuose duomenyse dispersija yra gana didelė, o tik dvi dienos pardavimų sumos pasiekia 1 000 USD vidurkio. Duomenų rinkinys taip pat rodo, kad du iš septynių kasdienių pardavimų sumų yra daugiau nei vienas standartinis nuokrypis virš vidutinio, o du kiti - daugiau nei vienas standartinis nuokrypis žemiau vidurkio.