Kaip rasti liekamuosius skirtumus programoje „Excel“

Turinys:

Anonim

Statistinėje analizėje dispersijos tarp duomenų rinkinio narių rodo, kaip toli nuo duomenų taškų yra tendencijos linija, taip pat žinoma kaip a regresijos linija. Kuo didesnė dispersija, tuo daugiau yra duomenų taškų. Dispersijos analizės tyrimas rodo, kurios dispersijos dalys gali būti paaiškintos duomenų charakteristikomis ir kurios gali būti siejamos su atsitiktiniais veiksniais. Dispersijos dalis, kurios negalima paaiškinti, vadinama likutine dispersija.

Naudojant „Excel“ skaičiuokles apskaičiuoti likutinę dispersiją

Likusios dispersijos apskaičiavimo formulė apima daug sudėtingų skaičiavimų. Mažų duomenų rinkinių atveju likučio dispersijos apskaičiavimo procesas gali būti varginantis. Dideliems duomenų rinkiniams užduotis gali būti varginantis. Naudodami „Excel“ skaičiuoklę, turite įvesti tik duomenų taškus ir pasirinkti tinkamą formulę. Programa tvarko sudėtingus skaičiavimus ir greitai pateikia rezultatą.

Duomenų taškai

Atidarykite naują „Excel“ skaičiuoklę ir įveskite duomenų taškus į dvi stulpelius. Regresijos linijos reikalauja, kad kiekviename duomenų taške būtų du elementai. Statistikai paprastai žymi šiuos elementus „X“ ir „Y“. Pavyzdžiui, „Generic Insurance Co“ nori rasti likutinį savo darbuotojų aukščio ir svorio skirtumą. X kintamasis reiškia aukštį ir Y kintamasis reiškia svorį. Įveskite aukščius į stulpelį A ir svorius į B stulpelį.

Rasti vidurkį

The reiškia reiškia kiekvieno duomenų rinkinio elemento vidurkį. Šiame pavyzdyje „Generic Insurance“ nori rasti vidutinį, standartinį nuokrypį ir kovariaciją, kurią sudaro 10 darbuotojų aukščiai ir svoriai. A stulpelyje išvardytų aukščių vidurkį galima rasti įvedant funkciją "= AVERAGE (A1: A10)" į F1 langelį. B stulpelyje išvardytų svorių vidurkį galima rasti įvedant funkciją "= AVERAGE (B1: B10)" į F3 langelį.

Standartinis nuokrypis ir kovariacija

The standartinis nuokrypis matuoja, kaip toli nuo duomenų taškų skiriasi nuo vidurkio. The kovariacija matuoja, kiek du duomenų taško elementai keičiasi kartu. Aukščio standartinis nuokrypis nustatomas įvedant funkciją "= STDEV (A1: A10)" į F2 langelį. Standartinis svorio nuokrypis nustatomas įvedant funkciją "= STDEV (B1: B10)" į F4 langelį. Kovarijus tarp aukščių ir svorių randamas įvedant funkciją "= COVAR (A1: A10; B1: B10)" į langelį F5.

Rasti regresijos liniją

The regresijos linija reiškia linijinę funkciją, kuri atitinka duomenų taškų tendencijas. Regresijos linijos formulė atrodo taip: Y = aX + b.

Naudotojas gali rasti „a“ ir „b“ reikšmes naudodamas priemonių, standartinių nuokrypių ir kovariacijos skaičiavimus. „B“ reikšmė reiškia tašką, kuriame regresijos linija perima Y ašį. Vertę galima rasti paimant kovariaciją ir padalijus jį iš X-verčių standartinio nuokrypio kvadrato. „Excel“ formulė patenka į langelį F6 ir atrodo taip: = F5 / F2 ^ 2.

„A“ reikšmė reiškia regresijos linijos nuolydį. „Excel“ formulė patenka į langelį F7 ir atrodo taip: = F3-F6 * F1.

Norėdami matyti regresijos eilutės formulę, įveskite šią eilutę susieti į ląstelę F8:

= CONCATENATE ("Y ="; ROUND (F6; 2); "X"; IF (SIGN (F7) = 1; "+"; "-"); ABS (ROUND (F7; 2)))

Apskaičiuokite Y reikšmes

Kitas žingsnis apima Y reikšmių skaičiavimą duomenų rinkinyje esančių X reikšmių regresijos eilutėje. Formulė, skirta rasti Y reikšmes, eina į C stulpelį ir atrodo taip:

= $ F $ 6 * A (i) + $ F $ 7

Kai A (i) yra i stulpelio A stulpelio vertė. Formulės atrodo skaičiuoklėje:

= $ F $ 6 * A1 + $ F $ 7

= $ F $ 6 * A2 + $ F $ 7

= $ F $ 6 * A3 + $ F $ 7 ir pan

D stulpelio įrašai rodo skirtumus tarp numatomų ir faktinių Y vertės. Formulės atrodo taip:

= B (i) -C (i), Kai B (i) ir C (i) yra atitinkamai B ir C stulpelių (i) eilutės vertės.

Likutinės dispersijos nustatymas

The likučio dispersijos formulė eina į langelį F9 ir atrodo taip:

= SUMSQ (D1: D10) / (COUNT (D1: D10) -2)

Kai SUMSQ (D1: D10) yra skirtumų tarp faktinių ir laukiamų Y reikšmių kvadratų suma, ir (COUNT (D1: D10) -2) yra duomenų taškų skaičius, atėmus 2 laisvės laipsniais. duomenis.