Kai surinkote duomenis apie savo sistemą ar procesą, kitas žingsnis yra nustatyti, kokio tipo tikimybių pasiskirstymas yra. Tikimybių pasiskirstymo tipai yra: diskretinė vienoda, Bernulli, binominė, neigiama binominė, Poisson, geometrinė, nuolatinė vienoda, normalioji (varpinė kreivė), eksponentinė, gama ir beta pasiskirstymas. Kai kurių galimybių susiaurinimas iš galimybių sąrašo leidžia nustatyti, kuri yra artimiausia R kvadrato vertė daug greičiau.
Elementai, kurių jums reikės
-
Grafikos programinė įranga
-
R kvadratinės vertės apskaičiavimo priemonės (geriausia pritaikymo analizė)
Skaičiuokite duomenis, kad būtų galima vizualiai parodyti duomenų tipą.
Vienas iš pirmųjų žingsnių nustatant, koks duomenų paskirstymas yra - ir tokiu būdu duomenų modeliavimui naudojamas lygties tipas - yra tai, kas negali būti. • Jei duomenų rinkinyje yra kokių nors smailių, jis negali būti atskiras vienodas paskirstymas. • Jei duomenys turi daugiau nei vieną smailę, tai nėra „Poisson“ ar „binominis“. • Jei ji turi vieną kreivę, jokios antrinės smailės, ir kiekvienoje pusėje yra lėtas šlaitas, tai gali būti „Poisson“ arba „gamma“ pasiskirstymas. Tačiau tai negali būti atskiras vienodas paskirstymas. • Jei duomenys yra tolygiai pasiskirstę ir nėra vienoje pusėje nukreipti, saugu atmesti gama ar Weibull pasiskirstymą. • Jei funkcija turi tolygų pasiskirstymą arba grafiko rezultatų viduryje smailę, tai nėra geometrinis pasiskirstymas ar eksponentinis pasiskirstymas. • Jei veiksnio atsiradimas kinta priklausomai nuo aplinkos kintamojo, tai tikriausiai nėra „Poisson“ pasiskirstymas.
Sumažinus tikimybės pasiskirstymo tipą, atlikite kiekvienos galimos tikimybės pasiskirstymo rūšies R kvadratinę analizę. Viena, turinti didžiausią R kvadratinę vertę, greičiausiai yra teisinga.
Pašalinkite vieną išskirtinį duomenų tašką. Tada perskaičiuokite R kvadratą. Jei toks pats tikimybės pasiskirstymo tipas atsiranda kaip artimiausias atitikmuo, tuomet yra didelis pasitikėjimas, kad tai yra teisingas tikimybės pasiskirstymas, naudojamas duomenų rinkiniui.
Patarimai
-
Jei duomenys rodo daugybę smailių, gali būti, kad vyksta du atskiri procesai arba produktas, iš kurio imamas mėginys, yra sumaišytas. Atminkite duomenis ir tada iš naujo išanalizuokite.
Įspėjimas
Patvirtinkite gautas lygtis su vėlesniais duomenų rinkiniais, kad patvirtintumėte, kad ji vis dar yra tiksli duomenų rinkiniui. Gali būti, kad aplinkos veiksniai ir proceso dreifas padarė dabartines lygtis ir modelius neteisingus.