Minden parametrikus statisztikai módszer intervallumskálával működik, ellentétben a nem paraméteres módszerekkel, amelyek elsősorban az első két skálára koncentrálnak. Magyarázzuk meg az e módszerek közötti különbségeket.
A legtöbb statisztikai módszer figyelembevételekor feltételezzük, hogy a kérdéses megfigyelések egy intervallumskálán vannak kifejezve, és egy olyan valószínűségi változó realizációi, amelynek eloszlása valamely paraméteres eloszláscsaládhoz tartozik. Például egy valószínűségi változó normál, Poisson vagy más eloszlású. Vagyis feltételezzük, hogy az eloszlás alakja ismert, például feltételezhetünk egy normálist N (μ, δ ) modell, de ismeretlen paraméterekkel μ és δ . A becslési és hipotézisvizsgálati módszerek lehetővé teszik ismeretlen paraméterekre vonatkozó következtetések levonását, míg az esetleges következtetések értékének bizonyos mértékig függnie kell a parametrikus családra vonatkozó kiindulási feltevés megfelelőségétől, vagyis az eloszlás alakjától. Vannak azonban olyan valószínűségi változók, amelyek nem követik a közös eloszlási formákat. Ebből következően a parametrikus eloszlásokra kidolgozott matematikai módszerek nem alkalmazhatók rájuk. Ezért az ilyen jellemzőkre speciális matematikai modelleket fejlesztettek ki, amelyeket nem paraméteresnek vagy eloszlásmentesnek neveznek.
Így a statisztikai módszerek két csoportja különböztethető meg: a parametrikus és a nemparametrikus.
A parametrikus módszerek előnye, hogy van egy jól kidolgozott matematikai apparátus számukra. Ezeknek a módszereknek az alkalmazása azonban többek között nagy mintamérettel jár. A kvantitatív jellemzőkre paraméteres módszereket használnak.
A nominális és rangváltozók elemzéséhez csak nem-paraméteres módszereket alkalmazunk, amelyek nem igényelnek előzetes feltételezéseket az eredeti eloszlás formájára vonatkozóan. Ez az ő érdemük. De van egy hátránya is - csökken az ún. teljesítmény (érzékenység a tárgyi különbségekre). Ezt magyarázzuk el.
Emlékezzünk vissza, hogy a kísérlet eredményeinek elemzése előtt a kutató két egymást kizáró hipotézist állít fel. Az egyik egy statisztikai hipotézis, amelyet a kutató általában el kíván utasítani (az ún. nullhipotézis H 0: például a vizsgált fajták termésben nem különböznek egymástól). Alternatív hipotézis ( H 1) hatékonyan tagadja a nullhipotézist. Az alternatív hipotézis általában a kutató által megfogalmazott feltételezéseket tartalmazza (vannak eltérések).
A statisztikai elemzési hibáknak két típusa van. I. típusú hiba (hiba α – típus): a nullhipotézist elvetik, ami valójában igaz. II típusú hiba (hiba β – típus): elfogadjuk a nullhipotézist, ami valójában hamis.
Egy statisztikai kritérium (módszer) ereje vagy érzékenysége annak a valószínűsége, hogy alkalmazása eredményeként a helyes döntés születik ( H 1) valóban hamis nullhipotézis mellett. A teszt ereje függ a minta méretétől, a szignifikancia szintjétől, a null- és alternatív hipotézis fókuszától, a kísérleti adatok megbízhatóságától, a műszerektől és magától a statisztikai módszertől. Egyenlő feltételek mellett a parametrikus módszerek erősebbek, mint a nem paraméteresek. De a nemparaméteres módszerek ereje a minta méretének növekedésével növekszik.
Minden skálatípusnak megvan a maga statisztikai technikája. A névleges skálákhoz gyakran használják a χ 2 (khi-négyzet) tesztet. Sorrendi skálákhoz - rangsor statisztika. Az intervallum skálákhoz - a statisztikai kritériumok teljes arzenálja.
Algoritmusok és példák nemparaméteres kritériumok kiszámítására.
Kérdések a nem paraméteres kritériumokkal kapcsolatban.
Statisztikai kritérium - olyan döntési szabály, amely nagy valószínűséggel biztosítja az igaz hipotézis elfogadását és a hamis hipotézis elutasítását, ugyanakkor a statisztikai kritérium egy bizonyos szám és maga ennek a számnak a kiszámítására szolgáló módszer.
Paraméteres kritériumokat használunk, ha a minta normál, míg az ezekben a kritériumokban végzett számítások a jellemző valószínűségi eloszlásának jellemzőit, azaz az átlagokat és a szórást tartalmazzák. Ez azt feltételezi, hogy az adatok folyamatosak. A paraméteres tesztek a következők: Student-féle t-próba, khi-négyzet teszt. Alkalmas intervallumarány-skálákhoz.
A nem paraméteres teszteket akkor használjuk, ha nem lehet normális eloszlásról beszélni, a tesztek rangokkal vagy frekvenciákkal való műveleteken alapulnak. A nem paraméteresek közé tartozik az előjel-teszt, a Wilcoxon-teszt, a Mann-Whitney-teszt és a Jonkheer-teszt. Alkalmas az intervallumskáláknál gyengébb skálákhoz.
Kritérium kiválasztása előtt ellenőriznünk kell a minta normálisságát.
Fogalmam sincs, mit írjak az átlag és szóródás mértékére, mert láthatóan ugyanazok a fogalmak léteznek, mint a szóródás és a bla-bla egyebek *_*
2. Statisztikai hipotézisek tesztelésének módszerei: t-próba, Wilcoxon teszt, Mann-Whitney teszt, Kruskal-Wallace teszt (alkalmazási feltételek, hipotézisek megfogalmazása, statisztikák eloszlása, számítási elképzelés)
t-teszt (Student) – akkor használjuk, ha a minta normális. A hipotézisek a következőképpen fogalmazódnak meg:
1. H0 megfogalmazódik
2. H1 van megfogalmazva, alternatíva H0 (általában jellemzők kölcsönhatását jelzi).
3. Egy statisztikát választunk ki két hipotézis közül
4. Minden α szignifikanciaszinthez meghatározunk egy kritikus tartományt, ahol a) az ebbe a tartományba eső eredmény inkább H1-et jelöl, mint H0-t b) annak valószínűsége, hogy az eredmény ebbe a tartományba esik H0 igaz esetén, egyenlő α-val.
Az első típusú elfogadható hiba valószínűsége α=0,05, ha mintánkban a kritérium értéke nagyobb, mint t 0,05, akkor a H0 hipotézist elfogadjuk, a H1 hipotézist elvetjük.
Egy mintára
Független mintákhoz.
A Wilcoxon előjeles rangteszt nem a mintában szereplő számok értékét veszi figyelembe, hanem csak az előjeleiket. A kritérium figyelembe veszi a mintatagok abszolút értékét. Akkor használatos, ha a minta esetleg nem normális, és amikor el kell dönteni, hogy a minta értéke jelentősen nem nulla. A jelentkezéshez szükséges:
1) Állítsa be az α szignifikancia szintet, és keresse meg a megfelelő alsó Wilcoxon-kvantilist.
2) Rendezd a minta összes tagját abszolút érték szerint növekvő sorrendbe, írd alá a rangsorokat!
3) Számítsuk ki a Wilcoxon statisztikát, amelyhez kiszámítjuk a minta negatív tagjaihoz rendelt rangok összegét!
4) Hasonlítsa össze a kapott statisztikát a korábban talált kvantissel! Ha ez a rangok összege kisebb, mint az alsó kvantilis, akkor elvetjük a H0 hipotézist, és elfogadjuk a H1 hipotézist. Hasonlóképpen, ha az összes pozitív mintatag rangjainak összege nagyobb, mint a felső kvantilis, elfogadjuk H1-et és elutasítjuk H0-t.
A Mann-Whitney teszt (U) független minták tesztje, a Student-féle t-teszt analógja. Az empirikus értéke megmutatja, hogy az attribútumértékek két sora hogyan esik egybe. Akkor használjuk, ha a minta esetleg nem normális, csak az eloszlások hasonlóságának követelménye érvényesül, de nem kell normálisnak lenniük + amikor a probléma megoldásához szükséges, lehet ezt állítani. Hogy a kísérleti minta átlagértéke szignifikánsan magasabb, mint a kontrollcsoport átlagértéke.
1) Mindkét minta tagjait felírjuk növekvő sorrendben, különböző módon kiemelve a különböző minták tagjait.
2) Az első (kontroll) minta minden egyes számához kiszámoljuk, hogy a második (kísérleti) mintából hány darab található tőle balra. Ha az első minta száma megegyezik a második számával, akkor adjunk hozzá 0,5-öt. Konzisztens eredményeket kapunk, és összeadjuk őket.
3) Megnézzük azt a szignifikancia szintet, amelyet az alsó kvantishez választottunk Mann-Whitney szerint. Ha az általunk kapott összeg kisebb, mint az alsó kvantilis, akkor a H0 hipotézist elvetjük, a H1 hipotézist elfogadjuk.
A Mann-Whitney eloszlás szimmetrikus (azaz visszafelé számolhat és használhatja a felső kvantilist).
A Kruskal-Wallace teszt a független minták egyirányú varianciaanalízisének nem-paraméteres analógja. Hasonló a Mann-Whitney teszthez. Felméri a megváltozott jellemző több értéksorának egybeesésének mértékét. A fő ötlet az, hogy az összehasonlított minták összes értékét a rangsorolt értékek közös sorozataként mutassuk be, majd az egyes minták átlagos rangját kiszámítjuk.
A rangsorolás után számítva.
N az összes minta száma.
k az összehasonlított minták száma.
R i egy adott minta rangsorainak összege.
n i – mintanagyság i.
Minél jobban különböznek a minták, annál nagyobb a H számítási értéke, annál alacsonyabb a p-szignifikancia szint. A nullstatisztikai hipotézis elutasítása esetén egy alternatívát fogadunk el a statisztikailag szignifikáns különbségekről, anélkül, hogy meghatároznánk a különbségek irányát. (az irányhoz a Mann-Whitney teszt kell, mert ez két mintára szól, ez pedig kettőnél többre).
Statisztikai skálák
Kutatási adatok statisztikai feldolgozása
A pszichológiai kutatási anyagok feldolgozása során statisztikai adatokat használnak fel annak érdekében, hogy a kísérlet során nyert kvantitatív adatokból minél több hasznos információt nyerjenek ki.
Egyes statisztikai módszerek alkalmazását az határozza meg, hogy a beérkezett anyag melyik statisztikai skálához tartozik.
Név skála. Ez a skála olyan anyagokat tartalmaz, amelyekben a vizsgált tárgyak minőségükben különböznek egymástól, és a sorrend nem fontos. Például a konferencia résztvevőinek elosztása. Az ilyen anyagok statisztikai feldolgozása során figyelembe kell venni, hogy az egyes objektumok hány egységet ábrázolnak.
Rendelési mérleg. Az objektumok sorrendje a fókusz. Ez a statisztikai skála olyan kutatási anyagokat tartalmaz, amelyekben egy vagy több osztályba tartozó tárgyakat figyelembe kell venni, de különböznek egymástól: több - kevesebb, magasabb - alacsonyabb stb.
A sorrendi skála jellemző vonásait úgy lehet legkönnyebben megmutatni, ha megnézzük bármelyik sportverseny eredményét. Sorrendben felsorolják azokat a résztvevőket, akik az első, második, harmadik és egyéb pozíciókat foglalták el.
helyezési sorrendben, és a sportolók tényleges teljesítményére vonatkozó információk háttérbe szorulnak, vagy hiányoznak.
Intervallum skála. Ide tartoznak azok az anyagok, amelyekben a vizsgált tárgy mennyiségi értékelését rögzített egységekben adják meg. Az intervallumskálának megfelelő anyagoknak minden ismételt mérésnél azonos mértékegységgel kell rendelkezniük.
Kapcsolati skála. Ez a skála olyan anyagokat tartalmaz, amelyek nem csak a rögzített egységek számát veszik figyelembe , mint az intervallumok skáláján, hanem a kapott összesített eredmények egymás közötti arányait is. Ahhoz, hogy ilyen kapcsolatokkal dolgozhasson, rendelkeznie kell egy abszolút ponttal, ahonnan a visszaszámlálás történik.
Ha a kutató rendelkezésére álló adatok közelebbről megvizsgálva csak kismértékben térnek el a Gauss-féle normális eloszlási görbétől, akkor ez feljogosítja a kutatót arra, hogy a statisztikai feldolgozás során paraméteres módszereket alkalmazzon, amelyek kezdeti rendelkezései a Gauss-féle normál eloszlási görbén alapulnak. . A normális eloszlást parametrikusnak nevezzük, mert a Gauss-görbe megszerkesztéséhez és elemzéséhez elegendő csak két paraméter megadása: a számtani középérték, amelynek értékének meg kell felelnie a görbe középpontjában helyreállított merőleges magasságának, és a ún. négyzetgyök, vagy szórás, egy érték, amely a görbe ingadozási tartományát jellemzi.
Ha nem lehet parametrikus módszereket alkalmazni, akkor a nem paraméteres módszerekhez kell fordulni.
A matematikai statisztika főbb módszereit - eloszlási paraméterek becslése, statisztikai hipotézisek tesztelése, varianciaanalízis - az általános sokaság eloszlásának ismeretében alkalmazzuk. A két populáció átlagának összehasonlítására szolgáló t-próba és több sokaság átlagának összehasonlítására szolgáló egyirányú varianciaanalízis csak akkor hasznos, ha az utóbbiak normális eloszlásúak. Azonban gyakran vannak olyan adatok, amelyekre ezek a feltételezések nem érvényesülnek. Például a szociológiai felmérések eredményei általában "igen" vagy "nem" válaszok formájában jelennek meg, és táblázatok formájában mutatják be, amelyek a pozitív és negatív válaszok gyakoriságát tartalmazzák. A matematikai statisztika hagyományos módszerei nem használhatók ilyen adatok feldolgozására. Ezekben az esetekben nemparaméteres módszerekhez kell fordulni, pl. a népesség eloszlásától nem függő módszerek.
Nem paraméteres módszereket használnak a nominális skálán bemutatott kvalitatív adatokhoz, az ordinális skálán mért adatokhoz (azaz rangsorokban), valamint a kvantitatív adatokhoz, amikor a sokaság megoszlása nem határozható meg, mert a minta kicsi, vagy ha az eloszlás nem indokolt. lenni
normál törvény és parametrikus módszerek nem alkalmazhatók.
A STATISTICA csomagban nem paraméteres
.4.1. ábra. Nonpametrics/Distrib modul indítópultja
eljárások végrehajtása a modulban történik
Nonpametrics/Distrib. A modul indítópanelje a 4.1. ábrán látható.
Írjuk le egymás után a megfelelő módszereket
és példákat adunk az eljárásokra.
NÁL NÉL a Nonpametrics/Distrib modul nagyszámú eljárást tartalmaz. Egy adott probléma megoldása során egy konkrét módszert kell választani. Az ilyen választáshoz segítséget nyújthat a nem paraméteres módszerek alábbi osztályozása, amelyekkel tesztelték azt a hipotézist, hogy az elemzett adatok homogén általános populációkból származó minták. Megjegyzendő, hogy az általános populációk homogenitásának fogalma meglehetősen tágan értelmezhető: ezek lehetnek általános populációk, amelyek azonosak.
4) a statisztikai függőség mértékei: Spearman rangkorrelációs együtthatója, Kendall τ korrelációs együtthatója.
2. Kiindulási adatok: k független minta térfogattal
n 1 , n 2 , …, n k .
1) egyirányú Kruskal varianciaanalízis
Wallis.
2) medián kritérium.
3. Kiindulási adatok: kötetenként két kapcsolódó minta n.
Ellenőrzött hipotézis H 0: a minták homogén általános populációkba tartoznak.
1) a jelek kritériuma;
2) Wilcoxon-kritérium.
4. Kiinduló adatok: k összekötött n méretű minta.
Ellenőrzött hipotézis H 0: a minták homogén általános populációkba tartoznak.
1) Friedman egyváltozós elemzése;
2) a kapcsolat mértéke – Kendall konkordancia együtthatója.
5. Kapcsolódó minták, névleges skálán mérve.
5a) Kiindulási adatok: két összefüggő minta az X és Y változók n térfogatából, amelyek mindegyike
elfogadja | értékeket | ||||
Módszer: McNimar-teszt.
5b) Kiindulási adatok: két összefüggő minta n változó X 1 ,X 2 , ...,X k térfogatából, amelyek mindegyike két értéket vesz fel.
Vizsgálandó hipotézis H 0 : az expozíciónak nincs hatása.
Módszer: Cochran-teszt.
6. Névleges skálán mért független minták.
6a) Kiindulási adatok: két valószínűségi változó mintája
X és Y , amelyek mindegyike két értéket vesz fel.
A tesztelt H 0 :X és Y hipotézis függetlenek Módszer: a kontingenciatábla elemzése 2 × 2
(Fisher-féle egzakt teszt, χ 2 teszt).
6b) Kiindulási adatok: k valószínűségi változó mintája, amelyek mindegyike értéket vesz fel.
Ellenőrzött H 0 hipotézis: a mintákat egy általános populációból vettük.
Módszer: a k × r kontingenciatábla elemzése (χ 2 kritérium). Az ilyen táblázatok elemzését a
4.1. 2 × 2 kontingencia táblázat, χ 2 statisztika, φ, McNimar teszt, Fisher egzakt teszt (2 × 2 táblázat
Xi/Vi/Phi, McNemar, Fisher pontos)
A 2×2-es kontingenciatábla két X és Y valószínűségi változó gyakoriságát rögzíti, amelyek mindegyike két értéket vesz fel: 0 és 1, igen és nem, és így tovább.
4.1. példa. A különböző nemű nézők televíziós műsorokhoz való hozzáállásának meghatározására 60 embert kérdeztek meg: 35 férfit és 25 nőt. Kiderült, hogy 25 férfi helyeselte és 10 helytelenítette a programot. Ugyanakkor 16 nő fejezi ki negatív hozzáállását a programhoz, 9 pedig pozitív hozzáállását.
Tudja meg, hogy a műsorhoz való hozzáállás függ-e a nézők nemétől.
Megoldás. Az adatok egy 2 × 2 kontingenciatábla formájában írhatók fel:
Az átvitelhez való viszony | ||||||||
Formálisan a két vizsgált jellemző X (gender) és Y (transzmissziós kapcsolat) függetlenségének meghatározása a feladat, vagy a H 0 nullhipotézis tesztelése: a transzmisszióhoz való viszonyulás nem függ.
nemtől a H 1 alternatív hipotézis szerint: viszonyulás
átvitel a nemtől függ.
Az egyenértékű készítmény a következő. Vegyünk két mintát: 35 férfi és 25 nő. A H 0 nullhipotézist teszteljük: az áthelyezést jóváhagyó férfiak aránya (p 1 ) megegyezik a jóváhagyó nők arányával.
transzmisszió (p 2 ), a H 1 : részvények alternatív hipotézise alapján
Az átvitelt jóváhagyó férfiak és nők nem egyenlőek. A nullhipotézis két általános sokaság p 1 és 2 paramétereinek egyenlőségére vonatkozó hipotézis.
binomiális eloszlás.
Egy hipotézis tesztelésére H 0 Fisher-kritérium érvényes , amely lehetővé teszi a megfigyelt eredmények és kimenetelek pontos valószínűségének kiszámítását szélsőségesebb eloszlással (lásd , 345. o.). Egyoldalú(egyfarkú) és kétoldali (kétfarkú ) szignifikanciaszinteket p a Fisher-kritériumhoz ( Fisher pontos p ). 2×2.
Ha a minta mérete n ³ 30, a χ 2 teszt kevésbé időigényes eljárás. Hogy tisztázzuk
A szükséges számítások elvégzéséhez a 2 × 2 kontingenciatáblázatot a következő formában írjuk:
Az átvitelhez való viszony | ||||||||||||
n 11= a | n1* = a + b | |||||||||||
n 21= c | n2* = c+ d | |||||||||||
n = a + c | n = b + d | n = a + b + c + d | ||||||||||
oszlopok | ||||||||||||
Ebben a példában ez a táblázat így néz ki:
Az átvitelhez való viszony | |||||||||||
oszlopok | |||||||||||
Kritérium statisztika c 2 | közötti különbséget használja |
megfigyelt gyakoriságok a , b , c , d és várható gyakoriságok a 0 , b 0 , c 0 , d 0 , azzal a feltétellel számítva, hogy a H 0 hipotézis igaz:
a 0 \u003d (a + b) (a + c) = 35 × 34 "19,83; n 60
b 0 \u003d (a + b) n (b + d) = 35 60 × 26 "15,17;
c 0 \u003d (c + d) (a + c) = 25 × 34 "14,17; n60
d 0 \u003d (c + d) n (b + d) \u003d 25 60 × 26 "10,83.
A c statisztika mintaértéke 2-ben a következő képlettel számítható ki:
(a-a | (b-b | (c-c | (d-d | n(ad-bc) 2 |
|||||||||
(a+b)(c+d)(a+c)(b+d) |
|||||||||||||
Ahogy n → ∞, a c statisztika 2-ben c 2 eloszlású egy szabadságfokkal. Ha a várható gyakoriságok ≤ 5 , akkor a c statisztika mintaértéke 2-nél Yates folytonossági korrekciójával kerül kiszámításra:
c2 =( | a - a0 | 0,5) 2 | b-b0 | 0,5) 2 | c-c0 | 0,5) 2 | d - d0 | 0,5) |
||||||||||||||||||||
nç ad-bc- | ||||||||||||||||||||||||||||
(a+b) (c+d) (a+c)(b+d) | ||||||||||||||||||||||||||||
A H 0 hipotézist α szignifikancia szinten fogadjuk el, |
||||||||||||||||||||||||||||
ha c 2< c 2 | (1) , ahol c 2 | Eloszlási kvantilis c 2 |
||||||||||||||||||||||||||
egy sorrendi szabadságfokkal 1 – α. | ||||||||||||||||||||||||||||
szelektív | jelentése |
|||||||||||||||||||||||||||
c in 2 = 7,45, | módosítása szerint | Yates c a 2-ben \u003d 6,08. | ||||||||||||||||||||||||||
c 0,95 2 (1) = 3,84 | (jelölje be | segítségével | statisztikai |
|||||||||||||||||||||||||
számológép!) és c-től 2-ig< 3,84 , то гипотезаH 0 отклоняется: на |
||||||||||||||||||||||||||||
jelentőség |
Az átvitelhez való hozzáállás a nemtől függ.
Ugyanezt az eredményt kapjuk, ha beírjuk az adatokat a STATISTICA csomag megfelelő eljárásába. Az eredmények táblázatát a 4.2. ábra mutatja.
.4.2. ábra. Eljárás eredménye 2×2 táblázat…
P-értékek χ 2 statisztikához, χ 2 statisztikához,
Yates által korrigált és Fisher-féle egzakt teszt a kétoldali teszteléshez rendre 0,0063; 0,0137 és 0,0087. Így α = 0,05 szignifikancia szinten a H 0 hipotézist elvetjük. Az eredménytábla a változók közötti asszociáció mértékét adja meg
X és Y - együttható phi-négyzet (átlagos kontingencia együttható):
ϕ2 =χ 2-ben = 0,124. n
A ϕ 2 értéke 0-ról változik (a változók között
nincs függőség) 1-ig (a változók között abszolút függés van, azaz minden frekvencia a táblázat 2 × 2 átlóján található).
McNimar szignifikancia tesztje
akkor érvényes, ha a forrásadat két összefüggő minta. Ugyanazon a tárgyon vagy egyénen két megfigyelést végeznek: az egyiket valamilyen expozíció előtt, a másikat valamilyen expozíció (gyógyszeres kezelés, képzés, reklámkampány stb.) után.
A kísérleti adatok feldolgozásának paraméteres módszerei azon az alapvető tényen alapulnak, miszerint a kísérleti vizsgálatok eredményeinek véletlenszerű objektumnak tekintett tulajdonságait valamilyen eloszlási törvény írja le. Feltételezzük, hogy a kísérleti adatok elemzése lehetővé teszi, hogy kellő pontossággal meghatározzuk az eloszlási törvény típusát és konkrét formáját vagy paramétereinek értékét, ha nincs szükség magának a törvénynek a használatára. Az ilyen információk lehetővé teszik a valószínűségszámítás módszereinek teljes körű alkalmazását a feldolgozási problémák megoldására.
Mivel a tényleges eloszlási törvény és paramétereinek értéke ismeretlen, a parametrikus módszerek a közelítésükkel - statisztikai eloszlási törvényekkel és az eloszlási paraméterek becsléseivel - működnek.
Valószínűségi változó eloszlásának statisztikai törvénye az adatfeldolgozás statisztikai módszereivel megállapított, adott mennyiség eloszlásának törvénye.
A statisztikai eloszlási törvény definiálható statisztikai eloszlásfüggvényként, statisztikai eloszlássűrűségként vagy statisztikai eloszlási sorozatként P * (x i), .
Egy valószínűségi változó eloszlási törvényének paramétereinek statisztikai becslései ezeknek a paramétereknek (statisztikáknak) az adatfeldolgozás statisztikai módszereivel kapott hozzávetőleges értékeit nevezzük.
A következőkben a statisztikai becslésekre egyszerűen csak rövidségre vonatkozó becslésként hivatkozunk.
Ha valamilyen eloszlási törvényt paraméterek jellemeznek a 1 , a 2 ,…, a m, akkor a becsléseiket a következővel jelöljük: , ,…,. Az eloszlási törvények paramétereinek leggyakoribb típusai a kísérleti adatok feldolgozása során a matematikai várakozás, a variancia vagy a szórás, valamint a valószínűségi változók rendszerénél a korrelációs momentum vagy korrelációs együttható. Néha a harmadik és negyedik rend központi momentumait használják. Ennek megfelelően az adatok feldolgozása során statisztikai analógjaikat használják - a matematikai várható becsléseket, a korrelációs pillanatokat stb.
Így ha van egy kísérleti adathalmaz x 1 , x 2 ,…, x n, akkor mind a statisztikai eloszlási törvény, például a függvény, mind a paramétereinek becslései ezeknek az adatoknak néhány függvénye:
, . (2.1.2)
Statisztikák típusa y és fj meghatározza a becslések minőségét és . Ezzel kapcsolatban számos probléma merül fel, amelyek közül a fő probléma annak meghatározása, hogy a (2.1.1) és (2.1.2) becslések milyen feltételek mellett tudják az elméleti eloszlási törvényeket és azok paramétereit a szükséges megbízhatósággal reprezentálni. Ezek a feltételek kialakulnak határtételek Valószínűségi elmélet. Ezek szolgálják a kísérleti adatok feldolgozására szolgáló parametrikus módszerek alapját, amelyek alapján a megfigyelt jellemzők eloszlásának törvényszerűségeiről és paramétereiről megfelelő becsléseket lehet kapni.
A második probléma a választás elegendő statisztika, azaz olyan statisztikák, amelyek adott feltételek mellett lehetővé teszik egy adott minőség becslését. Mivel a megfigyelések eredményei alapján x 1 , x 2 ,…, x n a statisztikák (2.1.1) és (2.1.2) széles spektruma képezhető, ez a probléma a bizonyos értelemben optimális statisztika kiválasztására redukálódik. A probléma megoldása a statisztikai megoldások elméletének módszereivel történik.
Amint az 1.1. ábrán látható, nem csak az elegendő statisztika kiválasztásának problémája redukálódik a kísérleti adatok feldolgozása során felmerülő döntési problémára. A legtöbb adatfeldolgozási feladat változó mértékben a döntéshozatali feladatok közé sorolható. E tekintetben a statisztikai döntések meghozatalának elvei szolgálnak a parametrikus feldolgozási módszerek alapjául, amelyek alapján kialakulnak a bizonyos értelemben optimális döntések meghozatalának kritériumai. Ezen elvek között különleges szerepet játszik a maximum likelihood elve és az abból következő legkisebb négyzetek módszere a normáleloszlási törvény esetében.
Ez a brosúra a kísérleti adatok parametrikus feldolgozásának kérdéseivel foglalkozik.
A parametrikus adatfeldolgozási módszerek alkalmazása magában foglalja azon feltételek azonosítását, amelyek meghatározzák a vizsgált valószínűségi változó eloszlási törvényének formájára és paramétereinek tulajdonságaira vonatkozó a priori feltételezések érvényességét. Ezeket a feltételeket a valószínűségszámítás határtételeiként fogalmazzák meg. Az alábbiakban bemutatjuk a tételek tartalmát, lényegét bizonyítás nélkül, valamint néhány ajánlást gyakorlati alkalmazásukra.