itthon » mérgező gombák » Paraméteres és nem paraméteres eljárások statisztikai adatok elemzéséhez. A statisztika paraméteres és nem paraméteres módszerei

Paraméteres és nem paraméteres eljárások statisztikai adatok elemzéséhez. A statisztika paraméteres és nem paraméteres módszerei

Minden parametrikus statisztikai módszer intervallumskálával működik, ellentétben a nem paraméteres módszerekkel, amelyek elsősorban az első két skálára koncentrálnak. Magyarázzuk meg az e módszerek közötti különbségeket.

A legtöbb statisztikai módszer figyelembevételekor feltételezzük, hogy a kérdéses megfigyelések egy intervallumskálán vannak kifejezve, és egy olyan valószínűségi változó realizációi, amelynek eloszlása ​​valamely paraméteres eloszláscsaládhoz tartozik. Például egy valószínűségi változó normál, Poisson vagy más eloszlású. Vagyis feltételezzük, hogy az eloszlás alakja ismert, például feltételezhetünk egy normálist N (μ, δ ) modell, de ismeretlen paraméterekkel μ és δ . A becslési és hipotézisvizsgálati módszerek lehetővé teszik ismeretlen paraméterekre vonatkozó következtetések levonását, míg az esetleges következtetések értékének bizonyos mértékig függnie kell a parametrikus családra vonatkozó kiindulási feltevés megfelelőségétől, vagyis az eloszlás alakjától. Vannak azonban olyan valószínűségi változók, amelyek nem követik a közös eloszlási formákat. Ebből következően a parametrikus eloszlásokra kidolgozott matematikai módszerek nem alkalmazhatók rájuk. Ezért az ilyen jellemzőkre speciális matematikai modelleket fejlesztettek ki, amelyeket nem paraméteresnek vagy eloszlásmentesnek neveznek.

Így a statisztikai módszerek két csoportja különböztethető meg: a parametrikus és a nemparametrikus.

A parametrikus módszerek előnye, hogy van egy jól kidolgozott matematikai apparátus számukra. Ezeknek a módszereknek az alkalmazása azonban többek között nagy mintamérettel jár. A kvantitatív jellemzőkre paraméteres módszereket használnak.

A nominális és rangváltozók elemzéséhez csak nem-paraméteres módszereket alkalmazunk, amelyek nem igényelnek előzetes feltételezéseket az eredeti eloszlás formájára vonatkozóan. Ez az ő érdemük. De van egy hátránya is - csökken az ún. teljesítmény (érzékenység a tárgyi különbségekre). Ezt magyarázzuk el.

Emlékezzünk vissza, hogy a kísérlet eredményeinek elemzése előtt a kutató két egymást kizáró hipotézist állít fel. Az egyik egy statisztikai hipotézis, amelyet a kutató általában el kíván utasítani (az ún. nullhipotézis H 0: például a vizsgált fajták termésben nem különböznek egymástól). Alternatív hipotézis ( H 1) hatékonyan tagadja a nullhipotézist. Az alternatív hipotézis általában a kutató által megfogalmazott feltételezéseket tartalmazza (vannak eltérések).

A statisztikai elemzési hibáknak két típusa van. I. típusú hiba (hiba α – típus): a nullhipotézist elvetik, ami valójában igaz. II típusú hiba (hiba β – típus): elfogadjuk a nullhipotézist, ami valójában hamis.

Egy statisztikai kritérium (módszer) ereje vagy érzékenysége annak a valószínűsége, hogy alkalmazása eredményeként a helyes döntés születik ( H 1) valóban hamis nullhipotézis mellett. A teszt ereje függ a minta méretétől, a szignifikancia szintjétől, a null- és alternatív hipotézis fókuszától, a kísérleti adatok megbízhatóságától, a műszerektől és magától a statisztikai módszertől. Egyenlő feltételek mellett a parametrikus módszerek erősebbek, mint a nem paraméteresek. De a nemparaméteres módszerek ereje a minta méretének növekedésével növekszik.

Minden skálatípusnak megvan a maga statisztikai technikája. A névleges skálákhoz gyakran használják a χ 2 (khi-négyzet) tesztet. Sorrendi skálákhoz - rangsor statisztika. Az intervallum skálákhoz - a statisztikai kritériumok teljes arzenálja.

Algoritmusok és példák nemparaméteres kritériumok kiszámítására.

Kérdések a nem paraméteres kritériumokkal kapcsolatban.

Statisztikai kritérium - olyan döntési szabály, amely nagy valószínűséggel biztosítja az igaz hipotézis elfogadását és a hamis hipotézis elutasítását, ugyanakkor a statisztikai kritérium egy bizonyos szám és maga ennek a számnak a kiszámítására szolgáló módszer.

Paraméteres kritériumokat használunk, ha a minta normál, míg az ezekben a kritériumokban végzett számítások a jellemző valószínűségi eloszlásának jellemzőit, azaz az átlagokat és a szórást tartalmazzák. Ez azt feltételezi, hogy az adatok folyamatosak. A paraméteres tesztek a következők: Student-féle t-próba, khi-négyzet teszt. Alkalmas intervallumarány-skálákhoz.

A nem paraméteres teszteket akkor használjuk, ha nem lehet normális eloszlásról beszélni, a tesztek rangokkal vagy frekvenciákkal való műveleteken alapulnak. A nem paraméteresek közé tartozik az előjel-teszt, a Wilcoxon-teszt, a Mann-Whitney-teszt és a Jonkheer-teszt. Alkalmas az intervallumskáláknál gyengébb skálákhoz.

Kritérium kiválasztása előtt ellenőriznünk kell a minta normálisságát.

Fogalmam sincs, mit írjak az átlag és szóródás mértékére, mert láthatóan ugyanazok a fogalmak léteznek, mint a szóródás és a bla-bla egyebek *_*

2. Statisztikai hipotézisek tesztelésének módszerei: t-próba, Wilcoxon teszt, Mann-Whitney teszt, Kruskal-Wallace teszt (alkalmazási feltételek, hipotézisek megfogalmazása, statisztikák eloszlása, számítási elképzelés)

t-teszt (Student) – akkor használjuk, ha a minta normális. A hipotézisek a következőképpen fogalmazódnak meg:

1. H0 megfogalmazódik

2. H1 van megfogalmazva, alternatíva H0 (általában jellemzők kölcsönhatását jelzi).

3. Egy statisztikát választunk ki két hipotézis közül

4. Minden α szignifikanciaszinthez meghatározunk egy kritikus tartományt, ahol a) az ebbe a tartományba eső eredmény inkább H1-et jelöl, mint H0-t b) annak valószínűsége, hogy az eredmény ebbe a tartományba esik H0 igaz esetén, egyenlő α-val.

Az első típusú elfogadható hiba valószínűsége α=0,05, ha mintánkban a kritérium értéke nagyobb, mint t 0,05, akkor a H0 hipotézist elfogadjuk, a H1 hipotézist elvetjük.

Egy mintára

Független mintákhoz.

A Wilcoxon előjeles rangteszt nem a mintában szereplő számok értékét veszi figyelembe, hanem csak az előjeleiket. A kritérium figyelembe veszi a mintatagok abszolút értékét. Akkor használatos, ha a minta esetleg nem normális, és amikor el kell dönteni, hogy a minta értéke jelentősen nem nulla. A jelentkezéshez szükséges:

1) Állítsa be az α szignifikancia szintet, és keresse meg a megfelelő alsó Wilcoxon-kvantilist.


2) Rendezd a minta összes tagját abszolút érték szerint növekvő sorrendbe, írd alá a rangsorokat!

3) Számítsuk ki a Wilcoxon statisztikát, amelyhez kiszámítjuk a minta negatív tagjaihoz rendelt rangok összegét!

4) Hasonlítsa össze a kapott statisztikát a korábban talált kvantissel! Ha ez a rangok összege kisebb, mint az alsó kvantilis, akkor elvetjük a H0 hipotézist, és elfogadjuk a H1 hipotézist. Hasonlóképpen, ha az összes pozitív mintatag rangjainak összege nagyobb, mint a felső kvantilis, elfogadjuk H1-et és elutasítjuk H0-t.

A Mann-Whitney teszt (U) független minták tesztje, a Student-féle t-teszt analógja. Az empirikus értéke megmutatja, hogy az attribútumértékek két sora hogyan esik egybe. Akkor használjuk, ha a minta esetleg nem normális, csak az eloszlások hasonlóságának követelménye érvényesül, de nem kell normálisnak lenniük + amikor a probléma megoldásához szükséges, lehet ezt állítani. Hogy a kísérleti minta átlagértéke szignifikánsan magasabb, mint a kontrollcsoport átlagértéke.

1) Mindkét minta tagjait felírjuk növekvő sorrendben, különböző módon kiemelve a különböző minták tagjait.

2) Az első (kontroll) minta minden egyes számához kiszámoljuk, hogy a második (kísérleti) mintából hány darab található tőle balra. Ha az első minta száma megegyezik a második számával, akkor adjunk hozzá 0,5-öt. Konzisztens eredményeket kapunk, és összeadjuk őket.

3) Megnézzük azt a szignifikancia szintet, amelyet az alsó kvantishez választottunk Mann-Whitney szerint. Ha az általunk kapott összeg kisebb, mint az alsó kvantilis, akkor a H0 hipotézist elvetjük, a H1 hipotézist elfogadjuk.

A Mann-Whitney eloszlás szimmetrikus (azaz visszafelé számolhat és használhatja a felső kvantilist).

A Kruskal-Wallace teszt a független minták egyirányú varianciaanalízisének nem-paraméteres analógja. Hasonló a Mann-Whitney teszthez. Felméri a megváltozott jellemző több értéksorának egybeesésének mértékét. A fő ötlet az, hogy az összehasonlított minták összes értékét a rangsorolt ​​értékek közös sorozataként mutassuk be, majd az egyes minták átlagos rangját kiszámítjuk.

A rangsorolás után számítva.

N az összes minta száma.

k az összehasonlított minták száma.

R i egy adott minta rangsorainak összege.

n i – mintanagyság i.

Minél jobban különböznek a minták, annál nagyobb a H számítási értéke, annál alacsonyabb a p-szignifikancia szint. A nullstatisztikai hipotézis elutasítása esetén egy alternatívát fogadunk el a statisztikailag szignifikáns különbségekről, anélkül, hogy meghatároznánk a különbségek irányát. (az irányhoz a Mann-Whitney teszt kell, mert ez két mintára szól, ez pedig kettőnél többre).

Statisztikai skálák

Kutatási adatok statisztikai feldolgozása

A pszichológiai kutatási anyagok feldolgozása során statisztikai adatokat használnak fel annak érdekében, hogy a kísérlet során nyert kvantitatív adatokból minél több hasznos információt nyerjenek ki.

Egyes statisztikai módszerek alkalmazását az határozza meg, hogy a beérkezett anyag melyik statisztikai skálához tartozik.

Név skála. Ez a skála olyan anyagokat tartalmaz, amelyekben a vizsgált tárgyak minőségükben különböznek egymástól, és a sorrend nem fontos. Például a konferencia résztvevőinek elosztása. Az ilyen anyagok statisztikai feldolgozása során figyelembe kell venni, hogy az egyes objektumok hány egységet ábrázolnak.

Rendelési mérleg. Az objektumok sorrendje a fókusz. Ez a statisztikai skála olyan kutatási anyagokat tartalmaz, amelyekben egy vagy több osztályba tartozó tárgyakat figyelembe kell venni, de különböznek egymástól: több - kevesebb, magasabb - alacsonyabb stb.

A sorrendi skála jellemző vonásait úgy lehet legkönnyebben megmutatni, ha megnézzük bármelyik sportverseny eredményét. Sorrendben felsorolják azokat a résztvevőket, akik az első, második, harmadik és egyéb pozíciókat foglalták el.

helyezési sorrendben, és a sportolók tényleges teljesítményére vonatkozó információk háttérbe szorulnak, vagy hiányoznak.

Intervallum skála. Ide tartoznak azok az anyagok, amelyekben a vizsgált tárgy mennyiségi értékelését rögzített egységekben adják meg. Az intervallumskálának megfelelő anyagoknak minden ismételt mérésnél azonos mértékegységgel kell rendelkezniük.

Kapcsolati skála. Ez a skála olyan anyagokat tartalmaz, amelyek nem csak a rögzített egységek számát veszik figyelembe , mint az intervallumok skáláján, hanem a kapott összesített eredmények egymás közötti arányait is. Ahhoz, hogy ilyen kapcsolatokkal dolgozhasson, rendelkeznie kell egy abszolút ponttal, ahonnan a visszaszámlálás történik.

Ha a kutató rendelkezésére álló adatok közelebbről megvizsgálva csak kismértékben térnek el a Gauss-féle normális eloszlási görbétől, akkor ez feljogosítja a kutatót arra, hogy a statisztikai feldolgozás során paraméteres módszereket alkalmazzon, amelyek kezdeti rendelkezései a Gauss-féle normál eloszlási görbén alapulnak. . A normális eloszlást parametrikusnak nevezzük, mert a Gauss-görbe megszerkesztéséhez és elemzéséhez elegendő csak két paraméter megadása: a számtani középérték, amelynek értékének meg kell felelnie a görbe középpontjában helyreállított merőleges magasságának, és a ún. négyzetgyök, vagy szórás, egy érték, amely a görbe ingadozási tartományát jellemzi.

Ha nem lehet parametrikus módszereket alkalmazni, akkor a nem paraméteres módszerekhez kell fordulni.

A matematikai statisztika főbb módszereit - eloszlási paraméterek becslése, statisztikai hipotézisek tesztelése, varianciaanalízis - az általános sokaság eloszlásának ismeretében alkalmazzuk. A két populáció átlagának összehasonlítására szolgáló t-próba és több sokaság átlagának összehasonlítására szolgáló egyirányú varianciaanalízis csak akkor hasznos, ha az utóbbiak normális eloszlásúak. Azonban gyakran vannak olyan adatok, amelyekre ezek a feltételezések nem érvényesülnek. Például a szociológiai felmérések eredményei általában "igen" vagy "nem" válaszok formájában jelennek meg, és táblázatok formájában mutatják be, amelyek a pozitív és negatív válaszok gyakoriságát tartalmazzák. A matematikai statisztika hagyományos módszerei nem használhatók ilyen adatok feldolgozására. Ezekben az esetekben nemparaméteres módszerekhez kell fordulni, pl. a népesség eloszlásától nem függő módszerek.

Nem paraméteres módszereket használnak a nominális skálán bemutatott kvalitatív adatokhoz, az ordinális skálán mért adatokhoz (azaz rangsorokban), valamint a kvantitatív adatokhoz, amikor a sokaság megoszlása ​​nem határozható meg, mert a minta kicsi, vagy ha az eloszlás nem indokolt. lenni

normál törvény és parametrikus módszerek nem alkalmazhatók.

A STATISTICA csomagban nem paraméteres

.4.1. ábra. Nonpametrics/Distrib modul indítópultja

eljárások végrehajtása a modulban történik

Nonpametrics/Distrib. A modul indítópanelje a 4.1. ábrán látható.

Írjuk le egymás után a megfelelő módszereket

és példákat adunk az eljárásokra.

NÁL NÉL a Nonpametrics/Distrib modul nagyszámú eljárást tartalmaz. Egy adott probléma megoldása során egy konkrét módszert kell választani. Az ilyen választáshoz segítséget nyújthat a nem paraméteres módszerek alábbi osztályozása, amelyekkel tesztelték azt a hipotézist, hogy az elemzett adatok homogén általános populációkból származó minták. Megjegyzendő, hogy az általános populációk homogenitásának fogalma meglehetősen tágan értelmezhető: ezek lehetnek általános populációk, amelyek azonosak.

4) a statisztikai függőség mértékei: Spearman rangkorrelációs együtthatója, Kendall τ korrelációs együtthatója.

2. Kiindulási adatok: k független minta térfogattal

n 1 , n 2 , …, n k .

1) egyirányú Kruskal varianciaanalízis

Wallis.

2) medián kritérium.

3. Kiindulási adatok: kötetenként két kapcsolódó minta n.

Ellenőrzött hipotézis H 0: a minták homogén általános populációkba tartoznak.

1) a jelek kritériuma;

2) Wilcoxon-kritérium.

4. Kiinduló adatok: k összekötött n méretű minta.

Ellenőrzött hipotézis H 0: a minták homogén általános populációkba tartoznak.

1) Friedman egyváltozós elemzése;

2) a kapcsolat mértéke – Kendall konkordancia együtthatója.

5. Kapcsolódó minták, névleges skálán mérve.

5a) Kiindulási adatok: két összefüggő minta az X és Y változók n térfogatából, amelyek mindegyike

elfogadja

értékeket

Módszer: McNimar-teszt.

5b) Kiindulási adatok: két összefüggő minta n változó X 1 ,X 2 , ...,X k térfogatából, amelyek mindegyike két értéket vesz fel.

Vizsgálandó hipotézis H 0 : az expozíciónak nincs hatása.

Módszer: Cochran-teszt.

6. Névleges skálán mért független minták.

6a) Kiindulási adatok: két valószínűségi változó mintája

X és Y , amelyek mindegyike két értéket vesz fel.

A tesztelt H 0 :X és Y hipotézis függetlenek Módszer: a kontingenciatábla elemzése 2 × 2

(Fisher-féle egzakt teszt, χ 2 teszt).

6b) Kiindulási adatok: k valószínűségi változó mintája, amelyek mindegyike értéket vesz fel.

Ellenőrzött H 0 hipotézis: a mintákat egy általános populációból vettük.

Módszer: a k × r kontingenciatábla elemzése (χ 2 kritérium). Az ilyen táblázatok elemzését a

4.1. 2 × 2 kontingencia táblázat, χ 2 statisztika, φ, McNimar teszt, Fisher egzakt teszt (2 × 2 táblázat

Xi/Vi/Phi, McNemar, Fisher pontos)

A 2×2-es kontingenciatábla két X és Y valószínűségi változó gyakoriságát rögzíti, amelyek mindegyike két értéket vesz fel: 0 és 1, igen és nem, és így tovább.

4.1. példa. A különböző nemű nézők televíziós műsorokhoz való hozzáállásának meghatározására 60 embert kérdeztek meg: 35 férfit és 25 nőt. Kiderült, hogy 25 férfi helyeselte és 10 helytelenítette a programot. Ugyanakkor 16 nő fejezi ki negatív hozzáállását a programhoz, 9 pedig pozitív hozzáállását.

Tudja meg, hogy a műsorhoz való hozzáállás függ-e a nézők nemétől.

Megoldás. Az adatok egy 2 × 2 kontingenciatábla formájában írhatók fel:

Az átvitelhez való viszony

Formálisan a két vizsgált jellemző X (gender) és Y (transzmissziós kapcsolat) függetlenségének meghatározása a feladat, vagy a H 0 nullhipotézis tesztelése: a transzmisszióhoz való viszonyulás nem függ.

nemtől a H 1 alternatív hipotézis szerint: viszonyulás

átvitel a nemtől függ.

Az egyenértékű készítmény a következő. Vegyünk két mintát: 35 férfi és 25 nő. A H 0 nullhipotézist teszteljük: az áthelyezést jóváhagyó férfiak aránya (p 1 ) megegyezik a jóváhagyó nők arányával.

transzmisszió (p 2 ), a H 1 : részvények alternatív hipotézise alapján

Az átvitelt jóváhagyó férfiak és nők nem egyenlőek. A nullhipotézis két általános sokaság p 1 és 2 paramétereinek egyenlőségére vonatkozó hipotézis.

binomiális eloszlás.

Egy hipotézis tesztelésére H 0 Fisher-kritérium érvényes , amely lehetővé teszi a megfigyelt eredmények és kimenetelek pontos valószínűségének kiszámítását szélsőségesebb eloszlással (lásd , 345. o.). Egyoldalú(egyfarkú) és kétoldali (kétfarkú ) szignifikanciaszinteket p a Fisher-kritériumhoz ( Fisher pontos p ). 2×2.

Ha a minta mérete n ³ 30, a χ 2 teszt kevésbé időigényes eljárás. Hogy tisztázzuk

A szükséges számítások elvégzéséhez a 2 × 2 kontingenciatáblázatot a következő formában írjuk:

Az átvitelhez való viszony

n 11= a

n1* = a + b

n 21= c

n2* = c+ d

n = a + c

n = b + d

n = a + b + c + d

oszlopok

Ebben a példában ez a táblázat így néz ki:

Az átvitelhez való viszony

oszlopok

Kritérium statisztika c 2

közötti különbséget használja

megfigyelt gyakoriságok a , b , c , d és várható gyakoriságok a 0 , b 0 , c 0 , d 0 , azzal a feltétellel számítva, hogy a H 0 hipotézis igaz:

a 0 \u003d (a + b) (a + c) = 35 × 34 "19,83; n 60

b 0 \u003d (a + b) n (b + d) = 35 60 × 26 "15,17;

c 0 \u003d (c + d) (a + c) = 25 × 34 "14,17; n60

d 0 \u003d (c + d) n (b + d) \u003d 25 60 × 26 "10,83.

A c statisztika mintaértéke 2-ben a következő képlettel számítható ki:

(a-a

(b-b

(c-c

(d-d

n(ad-bc) 2

(a+b)(c+d)(a+c)(b+d)

Ahogy n → ∞, a c statisztika 2-ben c 2 eloszlású egy szabadságfokkal. Ha a várható gyakoriságok ≤ 5 , akkor a c statisztika mintaértéke 2-nél Yates folytonossági korrekciójával kerül kiszámításra:

c2 =(

a - a0

0,5) 2

b-b0

0,5) 2

c-c0

0,5) 2

d - d0

0,5)

nç ad-bc-

(a+b) (c+d) (a+c)(b+d)

A H 0 hipotézist α szignifikancia szinten fogadjuk el,

ha c 2< c 2

(1) , ahol c 2

Eloszlási kvantilis c 2

egy sorrendi szabadságfokkal 1 – α.

szelektív

jelentése

c in 2 = 7,45,

módosítása szerint

Yates c a 2-ben \u003d 6,08.

c 0,95 2 (1) = 3,84

(jelölje be

segítségével

statisztikai

számológép!) és c-től 2-ig< 3,84 , то гипотезаH 0 отклоняется: на

jelentőség

Az átvitelhez való hozzáállás a nemtől függ.

Ugyanezt az eredményt kapjuk, ha beírjuk az adatokat a STATISTICA csomag megfelelő eljárásába. Az eredmények táblázatát a 4.2. ábra mutatja.

.4.2. ábra. Eljárás eredménye 2×2 táblázat…

P-értékek χ 2 statisztikához, χ 2 statisztikához,

Yates által korrigált és Fisher-féle egzakt teszt a kétoldali teszteléshez rendre 0,0063; 0,0137 és 0,0087. Így α = 0,05 szignifikancia szinten a H 0 hipotézist elvetjük. Az eredménytábla a változók közötti asszociáció mértékét adja meg

X és Y - együttható phi-négyzet (átlagos kontingencia együttható):

ϕ2 =χ 2-ben = 0,124. n

A ϕ 2 értéke 0-ról változik (a változók között

nincs függőség) 1-ig (a változók között abszolút függés van, azaz minden frekvencia a táblázat 2 × 2 átlóján található).

McNimar szignifikancia tesztje

akkor érvényes, ha a forrásadat két összefüggő minta. Ugyanazon a tárgyon vagy egyénen két megfigyelést végeznek: az egyiket valamilyen expozíció előtt, a másikat valamilyen expozíció (gyógyszeres kezelés, képzés, reklámkampány stb.) után.

2.1. Alapfogalmak

A kísérleti adatok feldolgozásának paraméteres módszerei azon az alapvető tényen alapulnak, miszerint a kísérleti vizsgálatok eredményeinek véletlenszerű objektumnak tekintett tulajdonságait valamilyen eloszlási törvény írja le. Feltételezzük, hogy a kísérleti adatok elemzése lehetővé teszi, hogy kellő pontossággal meghatározzuk az eloszlási törvény típusát és konkrét formáját vagy paramétereinek értékét, ha nincs szükség magának a törvénynek a használatára. Az ilyen információk lehetővé teszik a valószínűségszámítás módszereinek teljes körű alkalmazását a feldolgozási problémák megoldására.

Mivel a tényleges eloszlási törvény és paramétereinek értéke ismeretlen, a parametrikus módszerek a közelítésükkel - statisztikai eloszlási törvényekkel és az eloszlási paraméterek becsléseivel - működnek.

Valószínűségi változó eloszlásának statisztikai törvénye az adatfeldolgozás statisztikai módszereivel megállapított, adott mennyiség eloszlásának törvénye.

A statisztikai eloszlási törvény definiálható statisztikai eloszlásfüggvényként, statisztikai eloszlássűrűségként vagy statisztikai eloszlási sorozatként P * (x i), .

Egy valószínűségi változó eloszlási törvényének paramétereinek statisztikai becslései ezeknek a paramétereknek (statisztikáknak) az adatfeldolgozás statisztikai módszereivel kapott hozzávetőleges értékeit nevezzük.

A következőkben a statisztikai becslésekre egyszerűen csak rövidségre vonatkozó becslésként hivatkozunk.

Ha valamilyen eloszlási törvényt paraméterek jellemeznek a 1 , a 2 ,…, a m, akkor a becsléseiket a következővel jelöljük: , ,…,. Az eloszlási törvények paramétereinek leggyakoribb típusai a kísérleti adatok feldolgozása során a matematikai várakozás, a variancia vagy a szórás, valamint a valószínűségi változók rendszerénél a korrelációs momentum vagy korrelációs együttható. Néha a harmadik és negyedik rend központi momentumait használják. Ennek megfelelően az adatok feldolgozása során statisztikai analógjaikat használják - a matematikai várható becsléseket, a korrelációs pillanatokat stb.

Így ha van egy kísérleti adathalmaz x 1 , x 2 ,…, x n, akkor mind a statisztikai eloszlási törvény, például a függvény, mind a paramétereinek becslései ezeknek az adatoknak néhány függvénye:

, . (2.1.2)

Statisztikák típusa y és fj meghatározza a becslések minőségét és . Ezzel kapcsolatban számos probléma merül fel, amelyek közül a fő probléma annak meghatározása, hogy a (2.1.1) és (2.1.2) becslések milyen feltételek mellett tudják az elméleti eloszlási törvényeket és azok paramétereit a szükséges megbízhatósággal reprezentálni. Ezek a feltételek kialakulnak határtételek Valószínűségi elmélet. Ezek szolgálják a kísérleti adatok feldolgozására szolgáló parametrikus módszerek alapját, amelyek alapján a megfigyelt jellemzők eloszlásának törvényszerűségeiről és paramétereiről megfelelő becsléseket lehet kapni.

A második probléma a választás elegendő statisztika, azaz olyan statisztikák, amelyek adott feltételek mellett lehetővé teszik egy adott minőség becslését. Mivel a megfigyelések eredményei alapján x 1 , x 2 ,…, x n a statisztikák (2.1.1) és (2.1.2) széles spektruma képezhető, ez a probléma a bizonyos értelemben optimális statisztika kiválasztására redukálódik. A probléma megoldása a statisztikai megoldások elméletének módszereivel történik.

Amint az 1.1. ábrán látható, nem csak az elegendő statisztika kiválasztásának problémája redukálódik a kísérleti adatok feldolgozása során felmerülő döntési problémára. A legtöbb adatfeldolgozási feladat változó mértékben a döntéshozatali feladatok közé sorolható. E tekintetben a statisztikai döntések meghozatalának elvei szolgálnak a parametrikus feldolgozási módszerek alapjául, amelyek alapján kialakulnak a bizonyos értelemben optimális döntések meghozatalának kritériumai. Ezen elvek között különleges szerepet játszik a maximum likelihood elve és az abból következő legkisebb négyzetek módszere a normáleloszlási törvény esetében.

Ez a brosúra a kísérleti adatok parametrikus feldolgozásának kérdéseivel foglalkozik.

2.2. A valószínűségszámítás határtételei

A parametrikus adatfeldolgozási módszerek alkalmazása magában foglalja azon feltételek azonosítását, amelyek meghatározzák a vizsgált valószínűségi változó eloszlási törvényének formájára és paramétereinek tulajdonságaira vonatkozó a priori feltételezések érvényességét. Ezeket a feltételeket a valószínűségszámítás határtételeiként fogalmazzák meg. Az alábbiakban bemutatjuk a tételek tartalmát, lényegét bizonyítás nélkül, valamint néhány ajánlást gyakorlati alkalmazásukra.



Előző cikk: Következő cikk:

© 2015 .
Az oldalról | Kapcsolatok
| az oldal térképe