Otthon » Ehető gomba » Előrejelzés regressziós egyenlettel. Előrejelzés regressziós egyenlet segítségével

Előrejelzés regressziós egyenlettel. Előrejelzés regressziós egyenlet segítségével

Építsünk MS EXCEL-ben konfidencia intervallum hogy megbecsüljük az eloszlás középértékét abban az esetben ismert érték eltérések.

Természetesen a választás a bizalom szintje teljesen a megoldandó probléma függvénye. Így a légi utasnak a repülőgép megbízhatóságába vetett bizalma kétségtelenül nagyobb kell legyen, mint a vevőnek egy elektromos izzó megbízhatóságába vetett bizalma.

Probléma megfogalmazása

Tegyük fel, hogy abból lakosság miután elvitték minta n méret. Feltételezhető, hogy szórás ez az eloszlás ismert. Ez alapján szükséges mintákértékelje az ismeretlent eloszlási átlag(μ, ) és állítsuk össze a megfelelőt kétoldalas konfidencia intervallum.

Pontbecslés

Amint az ismeretes statisztika(Jelöljük X átl) van az átlag elfogulatlan becslése ez lakosságés N(μ;σ 2 /n) eloszlású.

Jegyzet: Mi a teendő, ha építeni kell konfidencia intervallum eloszlás esetén azt nem normál? Ebben az esetben jön a mentő, ami azt mondja, hogy elég nagy méretű minták n elosztásból nem lévén normál, statisztika mintaeloszlása ​​X átl akarat hozzávetőlegesen megfelelnek normál eloszlás N(μ;σ 2 /n) paraméterekkel.

Így, pontbecslés átlagos eloszlási értékek van - ez minta átlag, azaz X átl. Most pedig kezdjük konfidencia intervallum.

Konfidenciaintervallum felépítése

Általában az eloszlás és paramétereinek ismeretében ki tudjuk számítani annak a valószínűségét, hogy a valószínűségi változó értéket vesz fel az általunk megadott intervallumból. Most tegyük az ellenkezőjét: keressük meg azt az intervallumot, amelybe a valószínűségi változó adott valószínűséggel esik. Például a tulajdonságokból normál eloszlás ismert, hogy 95%-os valószínűséggel egy valószínűségi változó eloszlik normális törvény , körülbelül +/- 2 tartományba esik átlagos érték(lásd a cikket erről). Ez az intervallum prototípusként fog szolgálni számunkra konfidencia intervallum.

Most lássuk, ismerjük-e az elosztást , kiszámolni ezt az intervallumot? A kérdés megválaszolásához meg kell jelölnünk az eloszlás alakját és paramétereit.

Ismerjük az elosztás formáját – ez van normál eloszlás (emlékezz rá arról beszélünk O mintavételi eloszlás statisztika X átl).

A μ paraméter ismeretlen számunkra (csak meg kell becsülni a segítségével konfidencia intervallum), de van rá becslésünk X átlag, alapján számítjuk ki minták, ami használható.

Második paraméter - mintaátlag szórása ismertnek fogjuk tekinteni, egyenlő σ/√n-nel.

Mert nem ismerjük a μ-t, akkor megépítjük a +/- 2 intervallumot szórások nem attól átlagos érték, és ismert becslése alapján X átl. Azok. számításkor konfidencia intervallum ezt NEM feltételezzük X átl+/- 2 tartományba esik szórásokμ-től 95%-os valószínűséggel, és feltételezzük, hogy az intervallum +/- 2 szórások-tól X átl 95%-os valószínűséggel lefedi μ-t – a lakosság átlaga, ahonnan elvették minta. Ez a két állítás ekvivalens, de a második állítás lehetővé teszi a konstrukciót konfidencia intervallum.

Ezen kívül tisztázzuk az intervallumot: egy elosztott valószínűségi változó normális törvény, 95%-os valószínűséggel a +/- 1,960 intervallumba esik standard eltérések, nem +/- 2 szórások. Ezt a képlet segítségével lehet kiszámítani =NORM.ST.REV((1+0,95)/2), cm. példa fájl Lap intervallum.

Most megfogalmazhatunk egy valószínűségi állítást, amely a formálást szolgálja majd konfidencia intervallum:
"Annak a valószínűsége népesség átlaga től található minta átlaga 1960"-on belül a minta átlagának szórása", egyenlő 95%-kal".

Az állításban említett valószínűségi értéknek speciális neve van , amelyhez kapcsolódik szignifikancia szint α (alfa) egyszerű kifejezés a bizalom szintje =1 . A mi esetünkben szignifikancia szintje α =1-0,95=0,05 .

Most ennek a valószínűségi állításnak a alapján írunk egy kifejezést a számításhoz konfidencia intervallum:

ahol Z α/2 standard normál eloszlás(a valószínűségi változónak ez az értéke z, Mi P(z>=Z α/2 )=α/2).

Jegyzet: Felső α/2-kvantilis a szélességet határozza meg konfidencia intervallum V szórások minta átlag. Felső α/2-kvantilis standard normál eloszlás mindig nagyobb, mint 0, ami nagyon kényelmes.

Esetünkben α=0,05 esetén felső α/2-kvantilis egyenlő 1,960. Egyéb szignifikanciaszinteknél α (10%; 1%) felső α/2-kvantilis Z α/2 kiszámítható a =NORM.ST.REV(1-α/2) képlettel, vagy ha ismert a bizalom szintje, =NORM.ST.OBR((1+megbízhatósági szint)/2).

Általában építéskor konfidencia intervallumok az átlag becsléséhez csak használja felső α/2-kvantilisés ne használd alacsonyabb α/2-kvantilis. Ez azért lehetséges, mert standard normál eloszlás szimmetrikusan az x tengelyre ( eloszlási sűrűsége szimmetrikus kb átlagos, azaz. 0). Ezért nem kell számolni alsó α/2-kvantilis(egyszerűen α-nak hívják /2-kvantilis), mert egyenlő felső α/2-kvantilis mínusz jellel.

Emlékezzünk vissza, hogy az x érték eloszlásának alakja ellenére a megfelelő valószínűségi változó X átl megosztott hozzávetőlegesen Finom N(μ;σ 2 /n) (lásd a témáról szóló cikket). Ezért be általános eset, a fenti kifejezés a konfidencia intervallum csak közelítés. Ha az x értéket elosztjuk normális törvény N(μ;σ 2 /n), akkor a for kifejezés konfidencia intervallum pontos.

Konfidenciaintervallum számítása MS EXCEL-ben

Oldjuk meg a problémát.
Az elektronikus komponens válaszideje a bemeneti jelre a fontos jellemzője eszközöket. Egy mérnök meg akarja alkotni az átlagos válaszidő konfidenciaintervallumát 95%-os megbízhatósági szinten. Korábbi tapasztalatból a mérnök tudja, hogy a válaszidő szórása 8 ms. Ismeretes, hogy a válaszidő értékeléséhez a mérnök 25 mérést végzett, az átlagérték 78 ms volt.

Megoldás: A mérnök tudni akarja a válaszidőt elektronikus eszköz, de megérti, hogy a válaszidő nem fix érték, hanem egy valószínűségi változó, amelynek saját eloszlása ​​van. Tehát a legjobb, amit remélhet, hogy meghatározza ennek az eloszlásnak a paramétereit és alakját.

Sajnos a probléma körülményeiből nem ismerjük a válaszidő eloszlás alakját (nem kell, hogy így legyen normál). , ez az eloszlás sem ismert. Csak őt ismerik szórásσ=8. Ezért, miközben nem tudjuk kiszámítani a valószínűségeket és konstruálni konfidencia intervallum.

Azonban annak ellenére, hogy nem ismerjük az eloszlást idő külön válasz szerint tudjuk CPT, mintavételi eloszlás átlagos válaszidő megközelítőleg normál(feltételezzük, hogy a feltételek CPT végeznek, mert méret minták elég nagy (n=25) .

Ráadásul, átlagos ez az eloszlás egyenlő átlagos érték egyetlen válasz eloszlása, azaz. μ. A szórás ennek az eloszlásnak (σ/√n) a =8/ROOT(25) képlettel számítható ki.

Az is ismert, hogy a mérnök kapott pontbecslésμ paraméter értéke 78 ms (X avg). Ezért most már kiszámíthatjuk a valószínűségeket, mert ismerjük az elosztás formáját ( normál) és paraméterei (X avg és σ/√n).

A mérnök tudni akarja matematikai elvárásμ válaszidő eloszlások. Amint fentebb említettük, ez a μ egyenlő az átlagos válaszidő mintaeloszlásának matematikai elvárása. Ha használjuk normál eloszlás N(X avg; σ/√n), akkor a kívánt μ a +/-2*σ/√n tartományban lesz, körülbelül 95%-os valószínűséggel.

Jelentősségi szint egyenlő 1-0,95=0,05.

Végül keressük meg a bal és jobb oldali szegélyt konfidencia intervallum.
Bal szegély: =78-NORM.ST.INV(1-0,05/2)*8/ROOT(25) = 74,864
Jobb szegély: =78+NORM.ST.INV(1-0,05/2)*8/ROOT(25)=81,136

Bal szegély: =NORM.REV(0,05/2; 78; 8/ROOT(25))
Jobb szegély: =NORM.REV(1-0,05/2; 78; 8/ROOT(25))

Válasz: konfidencia intervallum at 95%-os megbízhatósági szint és σ=8msec egyenlő 78+/-3,136 ms.

IN példafájlt a Sigma lapon ismert, elkészített egy űrlapot a számításhoz és a kivitelezéshez kétoldalas konfidencia intervallumönkényesnek minták adott σ-vel és jelentőség szintje.

CONFIDENCE.NORM() függvény

Ha az értékek minták tartományban vannak B20:B79 , A szignifikancia szintje egyenlő 0,05; majd az MS EXCEL képlet:
=ÁTLAG(B20:B79)-BIZTONSÁGI.NORM(0,05;σ; SZÁMÁLÁS(B20:B79))
visszaadja a bal oldali szegélyt konfidencia intervallum.

Ugyanez a határérték kiszámítható a következő képlettel:
=ÁTLAG(B20:B79)-NORM.ST.REV(1-0.05/2)*σ/GYÖK(SZÁM(B20:B79))

Jegyzet: A CONFIDENCE.NORM() függvény megjelent az MS EXCEL 2010-ben. Az MS EXCEL korábbi verzióiban a TRUST() függvényt használták.

Legyen egy olyan valószínűségi változó eloszlása ​​normális törvény szerint, amelyre a D variancia ismeretlen. Készül egy n méretű minta. Ebből meghatározzuk a korrigált s 2 mintavarianciát. Véletlen változó

törvény szerint elosztva 2 n -1 szabadságfokkal. Adott megbízhatóság mellett 1 2 és 2 2 intervallumok tetszőleges számú határa megtalálható, így

Keressünk 1 2-t és 2 2-t a következő feltételekből:

P(2 1 2) = (1 -)/2(**)

P(2 2 2) = (1 -)/2(***)

Nyilvánvalóan kettő előadásakor legújabb feltételek az egyenlőség (*) igaz.

A 2. valószínűségi változóhoz tartozó táblázatokban általában megadják az egyenlet megoldását

Egy ilyen táblázatból egy adott q érték és az n - 1 szabadságfokok számának felhasználásával meghatározhatja q 2 értékét. Így a (***) képletben azonnal megtaláljuk a 2 2 értéket.

Az 1 2 meghatározásához átalakítjuk (**):

P(2 1 2) = 1 - (1 -)/ 2 = (1 +)/ 2

A kapott egyenlőség lehetővé teszi, hogy a táblázatból meghatározzuk az 1 2 értéket.

Most, hogy megtaláltuk az 1 2 és 2 2 értékeket, ábrázoljuk az egyenlőséget (*) a formában

Írjuk át az utolsó egyenlőséget úgy, hogy az ismeretlen D érték konfidenciaintervallumának határai legyenek meghatározva:

Innen könnyen beszerezhető a szórás konfidenciaintervallumának meghatározására szolgáló képlet:

Feladat. Feltételezzük, hogy az azonos típusú, bizonyos üzemmódban működő hajtóművekkel rendelkező helikopterek pilótafülkéiben a zaj egy normális törvény szerint eloszló valószínűségi változó. Volt véletlenszerűen 20 helikoptert választottak ki, mindegyikben megmérték a zajszintet (decibelben). A mérések korrigált mintaszórását 22,5-nek találtuk. Keresse meg azt a konfidenciaintervallumot, amely lefedi a zaj ismeretlen szórását a helikopterkabinokban ebből a típusból 98%-os megbízhatósággal.

Megoldás. A 19-cel egyenlő szabadsági fokok száma és az (1 - 0,98)/2 = 0,01 valószínűség alapján a 2. eloszlási táblázatból a 2 2 = 36,2 értéket kapjuk. Hasonlóképpen (1 + 0,98)/2 = 0,99 valószínűséggel 1 2 = 7,63-at kapunk. A (****) képlet segítségével megkapjuk a szükséges konfidencia intervallumot: (3,44; 7,49).

Egy normális eloszlású sokaság varianciájának konfidenciaintervallumának felépítése azon a tényen alapul, hogy a valószínűségi változó:

c 2 -Pearson eloszlása ​​van n=-vel n-1 szabadságfok. Állítsuk be megbízhatósági valószínűség g és határozza meg a számokat és a feltételből

A számok és ennek a feltételnek a teljesítése végtelen sokféleképpen választható. Az egyik út a következő

És .

A és a számok értékeit a Pearson-eloszlás táblázataiból határozzuk meg. Ezt követően képezzük az egyenlőtlenséget

Ennek eredményeként a következő intervallumot kapjuk varianciabecslés általános lakosság:

. (3.25)

Néha ezt a kifejezést így írják

, (3.26)

, (3.27)

ahol speciális táblázatokat állítanak össze az együtthatókhoz.

3.10. példa. Az instant kávé 100 grammos dobozokba történő csomagolására a gyárban automatikus sor működik. Ha a megtöltött dobozok átlagos tömege eltér a pontostól, akkor a vonalak illeszkednek átlagos súlya munkamódban. Ha a tömegszórás meghaladja a megadott értéket, akkor a vezetéket le kell állítani javítás és utánállítás céljából. Időről időre kiválasztanak egy doboz kávét, hogy ellenőrizzék az átlagos súlyt és annak változékonyságát. Tegyük fel, hogy a sortól ig véletlenszerű sorrendben Kiválasztják a kávésdobozokat, és felmérik az eltérést s 2 = 18,540. Ábrázoljon egy 95%-os konfidencia intervallumot ehhez általános variancia s2.

Megoldás. Feltételezve, hogy a sokaság normális eloszlású, a (3.26) képletet használjuk. A feladat feltételei szerint a szignifikancia szint a=0,05 és a/2=0,025. A c 2 -Pearson-eloszlás táblázatai szerint n=-vel n–1=29 szabadsági fokot találunk

És .

Ekkor az s 2 konfidenciaintervalluma így írható fel

,

.

Átlagosnak négyzetes eltérés a válasz úgy fog kinézni

. â

Statisztikai hipotézisek tesztelése

Alapfogalmak

A legtöbb ökonometriai modell ismételt fejlesztést és finomítást igényel. Ehhez megfelelő számításokat kell végezni az egyes előfeltételek megvalósíthatóságának vagy lehetetlenségének megállapításához, a talált becslések minőségének és a levont következtetések megbízhatóságának elemzéséhez. Ezért az ökonometriában kötelező a hipotézisvizsgálat alapelveinek ismerete.



Sok esetben ismerni kell a sokaság eloszlási törvényét. Ha az elosztási törvény ismeretlen, de okkal feltételezhető, hogy igen bizonyos típus, akkor felállítottak egy hipotézist: az általános népesség e törvény szerint oszlik meg. Feltételezhető például, hogy a lakosság jövedelmének, az üzletben napi vásárlók számának és a legyártott alkatrészek méretének normális elosztási törvénye van.

Lehetséges, hogy az eloszlási törvény ismert, de a paraméterei nem. Ha okkal feltételezhető, hogy az ismeretlen q paraméter egyenlő a várt q 0 számmal, akkor hipotézist állítunk fel: q=q 0. Feltételezéseket lehet tenni például a lakosság átlagjövedelméről, a részvények átlagos várható hozamáról, a jövedelem felosztásáról stb.

Alatt statisztikai hipotézis H megértse a sokaságra (véletlenszerű változóra) vonatkozó feltételezéseket, amelyeket egy mintával szemben tesztelnek. Ez feltevés lehet az általános sokaság eloszlásának típusáról, két mintavariancia egyenlőségéről, a minták függetlenségéről, a minták homogenitásáról, pl. hogy az eloszlási törvény nem változik mintáról mintára stb.

A hipotézist az ún egyszerű, ha egyedi eloszlást vagy paramétert határoz meg; V egyébként a hipotézist ún összetett. Például egy egyszerű hipotézis az a feltételezés, hogy a valószínűségi változó X a szokásos normál törvény szerint elosztva N(0;1); ha feltételezzük, hogy a valószínűségi változó X normál eloszlású N(m;1), hol a£ m£ b, akkor ez egy összetett hipotézis.

A tesztelt hipotézist ún alapvető vagy nullhipotézisés a szimbólum jelzi H 0 . A főhipotézissel együtt egy ellentmondásos hipotézist is figyelembe veszünk, amelyet általában ún. versengő vagy alternatív hipotézisés a szimbólum jelöli H 1. Ha a fő hipotézist elutasítják, akkor az alternatív hipotézis jön létre. Például, ha azt a hipotézist teszteljük, hogy a q paraméter megegyezik valamilyen adott q 0 értékkel, azaz. H 0:q=q 0, akkor az alábbi hipotézisek egyike tekinthető alternatív hipotézisnek: H 1:q>q 0, H 2:q H 3:q¹q 0, H 4:q=q1. Az alternatív hipotézis kiválasztását a probléma konkrét megfogalmazása határozza meg.

A felállított hipotézis lehet helyes vagy helytelen, ezért szükséges annak tesztelése. Mivel az igazolás statisztikai módszerekkel történik, e tekintetben bizonyos fokú valószínűséggel téves döntés születhet. Itt kétféle hiba követhető el. Az első típusú hiba az, hogy a helyes hipotézist elvetik. Az I. típusú hiba valószínűségét a betűvel jelöljük, azaz.

A második típusú hiba az, hogy a rossz hipotézist elfogadják. A II. típusú hiba valószínűségét b betűvel jelöljük, azaz.

Ezeknek a hibáknak a következményei nem egyenlőek. Az első óvatosabb, konzervatívabb döntéshez, a második indokolatlan kockázathoz vezet. Hogy mi a jobb vagy rosszabb, az a probléma konkrét megfogalmazásától és a nullhipotézis tartalmától függ. Például ha H A 0 abban áll, hogy a vállalkozás termékeit minőséginek ismerik el, és ha az első típusú hibát követik el, akkor a megfelelő termékeket elutasítják. Ha 2-es típusú hibát követünk el, hibás terméket küldünk a fogyasztónak. Nyilvánvalóan ennek a hibának a következményei súlyosabbak a cég imázsát és hosszú távú kilátásait tekintve.

Az első és második típusú hibák kizárása a korlátozott minta miatt lehetetlen. Ezért törekednek az ezekből a hibákból származó veszteségek minimalizálására. Vegye figyelembe, hogy lehetetlen egyidejűleg csökkenteni ezeknek a hibáknak a valószínűségét, mert ezek csökkentésének kihívásai versengenek. Az egyik engedélyezésének valószínűségének csökkenése pedig a másik engedélyezésének valószínűségének növekedését vonja maga után. A legtöbb esetben mindkét valószínűség csökkentésének egyetlen módja a minta méretének növelése.

Azt a szabályt, amely szerint a fő hipotézist elfogadják vagy elutasítják, ún statisztikai kritérium . Erre a célra egy K valószínűségi változót választunk, amelynek eloszlása ​​pontosan vagy megközelítőleg ismert, és amely a kísérleti és a hipotetikus értékek közötti eltérés mértékeként szolgál.

A hipotézis teszteléséhez a mintaadatok alapján számoljon szelektív(vagy megfigyelhető) kritériumértéke K megfigyelhető. Ezután a kiválasztott kritérium eloszlásának megfelelően a kritikus régió K Kréta. Ez egy olyan kritériumérték-készlet, amelynél a nullhipotézis elutasításra kerül. A lehetséges értékek fennmaradó részét hívjuk hipotézis elfogadásának területe. Ha a kritikus területre összpontosít, hibát követhet el
1. fajta, melynek valószínűsége előre adott és egyenlő a-val, ún jelentőség szintje hipotéziseket. Ez a következő követelményt jelenti a K kritikus tartományra vonatkozóan Kréta:

.



Az a szignifikancia szint határozza meg a K kritikus tartomány „méretét”. Kréta. A kritériumértékek halmazában elfoglalt helyzete azonban az alternatív hipotézis típusától függ. Például, ha a nullhipotézist teszteljük H 0:q=q 0, és az alternatív hipotézisnek a formája van H 1:q>q 0, akkor a kritikus tartomány a (K 2, +¥) intervallumból fog állni, ahol a K 2 pontot a feltételből határozzuk meg. P(K>K 2)=a ( jobb kritikus régió H 2:q P(K bal kritikus terület). Ha az alternatív hipotézis alakja H 3:q¹q 0, akkor a kritikus tartomány két intervallumból (–¥;K 1) és (K 2, +¥) fog állni, ahol a K 1 és K 2 pontokat a feltételek alapján határozzuk meg: P(K>K 2)=a/2 és P(K kétirányú kritikus régió).

A statisztikai hipotézisek tesztelésének alapelve a következőképpen fogalmazható meg. Ha K megfigyelhető kritikus tartományba esik, akkor a hipotézis H 0 elutasításra kerül, és a hipotézist elfogadjuk H 1. Ennek során azonban meg kell értenie, hogy itt 1. típusú hibát követhet el a valószínűséggel. Ha K megfigyelhető a hipotézis elfogadható tartományába esik - akkor nincs ok a nullhipotézis elutasítására H 0 . De ez egyáltalán nem azt jelenti H A 0 az egyetlen megfelelő hipotézis: egyszerűen a mintaadatok és a hipotézis közötti eltérés H 0 kicsi; ugyanakkor más hipotézisek is rendelkezhetnek ugyanezzel a tulajdonsággal.

A kritérium ereje annak a valószínűsége, hogy a nullhipotézis elutasításra kerül, ha az alternatív hipotézis igaz; azok. a kritérium hatványa 1–b, ahol b a 2-es típusú hiba elkövetésének valószínűsége. Legyen egy bizonyos a szignifikancia szint a hipotézis tesztelésére, és a minta fix méretű legyen. Mivel a kritikus tartomány megválasztásában van bizonyos önkényesség, célszerű úgy megszerkeszteni, hogy a kritérium hatványa maximális legyen, vagy a 2-es típusú hiba valószínűsége minimális legyen.

Az eloszlási paraméterekkel kapcsolatos hipotézisek tesztelésére használt kritériumokat ún jelentőségteljes kritériumok. Konkrétan egy kritikus tartomány felépítése hasonló a konfidenciaintervallum felépítéséhez. A mintavételi eloszlás és a feltételezett elméleti eloszlás közötti egyezés tesztelésére használt teszteket ún beleegyezési kritériumok.

Itt az átlagot ismert fix számnak tekintjük, a variancia pedig ismeretlen paraméterként működik. Tegyük fel

Mivel --, szabványos normál eloszlású. Így a függvénynek van egy olyan szabadságfok-eloszlása, amely semmilyen módon nem függ az ismeretlen paramétertől. Ennek az eloszlásnak a kvantiliseivel való jelölése és néhány rögzítése úgy, hogy , eljutunk az egyenlőtlenséghez

amely megelégszik a valószínűséggel . Honnan kapjuk a konfidencia intervallumot:

Ismeretlen átlagú variancia konfidencia intervalluma

Vegye figyelembe, hogy a függvény úgy van definiálva, hogy egy adott mintánál az értékei csak a paramétertől függenek. Egy valószínűségi változó eloszlásával kapcsolatban , akkor Fisher tétele szerint (lásd 8.3) ez a szabadságfokok -eloszlása, és ezért nem függ ismeretlen paraméterektől. Olyan javítás , és a (47) szerinti érvelés alapján a következő konfidenciaintervallumhoz jutunk:

amely a (30) jelöléssel a következőképpen írható át

Az ismeretlen varianciájú átlag konfidencia intervalluma

Az előző bekezdéshez hasonlóan mindkét paraméter ismeretlennek minősül, a zavaró paraméter a zavaró paraméter. Fisher tétele szerint

És

függetlenek, és eloszlásaik, illetve szabadságfok-eloszlásaik vannak. Ezért az arány

szabadságfokokkal rendelkező Student eloszlása ​​van. Válasszunk ki egy függvényt egyenlő a jobb oldallal (48):

ahol a (30) képlettel meghatározott minta szórása. A funkció nem függ kifejezetten a zavaró paramétertől. A szabadság fokát a Student-eloszlás kvantilisén keresztül jelölve azt kapjuk, hogy az egyenlőtlenség

valószínűséggel teljesül . Innen megkapjuk a megbízhatósági intervallumot:

Mivel a Student-eloszlás szimmetrikus, ezért a 3.3

Ezért a konfidenciaintervallum így írható fel

Így a minta átlaga ennek az intervallumnak a közepe.

8.2. példa

Nézzük a 6.4 példát. Tegyük fel hogy a minták mindegyikéből származnak normál disztribúciók a ismeretlen paramétereket – és ennek megfelelően. (Arról, hogy mi alapján tehetünk ilyen feltételezést, később a 9.5-ben lesz szó.)

Célunk a GS50 acél elméleti széntartalmára és szakítószilárdságára vonatkozó konfidenciaintervallumok megtalálása. Emlékezzünk arra, hogy az egyes minták mérete. Rögzítsünk egy egységhez közeli megbízhatósági valószínűséget, mondjuk. Az oldalon található Hallgatói eloszlási táblázat segítségével hozzávetőlegesen ezt határozzuk meg. A oldalon a 6.5 példában talált értékeket felidézve kiszámítjuk

és a (49) képlet segítségével megkapjuk a százalék -konfidencia intervallumot széntartalom

és - az érték konfidencia intervalluma szakítószilárdság

12. sz. laboratóriumi munka. Értékeléselmélet alapjai

A statisztikus a véletlenszerű változékonyságnak alávetett adatokkal foglalkozik. Viselkedésüket egy bizonyos valószínűség-eloszlási törvény jellemzi. Egy ilyen törvény általában ismeretlen mennyiségeket tartalmaz, amelyeket a törvény paramétereinek tekintünk. A megfigyelt adatok véletlenszerű változékonysága miatt ezek alapján lehetetlen a paraméterek teljesen pontos értékét megadni. Csak hozzávetőleges értékekkel kell megelégednünk. Tehát a matematikai statisztikus a következő mennyiségekkel dolgozik: - egy valószínűségi változó, amelyet soha nem figyel meg, de amelyet az általa vizsgált adatok „lelkének”, az őket kiváltó oknak tekint. Ezt az értéket több paraméter határozza meg; - a vizsgált adatok, amelyeket egy valószínűségi változó realizálásaként kapunk. Például egy valószínűségi változó a pontos idő. Megvalósításai a statisztikus számára elérhető óraleolvasások. A statisztikus feladata, hogy n óra t 1,...,t n leolvasását felhasználva állítsa be az időt a lehető legpontosabban. Emellett köteles jellemezni a megállapított érték pontosságát. A kívánt értéket t = t 0 + ξ(a,σ) formában értékeli ki, ahol t 0 a valódi időpont a kutatás időpontjában, ξ(a,σ) a valódi értéktől való eltérést jellemző valószínűségi változó. , t 0 , a, σ paraméterek, a ξ értéket az eloszlási törvény jellemzi, annak a valószínűsége, hogy különböző értékeket vesz fel. A becslés a statisztikában a megfigyelt adatokon alapuló paraméter közelítő értékének kiszámításának szabálya. A becslés egy paraméter hozzávetőleges értéke, amelyet a megfigyelt adatokból találtak meg. A gyakorlati felhasználásra szánt becslések összeállításakor három fő követelményt támasztanak a becslésekkel szemben:

    pontosság, vagyis a paraméter valódi értékéhez való közelség, a példában ξ(a,σ) kicsinek kell lennie;

    torzítatlanság, vagyis az a követelmény, hogy a becslés matematikai elvárása egyenlő legyen a példában szereplő paraméter valódi értékével, ξ(a,σ) átlagosan nullával egyenlő;

    konzisztencia, vagyis az a követelmény, hogy a megfigyelések számának növekedésével a becslés valószínűsége konvergáljon a paraméter valódi értékéhez. A példában nagy számú óra n esetén ξ(a,σ) értékének nullára kell irányulnia, egységnyi valószínűséggel.

Nincsenek minden szempontból legjobb becslések. Például az aritmetikai átlag, egy valószínűségi változó átlagos értékének széles körben használt becslése, az a tulajdonsága, hogy optimális a normális eloszlású adatokhoz. Hibához vezet azonban, ha az adatok között vannak kiugró értékek, vagyis élesen kiugró értékek. Ilyen kibocsátást a gazdaságban a durva mérési hibák vagy elírások generálnak, amelyekben a rubel és kopejka közötti pont eltűnhet, és a bérek százszorosára nőnek. Tekintsük azt a véletlenszerű folyamatot, amely Nagy-Britannia történetéhez kapcsolódik, amikor Nagy-Britannia térképére felrajzolják birtokainak finomított határait, szétszórva a világ minden részén. Ismeretes, hogy a Föld bármely pontját két koordináta jellemez - szélesség és hosszúság. Ma már minden iskolás hallott olyan műholdas műszerekről, amelyek akár méteres pontossággal meghatározzák a Föld bármely pontját. Azonban akkoriban még egy ilyen eszköz sem segített volna a tengerészeken, mivel egyetlen „referencia” műholdat sem észlelt volna az égen. A szélességi fokot közvetlenül a világítótestek horizont feletti magasságából határozták meg egy „szektáns” eszközzel, amely hasonló egy modern teodolithoz (teleszkóp plusz szögmérő). A hosszúság a földgömb forgási szöge, amelynél a lokális meridián és a hagyományos nullaként választott Greenwich-meridián egyesül. A Föld közel egy nap alatt 360°-os fordulatot tesz, azaz egy óra alatt 15°-ot, 4 perc alatt 1°-ot elfordul. A hosszúság meghatározásához pontosan ismernie kell a helyi és a greenwichi időt. Ha a navigátor azt mondja a kapitánynak: „Helyi dél, uram”, és a kapitány tudja az adott pillanatban Greenwichben töltött időt, akkor az időkülönbség 4 perccel osztva határozza meg a terület hosszúságát fokban. Ma minden egyszerű lenne – hívd fel Greenwich-et, és tudd meg az idejét. De akkor még nem találták fel a rádiót. Ha lett volna a hajón a perc töredékét mozgó kvarcóra évente, akkor sem lett volna gond, de az akkoriban létező legjobb kronométerek nem adták volna meg a hosszúságméréshez szükséges pontosságot. A több hónapos hajózás során több tíz perccel távolodtak el a pontos időtől. Amikor pedig 1831-ben a Beagle hajó világkörüli útra indult, hogy térképeket állítson össze, a hajó kapitánya, Fitz Roy, a felvilágosult és tanult ember 24(!) tengeri kronométert vitt magával. Mindegyik kronométer a saját „greenwichi idejét” mutatta. Ebben a tanulmányban a valószínűségi változó az a pillanat, amikor a navigátor valamilyen égitestről meghatározta a pontos helyi időt. A mért valószínűségi változó "lelke" az adott pillanatban Greenwichben érvényes valós idő. Ezt a mennyiséget ξ-vel jelöljük. Ennek a mennyiségnek az értéke soha nem ismert. A valószínűségi változó megfigyelt értékei (különböző) kronométerek leolvasásai. Mindegyikük elkövetett néhány hibát, de összességében a közös „lelket” követték, hozzátéve a saját véletlenszerű hibájukat. A valószínűségi változó becslése a greenwichi idő, amelyet a kapitány a megfigyelt adatokból feltételezett. Legyenek az x i, i = 1,...,n valószínűségi változók egy ξ valószínűségi változó realizációi, azaz azonos eloszlásúak (egy „lélek”), és bármely i-re a leolvasások átlagértéke egyenlő ugyanarra a számra: E( x i) = E(ξ). Ennek az állításnak a jelentése: tervezési problémák miatt nem lehet minden óra lemaradva vagy sietni. Átlagosan ugyanannyira valószínű, hogy sietnek vagy lemaradnak. Ezenkívül hagyják, hogy függetlenek legyenek. Más szóval, nincs semmi közös a csoportjukban. Így egy matróz, aki az óra leolvasását rögzíti, egy sorozatban rögzítheti azokat. Ekkor az utolsó leolvasást egy perccel később rögzítik, mint az elsőt. Vagy akár órákig is lóghatnak meleg helyen, és együtt rohangálnak a hőségtől. Az a feltételezés, hogy nincs ilyen jelenség, összhangban van a függetlenség feltételével a vizsgálatok során. A legegyszerűbb becslési probléma egy esemény valószínűségének meghatározása, például annak, hogy egy valódi (nem feltétlenül helyes) érme képpel felfelé fog landolni. Szinte soha nem lehet közvetlenül meghatározni egy esemény valószínűségét. Nincs olyan univerzális módszer, amely lehetővé tenné, hogy egy tetszőleges esemény jelezze annak valószínűségét. Az A esemény valószínűségét meg lehet becsülni, ha megengedhető független ismételt tesztek elvégzése, amelyek során ez az esemény állandó valószínűséggel következik be. Maradjon változatlan az A esemény p = P(A) valószínűsége mind az n próbában, és az egyes kísérletek eredménye független legyen a többitől. Jelöljük m-mel azon kísérletek véletlenszámát az összes n-ből, amelyekben A esemény történt. Azt mondják, hogy m a „sikerek” száma n Bernoulli-próbában. A valószínűség statisztikai definíciója szerint nagy n esetén az A esemény m/n relatív gyakorisága megközelítőleg egyenlő az A esemény bekövetkezésének valószínűségével, azaz m/n ~ p, ahol p = P(A). Bizonyítsuk be, hogy ez Kolmogorov axiomatikájából következik. A matematikai elemzésben a sorozat határértékének szigorú fogalmát alkalmazzák: kellően nagy számú sorozattag esetén értéke tetszőlegesen a határérték közelébe tehető. Ez a meghatározás nem felel meg a valós életnek, ahol ritkán fordulnak elő teljesen hihetetlen események. Például az ősi kaotikus levesből egy baktérium bukkan elő, amely képes önmagát szaporítani. Vagy egy hal alkot valamit, amire eleinte évmilliókig nincs szüksége (de fejlődik), aztán szárnysá válik. Vagy egy egész várost (vagy országot) elönt a víz. A valószínűségszámításban a határ fogalmát más értelemben értelmezik, mint a matematikai elemzésben. A valószínűségszámítás definíciója közelebb áll az élethez. Nem tiltja, hogy a sorozat egy pontján olyan szám legyen, amely élesen különbözik a többitől. Egy u n valószínűségi változók sorozata p-hez konvergál, ha bármely ε > 0 szám esetén annak a valószínűsége, hogy a különbség modulusa |u n - p| mivel n → ∞ kisebb, mint ε, egységre hajlik:

A valószínűségszámításban egyetlen esemény sem biztos, de az esemény: |u n - р| ≤ ε gyakorlatilag megbízható kellően nagy n esetén. Bizonyítsuk be Csebisev egyenlőtlenségét. Legyen ξ egy valószínűségi változó, amelynek matematikai elvárása E(ξ) = a és variancia D(ξ) = σ², ε pozitív szám. Ekkor annak az eseménynek a valószínűsége, hogy a központosított (E(ξ) - a) és normalizált valószínűségi változó meghaladja ε-t, kisebb, mint ε -2:

Valóban, σ² = E(ξ - a)². A jobb oldali átlag kiszámításakor két ξ értéktartományt választunk ki. Azokra a ξ-ekre, amelyekre |ξ - а|< εσ, сумма (или интеграл) соответствующих произведений неотрицателен. Для тех ξ, у которых |ξ - а| >εσ, összeg (vagy integrál):

Érdekes speciális eset: σ = 0. Nyilvánvaló, hogy |ξ - a| = 0, azaz ξ = a. Bizonyítsuk be Csebisev tételét. Legyenek x 1,..., x n független azonos eloszlású valószínűségi változók, amelyeknek matematikai elvárása és varianciája van. Azaz minden x i egy ξ valószínűségi változó realizációja, és E(ξ) = E(x i) = a, D(ξ) = D(x i) = σ². Ezután bármely ε > 0 esetén:

Bizonyíték. A számtani átlag szórása:

Tekintsük az η n valószínűségi változót, amely n megfigyelés számtani átlaga. Az átlaga és a szórása . η n megfigyelhető realizációi a következők. Az η n valószínűségi változóra vonatkozó Csebisev-egyenlőtlenségnek megfelelően annak a valószínűsége, hogy az átlagos értéktől nagyobb mértékben tér el, nullára hajlamos:

Az ellenkező esemény valószínűsége 1-re hajlamos nagy n esetén: P(|η n - a|) → 1. Ez azt jelenti, hogy az n valószínűségi változók sorozata valószínűség szerint a-hez konvergál. Térjünk vissza az idő mérésére a Beagle-en. Az egyes kronométerek x i, i = 1,...,n leolvasása a többi műszertől független mérés. Nyilvánvaló, hogy a kronométert úgy tervezték, hogy működésében ne legyen szisztematikus hiba. Ez azt jelenti, hogy a kronométerek egy része „előre mehet”, mások „lemaradnak”, de ezek a hibák véletlenszerűek, egy adott minta gyártásához kapcsolódnak. Matematikailag ez azt jelenti, hogy az átlagos idő a valódi idő. A kronométerek tervezési és gyártási technológiájának minőségét az jellemzi, hogy mennyire egyenletes a teljes termék pontossága. Matematikailag ezt fejezi ki az egyes műszerek leolvasásának terjedése, i.e. valószínűségi változók varianciája x i . Az átlag szórása n = 24-szer kisebb, mint egy egyedi kronométer diszperziója. Ezért a 24 kronométerből meghatározott „átlagidő” átlagosan közel 5-ször közelebb van a valódi időhöz, mint bármely egyedi kronométer ideje.

Az ökonometriai modellezés egyik központi feladata a függő változó értékeinek előrejelzése (előrejelzése) a magyarázó változók bizonyos értékeire a magyarázó változók bizonyos értékeire vonatkozóan. Itt kettős megközelítés lehetséges: vagy megjósoljuk a függő változó feltételes matematikai elvárását ( átlagos előrejelzés), vagy megjósolni a függő változó valamely meghatározott értékét ( egy adott érték előrejelzése).

Megjegyzés. Egyes szerzők különbséget tesznek az olyan fogalmak között, mint az előrejelzés és az előrejelzés. Ha a magyarázó változó értéke X pontosan ismert, akkor a függő változó becslése Y hívott jóslat. Ha a magyarázó változó értéke X nem tudni pontosan, akkor mondják, hogy mit csinálnak előrejelzésértékeket Y. Ez a helyzet jellemző az idősorokra. IN ebben az esetben nem fogunk különbséget tenni előrejelzés és előrejelzés között.

Megkülönböztetni foltÉs intervallum előrejelzés. Az első esetben a becslés egy bizonyos szám, a másodikban az az intervallum, amelyben az adott szignifikanciaszintű függő változó valódi értéke található.

A) Az átlag előrejelzése. Készítsünk egy páros regressziós egyenletet, amely alapján meg kell jósolni a feltételes matematikai elvárást . Ebben az esetben az érték egy pontbecslés . Ekkor természetesen felmerül a kérdés, hogy az empirikus egyenlettel számított modellérték mennyiben térhet el a megfelelő feltételestől. matematikai elvárás. Erre a kérdésre a választ egy adott értékre adott a szignifikancia szinttel megszerkesztett intervallumbecslések alapján adjuk meg. xp magyarázó változó.

Írjuk fel az empirikus regressziós egyenletet a formába

Itt két független összetevőt emelünk ki: az átlagot és a növekményt. Ebből következik, hogy a szórás egyenlő lesz

A mintavételi elméletből ismert, hogy

A maradék variancia felhasználása s2 becsléseként S 2, megkapjuk



A regressziós együttható szórása, amint az már látható

A talált eltéréseket (5.41) behelyettesítve kapjuk

. (5.56)

Így a számítási képlet standard hiba a regressziós egyenes által megjósolt Y átlagos értékeúgy néz ki

. (5.57)

A standard hiba értéke, amint az a képletből látható, eléri a minimumot a -nál, és bármely irányban növekszik a távolsággal. Más szóval, minél nagyobb a különbség a és között, annál több több hiba amellyel az átlagértéket megjósolják y Mert beállított érték xp. Várható legjobb eredményeket előrejelzés, ha az értékek xp a megfigyelési terület közepén vannak Xés nem számíthatsz rá jó eredményeket előrejelzés, amint távolodik innen.

Véletlen változó

(5.58)

n= szabadságfokszámú Student-eloszlása ​​van n–2 (belül normál klasszikus modell). Ezért a Student-eloszlás kritikus pontjainak táblázata szerint a szükséges szignifikanciaszint és a szabadságfokok száma szerint n= n–2 határozható meg kritikus pont, kielégíti a feltételt

.

Az (5.46) figyelembevételével a következőket kapjuk:

.

Innen, néhány után algebrai transzformációk, azt találjuk, hogy a konfidencia intervallum alakja a következő:

, (5.59)

Ahol határhiba D púgy néz ki

. (5.60)

Az (5.57) és (5.60) képletekből egyértelműen kiderül, hogy a konfidencia intervallum értéke (hossza) a magyarázó változó értékétől függ xp: amikor minimális, és ahogy távolodik xp a konfidenciaintervallum értékétől növekszik (5.4. ábra). Így a függő változó értékeinek előrejelzése Y a regressziós egyenlet szerint indokolt, ha az érték xp magyarázó változó X nem lépi túl a mintaértékek tartományát (sőt, minél közelebb xp To ). Más szóval, a regressziós görbe extrapolációja, azaz. használata a magyarázó változó felmért értéktartományán kívül(akkor is, ha a megoldandó probléma jelentése alapján indokolt a vizsgált változónál) jelentős hibákhoz vezethet.

b) A függő változó egyedi értékeinek előrejelzése. A gyakorlatban néha fontosabb az eltérés ismerete Y mint a feltételes matematikai elvárások átlagai vagy konfidenciaintervallumai. Ez annak köszönhető, hogy tényleges értékeket Y az átlagérték körül változnak. Egyéni értékek Y eltérhet az e véletlenszerű hiba mértékével, amelynek varianciáját az egy szabadságfokra eső maradék varianciáként becsüljük S 2. Ezért az előre jelzett egyedi érték hibája Y nem csak standard hibát kell tartalmaznia, hanem véletlenszerű hibát is S. Ez lehetővé teszi egy adott érték elfogadható határainak meghatározását Y.

Érdeklődjünk néhány lehetséges érték iránt y 0 változó Y egy bizonyos értéken xp magyarázó változó X. A regressziós egyenletből becsült érték Y at X=xpösszege y p. Ha figyelembe vesszük az értéket y 0 valószínűségi változóként Y 0, a y p– valószínűségi változóként Yp, akkor meg lehet jegyezni, hogy

,

.

Véletlen változók Y 0 és Yp függetlenek, ezért valószínűségi változók U=Y 0 –Yp normális eloszlású -val

ÉS . (5.61)

A maradék variancia használata s2-ként S 2, megkapjuk a számítási képletet a regressziós egyenesből előre jelzett Y egyedi érték standard hibája:

. (5.63)

Véletlen változó

(5.64)

van egy Student eloszlása ​​a szabadságfok számával k=n–2. Ez alapján lehetőség nyílik az egyes értékek konfidenciaintervallumának összeállítására Yp:

, (5.65)

Ahol határhiba D uúgy néz ki

. (5.66)

Megjegyezzük, hogy ez az intervallum szélesebb, mint a feltételes matematikai elvárás konfidenciaintervalluma (lásd 5.4. ábra).

5.5. példa. Az 5.1-5.3 példák adatai alapján számítsa ki a feltételes matematikai elvárás 95%-os konfidencia intervallumát és az egyedi értéket xp=160.

Megoldás. Az 5.1 példában ezt találtuk. Az (5.48) képlet segítségével azt találjuk határhiba feltételes matematikai elváráshoz

Ekkor az a=0,05 szignifikanciaszintű átlagérték konfidenciaintervalluma így fog kinézni

Vagyis a 160-as bevételű átlagfogyasztás 0,95 valószínűséggel a (149,8; 156,6) intervallumban lesz.

Számítsuk ki annak az intervallumnak a határait, amelyben a lehetséges fogyasztási mennyiségek legalább 95%-a összpontosul a jövedelem szintjén xp=160, azaz konfidencia intervallum az egyéni értékhez. Keressük meg egy egyedi érték korlátozó hibáját

Ekkor az az intervallum, amelyen belül az egyéni fogyasztási mennyiségek legalább 95%-a bevételnél lesz xp= 160, úgy néz ki

Könnyen belátható, hogy a feltételes átlagos fogyasztás konfidencia intervallumát tartalmazza. â

PÉLDÁK

5.65. példa. A régió területeire vonatkozóan 199X-es adatok szerepelnek (1.1. táblázat).

2. Épít lineáris egyenlet páros regresszió y-on xés értékelje a regressziós paraméterek statisztikai szignifikanciáját. Készítsen rajzot.

3. Értékelje a regressziós egyenlet minőségét a determinációs együttható segítségével! Ellenőrizze a regressziós egyenlet minőségét a segítségével F- Fisher kritérium.

4. Előrejelzés futtatása bérek y az egy főre jutó átlagos létminimum előre jelzett értékén x, ami az átlagos szint 107%-a. Értékelje az előrejelzés pontosságát az előrejelzési hiba és annak konfidencia intervallumának kiszámításával az a=0,05 szignifikancia szintre. vonjon le következtetéseket.

Megoldás

1. A kötési tömítettség mértékének meghatározására általában ezt használják korrelációs együttható:

ahol , a változók mintavarianciái xÉs y. A korrelációs együttható kiszámításához számítási táblázatot készítünk (5.4. táblázat):

5.4. táblázat

x y xy x 2 y 2 e 2
148,77 -15,77 248,70
152,45 -4,45 19,82
157,05 -23,05 531,48
149,69 4,31 18,57
158,89 3,11 9,64
174,54 20,46 418,52
138,65 0,35 0,13
157,97 0,03 0,00
144,17 7,83 61,34
157,05 4,95 24,46
146,93 12,07 145,70
182,83 -9,83 96,55
Teljes 1574,92
Átlagos érték 85,58 155,75 13484,00 7492,25 24531,42

A táblázat szerint a következőket találjuk:

, , , ,

, , , ,

, .

Így, között bérek(y) és az egy főre jutó átlagos létminimum (x) között közvetlen, meglehetősen erős összefüggés van .

Értékelésre statisztikai szignifikancia korrelációs együttható számoljunk kétirányú Student-féle t-próba:

amelynek Diákelosztása van k=n–2 és szignifikancia szint a. A mi esetünkben

És .

Mivel a korrelációs együttható jelentősen eltér a nullától.

Jelentős együttható esetén meg lehet építeni konfidencia intervallum, amely egy ismeretlen általános korrelációs együtthatót tartalmaz adott valószínűséggel. Intervallumbecslés összeállításához (kis mintákhoz n<30), используют Fisher z-transzformáció:

Elosztás z már kicsiben n egy hozzávetőleges normális eloszlás elvárással és szórással. Ezért először készítsünk konfidencia intervallumot M[ z], majd tegye az ellenkezőjét z-átalakítás. Jelentkezés z-transzformációt a talált korrelációs együtthatóra kapjuk

M( z) lesz az űrlap

,

Ahol t g az F( t g)=g/2. A g=0,95-re van t g = 1,96. Majd

vagy . Fordított z- az átalakítás a képlet szerint történik

Ennek eredményeként azt találjuk

.

A jelzett határokon belül 0,05-ös szignifikanciaszinten (0,95-ös megbízhatóság mellett) az általános r korrelációs együttható szerepel.

2. Így a változók között xÉs y szignifikáns összefüggés van. Feltételezzük, hogy ez a függőség lineáris. A páros lineáris regressziós modellnek a formája van

,

Ahol y– függő változó (eredményes attribútum), x– független (magyarázó) változó, e – véletlen eltérések, b 0 és b 1 – regressziós paraméterek. Korlátozott mintamérettel empirikus regressziós egyenletet állíthatunk össze:

Ahol b 0 és b 1 – empirikus regressziós együtthatók. A regressziós paraméterek becsléséhez általában használjuk legkisebb négyzetek módszere (MNC). Az OLS-nek megfelelően a függő változó tényleges értékeinek négyzetes eltéréseinek összege y az elméletiekből minimális volt:

,

Ahol eltérések y i a becsült regressziós egyenesből. A két változóból álló függvény minimum létezésének szükséges feltétele, hogy ismeretlen paraméterekre vonatkozó parciális deriváltjai nullával egyenlők. b 0 és b 1. Ennek eredményeként azt kapjuk normál egyenletrendszer:

Ezt a rendszert megoldva azt találjuk

, .

A táblázat adatai szerint találjuk

A kapott regressziós egyenlet:

Paraméter b 1 hívják regressziós együttható. Értéke az eredmény átlagos változását mutatja a tényező egy egységnyi változásával. A vizsgált esetben az átlagos egy főre jutó minimum 1 rubel növekedésével. átlagos napibér átlagosan 0,92 rubel nő .

,

Ahol F a Fisher-eloszlásnak engedelmeskedik a szignifikanciaszinttel és szabadságfokkal k 1 = 1 és k 2 =n–2. A mi esetünkben

.

Mivel a kritérium kritikus értéke az

és , akkor felismerjük a megszerkesztett regressziós egyenlet statisztikai szignifikanciáját. Vegye figyelembe, hogy a lineáris modellnél F- És t-kritériumokat egyenlőség köti össze, amivel a számításokat ellenőrizhetjük.

4. A regressziós egyenlet kapott becslései lehetővé teszik az előrejelzéshez való felhasználását. Előrejelzési érték y púgy határozzuk meg, hogy a megfelelő (előre jelzett) értéket behelyettesítjük az (1.16) regressziós egyenletbe. xp

5. ELŐADÁS 99

§5.2. A regressziós együttható becslések pontosságának elemzése 99

5.2.1. A véletlen eltérés variancia becslése 99

5.2.2. Hipotézisek tesztelése a regressziós együtthatókkal kapcsolatban 100

5.2.3. A regressziós együtthatók intervallumbecslése 103

§5.3. Regressziós egyenlet minőségi mutatói 104

5.3.1. Determinációs együttható 104

5.3.2. A regressziós egyenlet általános minőségének ellenőrzése: F-próba 106

5.3.3. A regressziós egyenlet általános minőségének ellenőrzése: t-próba 108

§5.4. Az intervallumok előrejelzése a 108-as regressziós egyenlet segítségével



Előző cikk: Következő cikk:

© 2015 .
Az oldalról | Kapcsolatok
| Webhelytérkép