Otthon » Hallucinogén » Variációs sorozat. Variációs sorozat definíciója

Variációs sorozat. Variációs sorozat definíciója

Variációs sorozatok: meghatározás, típusok, főbb jellemzők. Számítási módszer
módus, medián, számtani átlag az orvosi és statisztikai kutatásokban
(feltételes példával mutassa meg).

A variációs sorozat a vizsgált jellemző számértékeinek sorozata, amelyek nagyságrendjükben különböznek egymástól, és bizonyos sorrendben vannak elrendezve (növekvő vagy csökkenő sorrendben). Egy sorozat minden számértékét változatnak (V) nevezzük, és azokat a számokat, amelyek azt mutatják, hogy egy adott változat milyen gyakran fordul elő egy adott sorozatban, gyakoriságnak (p).

A variációs sorozatot alkotó megfigyelési esetek teljes számát n betűvel jelöljük. A vizsgált jellemzők jelentésének különbségét variációnak nevezzük. Ha egy változó jellemzőnek nincs mennyiségi mérőszáma, a változást kvalitatívnak, az eloszlási sorozatot pedig attribútumnak (például betegség kimenetel, egészségi állapot stb. szerinti megoszlás) nevezzük.

Ha egy változó jellemzőnek kvantitatív kifejezése van, akkor ezt a változást kvantitatívnak, az eloszlássorozatot pedig variációsnak nevezzük.

A variációs sorozatokat - a mennyiségi jellemző jellege alapján - nem folytonosra és folyamatosra osztják a változat előfordulási gyakorisága alapján.

Egy egyszerű variációs sorozatban minden opció csak egyszer fordul elő (p=1), egy súlyozott sorozatban ugyanaz az opció többször (p>1). Az ilyen sorozatok példáit a szövegben tovább tárgyaljuk. Ha a mennyiségi jellemző folytonos, pl. Az egész mennyiségek között vannak köztes törtmennyiségek, a variációs sorozatot folytonosnak nevezzük.

Például: 10.0 – 11.9

14,0 – 15,9 stb.

Ha a mennyiségi jellemző nem folytonos, pl. egyedi értékei (változatai) egész számmal különböznek egymástól, és nem tartalmaznak közbenső törtértékeket, a variációs sorozatot nem folytonosnak vagy diszkrétnek nevezik.

Az előző példa pulzusszámadatainak felhasználása

21 tanuló esetén variációs sorozatot készítünk (1. táblázat).

1. táblázat

Az orvostanhallgatók pulzusszám szerinti megoszlása ​​(bpm)

Így egy variációs sorozat felépítése a rendelkezésre álló számértékek (változatok) rendszerezését és rendszerezését jelenti, pl. meghatározott sorrendbe (növekvő vagy csökkenő sorrendbe) rendezik a hozzájuk tartozó frekvenciákkal. A vizsgált példában az opciók növekvő sorrendbe vannak rendezve, és egész nem folytonos (diszkrét) számok formájában vannak kifejezve, minden opció többször előfordul, pl. súlyozott, nem folytonos vagy diszkrét variációs sorozattal van dolgunk.

Általános szabály, hogy ha az általunk vizsgált statisztikai sokaságban a megfigyelések száma nem haladja meg a 30-at, akkor elegendő a vizsgált jellemző összes értékét növekvő variációs sorozatba rendezni, a táblázat szerint. 1, vagy csökkenő sorrendben.

Nagy számú megfigyelés esetén (n>30) az előforduló változatok száma igen nagy lehet ilyenkor egy intervallum- vagy csoportos variációs sorozatot állítunk össze, amelyben a későbbi feldolgozás egyszerűsítése és az eloszlás jellegének tisztázása érdekében a változatokat csoportokba vonják.

A csoportopciók száma általában 8 és 15 között van.

Legalább 5 legyen belőle, mert... ellenkező esetben túl durva, túlzott nagyítás lesz, ami torzítja az összképet a szórásról és nagyban befolyásolja az átlagértékek pontosságát. Ha a csoportváltozatok száma meghaladja a 20-25-öt, az átlagértékek számításának pontossága megnő, de a jellemző variációjának jellemzői jelentősen torzulnak, és bonyolultabbá válik a matematikai feldolgozás.

A csoportosított sorozat összeállításakor figyelembe kell venni

− az opciócsoportokat meghatározott sorrendbe kell rendezni (növekvő vagy csökkenő);

− az opciócsoportokban az intervallumoknak azonosaknak kell lenniük;

− az intervallumhatárok értékei nem eshetnek egybe, mert homályos lesz, hogy az egyes változatokat mely csoportokba soroljuk;

− az intervallumhatárok meghatározásakor figyelembe kell venni az összegyűjtött anyag minőségi jellemzőit (például a felnőttek súlyának vizsgálatakor 3-4 kg-os intervallum elfogadható, a gyermekeknél az élet első hónapjaiban nem haladhatja meg a 100 g-ot)

Készítsünk csoportos (intervallum) sorozatot, amely 55 orvostanhallgató vizsga előtti pulzusszámának (ütés/perc) adatait jellemzi: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Csoportosított sorozat készítéséhez szüksége lesz:

1. Határozza meg az intervallum méretét;

2. Határozza meg a variációs sorozat csoportjainak közepét, elejét és végét!

● Az (i) intervallum méretét a feltételezett csoportok száma (r) határozza meg, amelyek számát a megfigyelések számától függően (n) egy speciális táblázat alapján állítjuk be.

Csoportok száma a megfigyelések számától függően:

Esetünkben 55 tanuló számára 8-10 csoportot lehet létrehozni.

Az (i) intervallum értékét a következő képlet határozza meg:

i = V max-V min/r

Példánkban az intervallum értéke 82-58/8= 3.

Ha az intervallum értéke tört, akkor az eredményt a legközelebbi egész számra kell kerekíteni.

Többféle átlag létezik:

● számtani átlag,

● geometriai átlag,

● harmonikus átlag,

● négyzetes középérték,

● átlagos progresszív,

● medián

Az orvosi statisztikákban leggyakrabban számtani átlagokat használnak.

A számtani átlag (M) egy általánosító érték, amely meghatározza, hogy mi jellemző a teljes sokaságra. Az M kiszámításának fő módszerei: a számtani átlag módszere és a nyomatékok (feltételes eltérések) módszere.

Az egyszerű számtani átlag és a súlyozott számtani átlag kiszámításához az aritmetikai átlag módszerét használják. A számtani átlag számítási módszerének megválasztása a variációs sorozat típusától függ. Egy egyszerű variációs sorozat esetén, amelyben minden opció csak egyszer fordul elő, az egyszerű számtani átlagot a következő képlet határozza meg:

ahol: M – számtani középérték;

V – a változó jellemző értéke (változatai);

Σ – a cselekvést jelzi – összegzés;

n – a megfigyelések teljes száma.

Példa az egyszerű számtani átlag kiszámítására. Légzési frekvencia (légzési mozgások száma percenként) 9 35 éves férfinél: 20, 22, 19, 15, 16, 21, 17, 23, 18.

A 35 éves férfiak légzésszámának átlagos szintjének meghatározásához szükséges:

1. Készítsen variációs sorozatot, minden opciót növekvő vagy csökkenő sorrendbe rendezve. Egyszerű variációs sorozatot kaptunk, mert opcióértékek csak egyszer fordulnak elő.

M = ∑V/n = 171/9 = 19 légzés percenként

Következtetés. A 35 éves férfiak légzésszáma átlagosan 19 légzési mozgás percenként.

Ha egy változat egyedi értékei ismétlődnek, nem kell minden változatot egy sorba felírni, elég felsorolni a változat előforduló méreteit (V), és mellette feltüntetni az ismétlődések számát (p; ). Az ilyen variációs sorozatokat, amelyekben az opciókat mintegy súlyozzák a hozzájuk tartozó gyakoriságok számával, súlyozott variációs sorozatnak nevezzük, a számított átlagérték pedig a súlyozott számtani átlag.

A súlyozott számtani átlagot a következő képlet határozza meg: M= ∑Vp/n

ahol n a megfigyelések száma megegyezik a gyakoriságok összegével – Σр.

Példa a számtani súlyozott átlag kiszámítására.

A rokkantság időtartama (napokban) 35 helyi orvos által kezelt akut légúti megbetegedésben (ARI) szenvedő betegnél a tárgyév első negyedévében: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 nap.

Az akut légúti fertőzésben szenvedő betegek rokkantságának átlagos időtartamának meghatározására szolgáló módszer a következő:

1. Készítsünk súlyozott variációs sorozatot, mert Az opció egyedi értékei többször megismétlődnek. Ehhez az összes opciót növekvő vagy csökkenő sorrendbe rendezheti a megfelelő frekvenciákkal.

Esetünkben a lehetőségek növekvő sorrendben vannak elrendezve

2. Számítsa ki az aritmetikai súlyozott átlagot a következő képlet segítségével: M = ∑Vp/n = 233/35 = 6,7 nap

Az akut légúti fertőzésben szenvedők megoszlása ​​a rokkantság időtartama szerint:

A rokkantság időtartama (V) Betegek száma (p) Vp
∑p = n = 35 ∑Vp = 233

Következtetés. Az akut légúti betegségben szenvedő betegek rokkantságának időtartama átlagosan 6,7 nap volt.

A mód (Mo) a leggyakoribb opció a variációs sorozatban. A táblázatban bemutatott eloszlás esetén a mód egy 10-es opciónak felel meg, gyakrabban fordul elő, mint mások - 6-szor.

A betegek megoszlása ​​a kórházi ágyban töltött idő szerint (napokban)

V
p

Néha nehéz meghatározni egy módus pontos nagyságát, mert több „leggyakoribb” megfigyelés is lehet a vizsgált adatokban.

A medián (Me) egy nem paraméteres mutató, amely egy variációs sorozatot két egyenlő felére oszt: ugyanannyi változat található a medián mindkét oldalán.

Például a táblázatban látható eloszlásnál a medián 10, mert ennek az értéknek mindkét oldalán 14 lehetőség van, i.e. a 10-es szám központi helyet foglal el ebben a sorozatban, és a mediánja.

Tekintettel arra, hogy ebben a példában a megfigyelések száma páros (n=34), a medián a következőképpen határozható meg:

én = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Ez azt jelenti, hogy a sorozat közepe a tizenhetedik opcióra esik, ami 10-es mediánnak felel meg. A táblázatban bemutatott eloszlásnál a számtani átlag egyenlő:

M = ∑Vp/n = 334/34 = 10,1

Tehát 34 megfigyeléshez a táblázatból. 8, kaptuk: Mo=10, Me=10, a számtani átlag (M) 10,1. Példánkban mindhárom mutató egyenlőnek vagy egymáshoz közelinek bizonyult, bár teljesen eltérőek.

A számtani átlag az összes hatás effektív összege, kivétel nélkül, beleértve a szélsőségeseket is, amelyek gyakran atipikusak egy adott jelenségre vagy populációra.

A módus és a medián, ellentétben a számtani átlaggal, nem függ a változó jellemző összes egyedi értékének értékétől (a szélső változatok értékei és a sorozat szórásának mértéke). A számtani átlag a megfigyelések teljes tömegét jellemzi, a módus és a medián a tömeget.

Statisztikai eloszlási sorozat a vizsgált sokaság egységeinek rendezett elrendezését jelentik csoportosítási jellemzők szerint.

Vannak attribúciós és variációs eloszlási sorozatok.

Jelző egy minőségi jellemzők szerint felépített eloszlási sorozat. Különféle lényeges jellemzők szerint jellemzi a lakosság összetételét.

Mennyiségi kritériumok alapján épül fel variációs eloszlási sorozat. Ez az egyes opciók gyakoriságából (számából), vagy egy variációs sorozat egyes csoportjaiból áll. Ezek a számok azt mutatják, hogy a különböző opciók (attribútumértékek) milyen gyakran fordulnak elő az eloszlási sorozatban. Az összes gyakoriság összege határozza meg a teljes populáció méretét.

A csoportok számát abszolút és relatív értékben fejezzük ki. Abszolút értékben kifejezve az egyes kiválasztott csoportok népességi egységeinek számával, relatív értékben pedig - részesedések, fajsúlyok formájában, az összmennyiség százalékában kifejezve.

Az attribútum variációjának természetétől függően diszkrét és intervallum variációs eloszlási sorozatokat különböztetünk meg. Egy diszkrét variációs sorozatban a csoporteloszlásokat egy olyan jellemző szerint állítjuk össze, amely diszkréten változik, és csak egész értékeket vesz fel.

Intervallum variációs eloszlási sorozatban a csoportosítás alapját képező csoportosítási jellemző egy adott intervallumon belül tetszőleges értéket felvehet.

A variációs sorozatok két elemből állnak: frekvenciákból és variációkból.

Opció Egy változó jellemző egyedi értékének nevezik, amelyet az eloszlási sorozatban vesz fel.

Frekvencia- ez az egyes változatok vagy egy variációs sorozat egyes csoportjainak száma. Ha a gyakoriságokat egy egység töredékében vagy a teljes érték százalékában fejezzük ki, akkor ezeket frekvenciáknak nevezzük.

Az intervallum-eloszlási sorozatok felépítésének szabályai és alapelvei hasonló szabályokon és elveken alapulnak a statisztikai csoportosítások felépítéséhez. Ha az eloszlás intervallumvariációs sorozatát egyenlő intervallumokkal szerkesztjük, akkor a gyakoriságok lehetővé teszik annak megítélését, hogy az intervallum milyen mértékben van kitöltve populációs egységekkel. Az intervallumok foglaltságának összehasonlító elemzéséhez meghatározunk egy mutatót, amely az eloszlási sűrűséget jellemzi.

Eloszlási sűrűség a populációs egységek számának az intervallum szélességéhez viszonyított aránya.

Változatos mennyiségi jellemzők szerint felépített eloszlási sorozatoknak nevezzük. Minden variációs sorozat két elemből áll: opciókból és frekvenciákból. Opciók figyelembe veszik a jellemző egyedi értékeit, amelyeket a variációs sorozatban vesz fel, azaz a változó jellemző fajlagos értékét. Frekvenciák- ezek az egyes opciók vagy a variációs sorozat egyes csoportjainak számai, vagyis ezek a számok azt mutatják, hogy bizonyos opciók milyen gyakran fordulnak elő az elosztási sorozatban. Az összes gyakoriság összege határozza meg a teljes populáció méretét, mennyiségét.

Frekvenciák frekvenciáknak nevezzük, amelyeket egy egység töredékében vagy az összérték százalékában fejeznek ki. Ennek megfelelően a gyakoriságok összege 1 vagy 100%.

Egy karakterisztika variációjának természetétől függően diszkrét és intervallum variációs sorozatokat különböztetünk meg.

Mint ismeretes, a mennyiségi jellemzők változása lehet diszkrét (nem folytonos) vagy folyamatos.

Diszkrét variáció esetén egy mennyiségi jellemző értéke csak egész értékeket vesz fel. Ezért, diszkrét variációs sorozat jellemzi a lakossági egységek diszkrét jellemző szerinti eloszlása. Egy diszkrét variációs sorozatra példa a családok megoszlása ​​az egyes lakások szobaszáma szerint, a táblázatban. 3.12.

A táblázat első oszlopa egy diszkrét variációs sorozat opcióit mutatja be, a második oszlop a variációs sorozatok gyakoriságait, a harmadik pedig a gyakoriságokat tartalmazza.

Folyamatos ingadozás esetén egy jellemző értéke a sokaság egységeiben meghatározott határokon belül bármilyen értéket felvehet, amely kis mértékben eltér egymástól. Építés intervallum variációs sorozat Célszerű mindenekelőtt egy tulajdonság folyamatos variálása, illetve akkor is, ha a diszkrét variáció széles tartományban nyilvánul meg, vagyis egy diszkrét tulajdonság változatainak száma meglehetősen nagy. táblázatban 3.3 mutatja az intervallum variációs sorozatot.

Eloszlási sorozatok grafikus ábrázolása

Eloszlási sorozatok elemzése elvégezhető grafikus ábrázolásuk alapján. Az oszlop- és kördiagramok a populáció szerkezetét mutatják.

Az olyan vonalakat, mint a sokszög, a kumuláció, az ív és a hisztogram, szintén a diagramokkal együtt használják. A diszkrét variációs sorozatok ábrázolásakor sokszöget használunk.

Poligon- egy téglalap alakú koordináta-rendszer alapján megszerkesztett törött görbe, amikor a jellemző értékeit az X tengely mentén, a frekvenciákat pedig az Y tengely mentén ábrázoljuk.

Sima görbe összekötő pontok az empirikus eloszlássűrűség.

Halmozódik- egy téglalap alakú koordináta-rendszer alapján megszerkesztett törött görbe, amikor az attribútum értékei az X tengely mentén, a halmozott frekvenciák pedig az Y tengely mentén vannak ábrázolva.

Diszkrét sorozatok esetén maguk az attribútumértékek vannak ábrázolva a tengelyen, az intervallumsorozatok esetében pedig az intervallumok közepén.

A hisztogramok alapján lehetőség nyílik a halmozott frekvenciák diagramjainak összeállítására, majd az integrál empirikus eloszlásfüggvény megszerkesztésével.

A csoportosítási módszer lehetővé teszi a mérést is variáció jelek (változékonysága, fluktuációja). Ha a sokaságban lévő egységek száma viszonylag kicsi, a szórást a sokaságot alkotó egységek rangsorolt ​​száma alapján mérik. A sorozat az ún rangsorolt, ha az egységek a jellemző növekvő (csökkenő) sorrendjében vannak elrendezve.

A rangsorolt ​​sorozatok azonban meglehetősen tájékoztató jellegűek, ha a variáció összehasonlító jellemzőire van szükség. Emellett sok esetben nagy számú egységből álló statisztikai sokaságokkal kell számolnunk, amelyeket gyakorlatilag nehéz konkrét sorozat formájában ábrázolni. E tekintetben a statisztikai adatok kezdeti általános megismeréséhez, és különösen a jellemzők változásának tanulmányozása érdekében a vizsgált jelenségeket és folyamatokat általában csoportokba vonják, és a csoportosítási eredményeket csoporttáblázatok formájában mutatják be.

Ha egy csoporttáblázatnak csak két oszlopa van - egy kiválasztott jellemző (opciók) és a csoportok száma (gyakoriság vagy gyakoriság) szerinti csoportok, akkor az ún. elosztás közelében.

Elosztási tartomány - a szerkezeti csoportosítás legegyszerűbb típusa egy jellemző szerint, a jellemző változatait és gyakoriságait tartalmazó két oszlopos csoporttáblázatban megjelenítve. Sok esetben ilyen szerkezeti csoportosítással, pl. Az eloszlási sorozatok összeállításával megkezdődik a kiinduló statisztikai anyag tanulmányozása.

Egy eloszlási sorozat formájában kialakított strukturális csoportosítás akkor alakítható valódi strukturális csoportosítássá, ha a kiválasztott csoportokat nemcsak gyakorisággal, hanem egyéb statisztikai mutatókkal is jellemzik. Az eloszlási sorozatok fő célja a jellemzők változásának vizsgálata. Az eloszlási sorozatok elméletét a matematikai statisztika részletesen kidolgozza.

Az elosztási sorozatok fel vannak osztva jelző(attribúciós jellemzők szerinti csoportosítás, pl. a lakosság felosztása nem, nemzetiség, családi állapot stb. szerint) ill. variációs(csoportosítás mennyiségi jellemzők szerint).

Variációs sorozat egy csoporttábla, amely két oszlopot tartalmaz: az egységek csoportosítását egy mennyiségi jellemző és az egyes csoportok egységeinek száma szerint. A variációs sorozat intervallumai általában egyenlőek és zártak. A variációs sorozat az orosz lakosság következő csoportosítása az egy főre jutó átlagos monetáris jövedelem szerint (3.10. táblázat).

3.10. táblázat

Oroszország lakosságának megoszlása ​​az egy főre jutó átlagos jövedelem szerint 2004-2009-ben.

Népességcsoportok átlagos egy főre jutó készpénzjövedelem szerint, dörzsölő/hó

A csoport népessége, az összlétszám %-a

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Több mint 25 000,0

Az egész lakosság

A variációs sorozatok viszont diszkrétre és intervallumra oszlanak. Diszkrét variációs sorozatok olyan diszkrét jellemzők változatait egyesítik, amelyek szűk határok között változnak. A diszkrét variációs sorozatra példa az orosz családok megoszlása ​​a gyermekeik száma szerint.

Intervallum A variációs sorozatok folytonos vagy diszkrét jellemzők változatait kombinálják, amelyek széles tartományban változnak. Az intervallum az orosz lakosság átlagos egy főre jutó monetáris jövedelem szerinti megoszlásának variációs sorozata.

A gyakorlatban nem túl gyakran alkalmaznak diszkrét variációs sorozatokat. Mindeközben összeállításuk nem nehéz, hiszen a csoportok összetételét azok a konkrét változatok határozzák meg, amelyekkel a vizsgált csoportosítási jellemzők ténylegesen rendelkeznek.

Az intervallumvariációs sorozatok elterjedtebbek. Összeállításukkor nehéz kérdés merül fel a csoportok számával, illetve a kialakítandó intervallumok nagyságával kapcsolatban.

A probléma megoldásának alapelveit a statisztikai csoportosítások felépítésének módszertana című fejezet tartalmazza (lásd a 3.3. pontot).

A variációs sorozatok a változatos információk tömör formába bontásának vagy tömörítésének eszközei, amelyekből meglehetősen világosan lehet megítélni a variáció természetét, tanulmányozni a vizsgált halmazban szereplő jelenségek jellemzőinek különbségeit. A variációs sorozatok legfontosabb jelentősége azonban az, hogy ezek alapján számítják ki a variáció speciális általánosító jellemzőit (lásd 7. fejezet).

Nevezzük a különböző mintaértékeket opciókértéksorokat és jelölje: X 1 , X 2,…. Először is gyártunk terjedő opciók, pl. növekvő vagy csökkenő sorrendben való elrendezésüket. Mindegyik opciónál fel van tüntetve a saját súlya, pl. egy szám, amely egy adott opció hozzájárulását jellemzi a teljes népességhez. A frekvenciák vagy frekvenciák súlyként működnek.

Frekvencia n i opció x i egy szám, amely megmutatja, hogy egy adott opció hányszor fordul elő a vizsgált mintapopulációban.

Frekvencia vagy relatív gyakoriság w i opció x i egy olyan szám, amely egyenlő egy változat gyakoriságának az összes változat gyakoriságának összegéhez viszonyított arányával. A gyakoriság azt mutatja meg, hogy a mintapopuláció egységeinek hányadában van egy adott változat.

Az opciók sorozatát a hozzájuk tartozó súlyokkal (frekvenciákkal vagy frekvenciákkal), növekvő (vagy csökkenő) sorrendben felírva az ún. variációs sorozat.

A variációs sorozatok diszkrétek és intervallumúak.

Egy diszkrét variációs sorozatnál a jellemző pontértékei vannak megadva, egy intervallumsorozatnál a jellemző értékek intervallumok formájában vannak megadva. A variációs sorozatok a frekvenciák vagy a relatív frekvenciák (frekvenciák) eloszlását mutathatják meg, attól függően, hogy az egyes opciókhoz milyen érték van megadva - frekvencia vagy frekvencia.

Frekvenciaeloszlás diszkrét variációs sorozata a következő formában van:

A frekvenciákat a következő képlettel találjuk meg: i = 1, 2, …, m.

w 1 +w 2 + … + w m = 1.

Példa 4.1. Adott számkészlethez

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

frekvencia és frekvenciaeloszlás diszkrét variációs sorozatát szerkeszteni.

Megoldás . A lakosság mennyisége egyenlő n= 10. A diszkrét frekvenciaeloszlási sorozat alakja

Az intervallumsorozatoknak hasonló a rögzítési formája.

Frekvenciaeloszlás intervallum variációs sorozataígy van írva:

Az összes gyakoriság összege egyenlő a megfigyelések teljes számával, azaz. teljes mennyiség: n = n 1 +n 2 + … + n m.

A relatív gyakoriságok (frekvenciák) eloszlásának intervallumvariációs sorozatai a következő formában van:

A frekvenciát a következő képlet határozza meg: i = 1, 2, …, m.

Az összes frekvencia összege eggyel egyenlő: w 1 +w 2 + … + w m = 1.

A gyakorlatban leggyakrabban intervallumsorokat alkalmaznak. Ha sok a statisztikai mintaadat, és értékeik tetszőlegesen eltérnek egymástól, akkor ezeknek az adatoknak a diszkrét sorozata meglehetősen nehézkes és kényelmetlen lesz a további kutatáshoz. Ebben az esetben adatcsoportosítást alkalmazunk, azaz. Az attribútum összes értékét tartalmazó intervallumot több részintervallumra osztjuk, és az egyes intervallumok gyakoriságának kiszámításával intervallumsorozatot kapunk. Írjuk le részletesebben az intervallumsorozat felépítésének sémáját, feltételezve, hogy a részintervallumok hossza azonos lesz.

2.2 Intervallumsorozat felépítése

Intervallumsorozat készítéséhez a következőkre lesz szüksége:

Határozza meg az intervallumok számát;

Határozza meg az intervallumok hosszát;

Határozza meg az intervallumok helyét a tengelyen!

Meghatározni intervallumok száma k Létezik Sturges képlete, amely szerint

,

Ahol n- a teljes aggregátum térfogata.

Például, ha egy jellemzőnek (változatnak) 100 értéke van, akkor ajánlatos az intervallumokkal megegyező számú intervallumot venni egy intervallumsorozat felépítéséhez.

A gyakorlatban azonban nagyon gyakran maga a kutató választja meg az intervallumok számát, figyelembe véve, hogy ez a szám nem lehet túl nagy, hogy a sorozat ne legyen nehézkes, de ne legyen túl kicsi is, hogy ne veszítse el a sorozat bizonyos tulajdonságait. elosztás.

Intervallum hossza h a következő képlettel határozzuk meg:

,

Ahol x max és x min az opciók legnagyobb és legkisebb értéke.

Méret hívott hatálya sor.

Maguk az intervallumok létrehozásához különböző módon járnak el. Az egyik legegyszerűbb módszer a következő. Az első intervallum kezdetét úgy tekintjük
. Ezután az intervallumok fennmaradó határait a képlet találja meg. Nyilvánvalóan az utolsó intervallum vége a m+1-nek meg kell felelnie a feltételnek

Miután megtaláltuk az intervallumok határait, meghatározzuk ezen intervallumok gyakoriságát (vagy frekvenciáit). A probléma megoldásához tekintse át az összes lehetőséget, és határozza meg az adott intervallumba eső opciók számát. Nézzük meg egy intervallumsorozat teljes felépítését egy példa segítségével.

Példa 4.2. A következő, növekvő sorrendben rögzített statisztikai adatokhoz állítson össze egy intervallumsort 5-tel egyenlő intervallumokkal:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

Megoldás. Teljes n=50 változat érték.

Az intervallumok számát a problémafelvetésben adjuk meg, pl. k=5.

Az intervallumok hossza a
.

Határozzuk meg az intervallumok határait:

a 1 = 11 − 8,5 = 2,5; a 2 = 2,5 + 17 = 19,5; a 3 = 19,5 + 17 = 36,5;

a 4 = 36,5 + 17 = 53,5; a 5 = 53,5 + 17 = 70,5; a 6 = 70,5 + 17 = 87,5;

a 7 = 87,5 +17 = 104,5.

Az intervallumok gyakoriságának meghatározásához megszámoljuk az adott intervallumba eső opciók számát. Például a 2,5 és 19,5 közötti első intervallum a 11, 12, 12, 14, 14, 15 opciókat tartalmazza. Számuk 6, ezért az első intervallum gyakorisága n 1 = 6. Az első intervallum gyakorisága a . A 19,5 és 36,5 közötti második intervallum a 21, 21, 22, 23, 25 opciókat tartalmazza, amelyek száma 5. Ezért a második intervallum gyakorisága n 2 =5, és gyakoriság . Miután minden intervallumhoz hasonló módon megtaláltuk a frekvenciákat és a frekvenciákat, a következő intervallumsorozatot kapjuk.

A gyakorisági eloszlás intervallumsorozatának alakja:

A frekvenciák összege 6+5+9+11+8+11=50.

A gyakorisági eloszlás intervallumsorozatának alakja:

A frekvenciák összege 0,12+0,1+0,18+0,22+0,16+0,22=1. ■

Az intervallumsorok készítésekor a vizsgált probléma konkrét feltételeitől függően más szabályok is alkalmazhatók, nevezetesen

1. Az intervallumvariációs sorozatok különböző hosszúságú részintervallumokból állhatnak. Az egyenlőtlen intervallumok lehetővé teszik egy statisztikai sokaság tulajdonságainak kiemelését a jellemző egyenetlen eloszlásával. Például, ha az intervallumok határai határozzák meg a városok lakosainak számát, akkor ebben a feladatban célszerű nem egyenlő hosszúságú intervallumokat használni. Nyilvánvalóan a kisvárosok számára fontos a lakosságszám kis különbsége, de a nagyvárosoknál a több tíz-száz lakos különbség nem jelentős. Az egyenlőtlen hosszúságú részintervallumokkal rendelkező intervallumsorokat főként a statisztika általános elmélete tanulmányozza, és ezek figyelembevétele meghaladja a jelen kézikönyv kereteit.

2. A matematikai statisztikában időnként olyan intervallumsorozatokat is figyelembe vesznek, amelyeknél az első intervallum bal határát –∞-nek, az utolsó intervallum jobb oldali határát pedig +∞-nek tételezzük fel. Ez azért történik, hogy a statisztikai eloszlást közelebb hozzuk az elméletihez.

3. Intervallumsorok felépítésénél kiderülhet, hogy valamelyik opció értéke pontosan egybeesik az intervallum határával. Ebben az esetben a legjobb teendő a következő. Ha csak egy ilyen egybeesés van, akkor vegye figyelembe, hogy a szóban forgó lehetőség a gyakoriságával az intervallumsor közepéhez közelebb eső intervallumba esett, ha több ilyen lehetőség van, akkor vagy mindegyik hozzá van rendelve az intervallumokhoz ezek közül a lehetőségek közül jobbra, vagy mindegyik a bal oldalhoz van hozzárendelve.

4. Az intervallumok számának és hosszának meghatározása után az intervallumok elrendezése más módon is elvégezhető. Keresse meg az opciók összes figyelembe vett értékének számtani átlagát X Házasodik és építsük fel az első intervallumot úgy, hogy ez a mintaátlag valamilyen intervallumon belül legyen. Így az intervallumot kapjuk X Házasodik – 0,5 h hogy Xátl.. ​​+ 0,5 h. Majd balra és jobbra az intervallum hosszát összeadva a fennmaradó intervallumokat addig építjük x min és x max nem fog beleesni az első és az utolsó intervallumba.

5. A nagy számú intervallumot tartalmazó intervallumsorokat kényelmesen függőlegesen írjuk, azaz. az intervallumokat ne az első sorba, hanem az első oszlopba írja be, a második oszlopba pedig a gyakoriságokat (vagy frekvenciákat).

A mintaadatok valamilyen valószínűségi változó értékeinek tekinthetők X. A valószínűségi változónak saját eloszlási törvénye van. Valószínűségelméletből ismert, hogy egy diszkrét valószínűségi változó eloszlási törvénye eloszlási sorozat formájában adható meg, a folytonosé pedig - az eloszlássűrűség függvény segítségével. Van azonban egy univerzális eloszlási törvény, amely mind a diszkrét, mind a folytonos valószínűségi változókra érvényes. Ez az eloszlási törvény eloszlásfüggvényként van megadva F(x) = P(X<x). A mintaadatokhoz megadhatja az eloszlásfüggvény analógját - az empirikus eloszlásfüggvényt.


Kapcsolódó információk.


Elosztási sorozatok formájában jelennek meg, és formában jelennek meg.

Az elosztási sorozat a csoportosítások egyik fajtája.

Elosztási tartomány— a vizsgált sokaság egységeinek csoportokba rendezett eloszlását jelenti egy bizonyos változó jellemző szerint.

Az eloszlási sorozat kialakulásának hátterében álló jellemzőtől függően megkülönböztetjük őket attribúciós és variációs elosztási sorok:

  • Jelző- minőségi jellemzők szerint felépített eloszlási sorozatoknak nevezzük.
  • Egy mennyiségi jellemző értékeinek növekvő vagy csökkenő sorrendjében felépített eloszlási sorozatokat ún. variációs.
Az eloszlás variációs sorozata két oszlopból áll:

Az első oszlop a változó jellemző mennyiségi értékeit tartalmazza, amelyeket ún opciókés ki vannak jelölve. Diszkrét opció – egész számként kifejezve. Az intervallum opció tól és -ig terjed. Az opciók típusától függően diszkrét vagy intervallumváltozat-sorozatot hozhat létre.
A második oszlop tartalmazza konkrét opciók száma, frekvenciákban vagy frekvenciákban kifejezve:

Frekvenciák- ezek abszolút számok, amelyek azt mutatják, hányszor fordul elő egy jellemző adott értéke az aggregátumban, amelyek jelölik. Az összes gyakoriság összegének meg kell egyeznie a teljes sokaság egységeinek számával.

Frekvenciák() a gyakoriságok az összérték százalékában kifejezve. Az összes gyakoriság százalékban kifejezett összegének 100%-nak kell lennie, az egy töredékében.

Eloszlási sorozatok grafikus ábrázolása

A disztribúciós sorozatok vizuálisan, grafikus képek segítségével kerülnek bemutatásra.

A terjesztési sorozatok a következők:
  • Poligon
  • Hisztogramok
  • Halmozódik
  • Ogives

Poligon

Sokszög megalkotásakor a változó karakterisztika értékeit a vízszintes tengelyen (x-tengely), a frekvenciákat vagy a frekvenciákat a függőleges tengelyen (y-tengely) ábrázoljuk.

ábrán látható sokszög. A 6.1 Oroszország lakosságának 1994-es mikrocenzusának adatain alapul.

6.1. Háztartás méret szerinti megoszlása

Állapot: Az egyik vállalkozás 25 fős díjszabási kategóriák szerinti megoszlására vonatkozó adatok:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Feladat: Konstruáljon egy diszkrét variációs sorozatot, és ábrázolja grafikusan eloszlási sokszögként.
Megoldás:
Ebben a példában a lehetőségek a munkavállaló fizetési osztálya. A gyakoriság meghatározásához ki kell számítani az alkalmazottak számát a megfelelő tarifakategóriával.

A sokszög diszkrét variációs sorozatokhoz használatos.

Egy eloszlási sokszög megalkotásához (1. ábra) az abszcissza (X) tengelyen ábrázoljuk a változó jellemzők – opciók – mennyiségi értékeit, az ordináta tengelyen pedig a frekvenciákat vagy frekvenciákat.

Ha egy jellemző értékeit intervallumok formájában fejezzük ki, akkor egy ilyen sorozatot intervallumnak nevezünk.
Intervallum sorozat az eloszlásokat grafikusan ábrázolják hisztogram, kumulátum vagy ogive formájában.

Statisztikai táblázat

Állapot: Az adatok egy bankban 20 személy betéteinek méretére vonatkoznak (ezer rubel) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Feladat: Intervallumváltozat-sorozat készítése egyenlő intervallumokkal.
Megoldás:

  1. A kezdeti sokaság 20 egységből áll (N = 20).
  2. A Sturgess-képlet segítségével meghatározzuk a felhasznált csoportok szükséges számát: n=1+3,322*lg20=5
  3. Számítsuk ki az egyenlő intervallum értékét: i=(152 - 2) /5 = 30 ezer rubel
  4. Osszuk fel a kezdeti populációt 5 csoportra, 30 ezer rubel intervallummal.
  5. A csoportosítás eredményeit a táblázatban mutatjuk be:

Egy folytonos karakterisztika ilyen rögzítésekor, amikor ugyanaz az érték kétszer fordul elő (egy intervallum felső határaként és egy másik intervallum alsó határaként), akkor ez az érték abba a csoportba tartozik, ahol ez az érték felső határként működik.

Hisztogram

A hisztogram elkészítéséhez az intervallumok határainak értékeit az abszcissza tengelyen jelzik, és ezek alapján téglalapokat készítenek, amelyek magassága arányos a frekvenciákkal (vagy frekvenciákkal).

ábrán. 6.2. hisztogramja mutatja az orosz lakosság 1997-es korcsoportonkénti megoszlását.

Rizs. 6.2. Az orosz lakosság korcsoportok szerinti megoszlása

Állapot: Meg van adva a cég 30 dolgozójának havi fizetés szerinti megoszlása

Feladat: Az intervallumvariáció-sorozat grafikus megjelenítése hisztogram formájában, és kumulálható.
Megoldás:

  1. A nyitott (első) intervallum ismeretlen határát a második intervallum értéke határozza meg: 7000 - 5000 = 2000 rubel. Ugyanezzel az értékkel találjuk meg az első intervallum alsó határát: 5000 - 2000 = 3000 rubel.
  2. A hisztogram téglalap alakú koordinátarendszerben történő felépítéséhez az abszcissza tengely mentén ábrázoljuk azokat a szegmenseket, amelyek értékei megfelelnek a varikózus sorozat intervallumainak.
    Ezek a szegmensek az alsó alapként szolgálnak, a megfelelő frekvencia (frekvencia) pedig a kialakított téglalapok magasságaként szolgál.
  3. Készítsünk hisztogramot:

A kumulátumok létrehozásához ki kell számítani a felhalmozott frekvenciákat (frekvenciákat). Meghatározásuk az előző intervallumok gyakoriságának (frekvenciáinak) szekvenciális összegzésével történik, és S-nek jelöljük. A halmozott gyakoriságok azt mutatják meg, hogy a sokaság hány egységének jellemző értéke nem nagyobb, mint a vizsgált.

Halmozódik

Egy variációs sorozatban lévő karakterisztika halmozott frekvenciákon (frekvenciákon) való eloszlását kumulátum segítségével ábrázoljuk.

Halmozódik vagy egy kumulatív görbe, ellentétben a sokszöggel, halmozott frekvenciákból vagy frekvenciákból épül fel. Ebben az esetben a karakterisztika értékei az abszcissza tengelyre, a halmozott frekvenciák vagy frekvenciák pedig az ordináta tengelyre kerülnek (6.3. ábra).

Rizs. 6.3. A háztartásméret-eloszlás kumulátumai

4. Számítsuk ki a felhalmozott frekvenciákat:
Az első intervallum kumulatív gyakoriságát a következőképpen számítjuk ki: 0 + 4 = 4, a másodiknál: 4 + 12 = 16; a harmadiknál: 4 + 12 + 8 = 24 stb.

A kumulátum összeállításakor a megfelelő intervallum halmozott frekvenciáját (frekvenciáját) a felső határához rendeljük:

Ogiva

Ogiva A kumulátumhoz hasonlóan épül fel azzal a különbséggel, hogy a felhalmozott frekvenciák az abszcissza tengelyre, a karakterisztikus értékek pedig az ordináta tengelyre kerülnek.

A kumulátum egy típusa a koncentrációs görbe vagy a Lorentz-görbe. Koncentrációs görbe felépítéséhez a szögletes koordináta-rendszer mindkét tengelyén egy 0-tól 100-ig terjedő százalékos skála jelenik meg. Ugyanakkor az abszcissza tengelyen a felhalmozott frekvenciák és a részesedés halmozott értékei láthatók. (százalékban) az ordináta tengelyen vannak feltüntetve.

A karakterisztika egyenletes eloszlása ​​megfelel a grafikonon látható négyzet átlójának (6.4. ábra). Egyenetlen eloszlás esetén a grafikon egy homorú görbét ábrázol a tulajdonság koncentrációjának szintjétől függően.

6.4. Koncentrációs görbe

Előző cikk: Következő cikk:

© 2015 .
Az oldalról | Kapcsolatok
| Webhelytérkép