Otthon » Gomba feldolgozás » Általánosított Bayes-képlet. Bayes tételének egyszerű magyarázata

Általánosított Bayes-képlet. Bayes tételének egyszerű magyarázata

Fogalmazd meg és bizonyítsd be a teljes valószínűség képletét! Mondjon példát az alkalmazására!

Ha a H 1, H 2, ..., H n események páronként inkompatibilisek, és ezek közül legalább egy minden teszt során szükségszerűen bekövetkezik, akkor bármely A eseményre a következő egyenlőség érvényesül:

P(A)= P H1 (A)P(H 1)+ PH2 (A)P(H 2)+…+ P Hn (A)P(H n) – teljes valószínűségi képlet. Ebben az esetben H 1, H 2, …, H n hipotéziseknek nevezzük.

Bizonyíték: Az A esemény opciókra bomlik: AH 1, AH 2, ..., AH n. (A jön H 1-el stb.) Vagyis A = AH 1 + AH 2 +…+ AH n. Mivel a H 1 , H 2 , …, H n páronként inkompatibilis, az AH 1 , AH 2 , …, AH n események is inkompatibilisek. Az összeadási szabályt alkalmazva a következőket kapjuk: P(A)= P(AH 1)+ P(AH 2)+…+ P(AH n). A jobb oldali P(AH i) tagokat a P Hi (A)P(H i) szorzattal helyettesítve megkapjuk a szükséges egyenlőséget.

Példa:

Tegyük fel, hogy két alkatrészkészletünk van. Annak a valószínűsége, hogy az első halmaz része szabványos, 0,8, a másodiké 0,9. Határozzuk meg annak a valószínűségét, hogy egy véletlenszerűen vett rész szabványos.

P(A) = 0,5*0,8 + 0,5*0,9 = 0,85.

Fogalmazd meg és bizonyítsd be Bayes képletét. Mondjon példát az alkalmazására!

Bayes formula:

Lehetővé teszi a hipotézisek valószínűségének újrabecslését, miután az A eseményt eredményező teszt eredménye ismertté válik.

Bizonyíték: Hagyja, hogy az A esemény bekövetkezzen a H 1 , H 2 , …, H n összeférhetetlen események valamelyikének bekövetkezésétől függően, amely egy teljes csoportot alkot. Mivel nem ismert előre, hogy ezek közül az események közül melyik fog bekövetkezni, ezeket hipotéziseknek nevezzük.

Az A esemény bekövetkezésének valószínűségét a teljes valószínűségi képlet határozza meg:

P(A)= PH1 (A)P(H 1)+ PH2 (A)P(H2)+…+ P Hn (A)P(H n) (1)

Tegyük fel, hogy egy tesztet végeztünk, melynek eredményeként megjelent az A esemény. Határozzuk meg, hogyan változtak a hipotézisek valószínűségei az A esemény miatt. Más szóval, feltételes valószínűségeket fogunk keresni

P A (H 1), P A (H 2), ..., P A (H n).

A szorzási tétel alapján a következőt kapjuk:

P(AH i) = P(A) P A (H i) = P(H i)P Hi (A)

Helyettesítsük itt P(A)-t az (1) képlet szerint, megkapjuk

Példa:

Három egyforma kinézetű doboz van. Az első dobozban n=12 fehér golyó, a másodikban m=4 fehér és n-m=8 fekete golyó, a harmadikban n=12 fekete golyó található. Egy véletlenszerűen kiválasztott dobozból fehér golyót veszünk. Határozzuk meg annak P valószínűségét, hogy a golyót a második mezőből húzzuk ki.

Megoldás.

4) Vezesse le a valószínűség képletét!ksiker a sorozatbanntesztek a Bernoulli-séma szerint.

Vizsgáljuk meg az esetet, amikor előállítják n azonos és független kísérletek, amelyek mindegyikének csak 2 eredménye ( A;). Azok. bizonyos tapasztalatok ismétlődnek n alkalommal, és minden kísérletben valamilyen eseményt A valószínûséggel megjelenhet P(A)=q vagy nem jelenik meg valószínűséggel P()=q-1=p .

Az egyes tesztsorozatok elemi eseményeinek tere pontokat vagy szimbólumsorozatokat tartalmaz AÉs . Az ilyen valószínűségi teret Bernoulli-sémának nevezzük. A feladat annak biztosítása, hogy adott k találja meg annak a valószínűségét n- a kísérleti esemény többszöri megismétlése A jönni fog k egyszer.

A nagyobb áttekinthetőség érdekében állapodjunk meg egy esemény minden előfordulásában A sikernek, nem előrelépésnek tekinteni A - mint a kudarc. Célunk, hogy megtaláljuk ennek a valószínűségét n pontosan kísérleteznek k sikeres lesz; Jelöljük ezt az eseményt ideiglenesen a következővel: B.

Esemény IN eseménysorozat – eseménylehetőségek – összegeként jelenik meg IN. Egy adott opció rögzítéséhez meg kell adni a sikeresen végződő kísérletek számát. Például az egyik lehetséges opció az

. Az összes opció száma nyilvánvalóan egyenlő -vel, és az egyes opciók valószínűsége a kísérletek függetlensége miatt egyenlő -vel. Ezért az esemény valószínűsége IN egyenlő . Hogy hangsúlyozzuk a kapott kifejezés függőségét nÉs k, jelöljük . Így, .

5) Az integrál közelítő Laplace-képlet segítségével állítson elő egy képletet az A esemény relatív gyakoriságának az A előfordulásának p valószínűségétől való eltérésének becslésére egy kísérletben.

A Bernoulli-séma feltételei mellett adott n és p értékekkel adott e>0 esetén megbecsüljük az esemény valószínűségét, ahol k az n kísérlet sikereinek száma. Ez az egyenlőtlenség ekvivalens |k-np|£en, azaz. -en £ k-np £ en vagy np-en £ k £ np+en. Tehát a k 1 £ k £ k 2 esemény valószínűségének becsléséről beszélünk, ahol k 1 = np-en, k 2 = np+en. Az integrál közelítő Laplace-képletet alkalmazva a következőt kapjuk: P( » A Laplace-függvény páratlanságát figyelembe véve a P( » 2Ф) közelítő egyenlőségét kapjuk.

Jegyzet : mert n=1 feltétellel, akkor n helyett egyet helyettesítünk, és megkapjuk a végső választ.

6) Hagyjuk X– egy diszkrét valószínűségi változó, amely csak nem negatív értékeket vesz fel, és matematikai elvárásokkal rendelkezik m. Bizonyítsd be P(X≥ 4) ≤ m/ 4 .

m= (mivel az 1. tag pozitív, akkor ha eltávolítod, akkor kevesebb lesz) ³ (csere a 4-gyel csak kevesebb lesz) ³ = =4× P(X³4). Innen P(X≥ 4) ≤ m/ 4 .

(4 helyett tetszőleges szám lehet).

7) Bizonyítsa be, hogy ha XÉs Y független diszkrét valószínűségi változók, amelyek véges értékhalmazt vesznek fel, akkor M(XY)=M(X)M(Y)

x 1 x 2
1. o p2

hívott szám M(XY)= x 1 p 1 + x 2 p 2 + …

Ha a valószínűségi változók XÉs Y függetlenek, akkor a szorzatuk matematikai elvárása megegyezik matematikai elvárásaik szorzatával (a matematikai elvárások szorzásának tétele).

Bizonyíték: Lehetséges értékek X jelöljük x 1, x 2,…, lehetséges értékek Y - y 1 , y 2, … A p ij =P(X=xi, Y=yj). XY M(XY)= A mennyiségek függetlensége miatt XÉs Y nálunk van: P(X=xi, Y=yj)=P(X=xi) P(Y=yj). Miután kijelölte P(X=xi)=ri, P(Y=yj)=sj, ezt az egyenlőséget átírjuk a formába p ij =r i s j

Így, M(XY)= = . A kapott egyenlőséget átalakítva a következőket kapjuk: M(XY)=()() = M(X)M(Y), Q.E.D.

8) Bizonyítsa be, hogy ha XÉs Y diszkrét valószínűségi változók, amelyek véges értékhalmazt vesznek fel, akkor M(X+Y) = M(X) +M(Y).

Eloszlástörvénnyel rendelkező diszkrét valószínűségi változó matematikai elvárása

x 1 x 2
1. o p2

hívott szám M(XY)= x 1 p 1 + x 2 p 2 + …

Két valószínűségi változó összegének matematikai elvárása megegyezik a következő kifejezések matematikai elvárásainak összegével: M(X+Y)= M(X)+M(Y).

Bizonyíték: Lehetséges értékek X jelöljük x 1, x 2,…, lehetséges értékek Y - y 1 , y 2, … A p ij =P(X=xi, Y=yj). A nagyságrendi eloszlás törvénye X+Y a megfelelő táblázatban lesz kifejezve. M(X+Y)= .Ez a képlet a következőképpen írható át: M(X+Y)= .A jobb oldal első összege így ábrázolható. A kifejezés annak a valószínűsége, hogy az események bármelyike ​​bekövetkezik (X=x i, Y=y 1), (X=x i, Y=y 2), ... Ezért ez a kifejezés egyenlő P(X=x i) . Innen . Hasonlóképpen, . Ennek eredményeként a következőt kapjuk: M(X+Y)= M(X)+M(Y), amit igazolni kellett.

9) Hagyjuk X– a binomiális eloszlási törvény szerint eloszló diszkrét valószínűségi változó paraméterekkel nÉs r. Bizonyítsd be M(X)=nр, D(X)=nр(1-р).

Hagyd előállítani n független kísérletek, amelyek mindegyikében az A esemény bekövetkezhet valószínûséggel r, tehát az ellenkező esemény valószínűsége Ā egyenlő q=1-p. Tekintsük a következőket. méret X– az esemény előfordulásának száma A V n kísérletek. Képzeljük el X-et az A esemény indikátorainak összegeként minden egyes kísérlethez: X=X 1 +X 2 +…+X n. Most bizonyítsuk be M(Xi)=p, D(Xi)=np. Ehhez vegyük figyelembe az sl eloszlás törvényét. mennyiség, ami így néz ki:

X
R r q

Ez nyilvánvaló M(X)=p, az X 2 valószínűségi változónak ugyanaz az eloszlási törvénye, ezért D(X)=M(X2)-M2(X)=р-р 2 =р(1-р)=рq. Így, M(Xi)=p, D(Х i)=pq. A matematikai elvárások összeadásának tétele szerint M(X)=M(X1)+..+M(Xn)=nr. Mivel a valószínűségi változók X i függetlenek, akkor az eltérések is összeadódnak: D(X)=D(X1)+…+D(Xn)=npq=np(1-p).

10) Hagyjuk X– diszkrét valószínűségi változó a Poisson-törvény szerint λ paraméterrel. Bizonyítsd be M(X) = λ .

A Poisson-törvényt a táblázat adja meg:

Innentől a következőket kapjuk:

Így a λ paraméter, amely ezt a Poisson-eloszlást jellemzi, nem más, mint az X érték matematikai elvárása.

11) Legyen X egy diszkrét valószínűségi változó, amely egy geometriai törvény szerint eloszlik p paraméterrel. Bizonyítsuk be, hogy M (X) = .

A geometriai eloszlási törvény a Bernoulli-próbák sorozatához kapcsolódik az 1. sikeres A eseményig. Az A esemény bekövetkezésének valószínűsége egy kísérletben p, az ellenkező esemény q = 1-p. Az X valószínűségi változó eloszlási törvénye - a tesztek száma - a következőképpen alakul:

X n
R r pq pq n-1

A zárójelben lévő sorozatot a geometriai progresszió tagonkénti differenciálásával kapjuk

Ezért,.

12) Bizonyítsuk be, hogy az X és Y valószínűségi változók korrelációs együtthatója teljesíti a feltételt.

Meghatározás: Két valószínűségi változó korrelációs együtthatója a kovariancia aránya e változók szórásának szorzatához: . .

Bizonyíték: Tekintsük a Z = valószínűségi változót. Számítsuk ki a szórását. Mivel a bal oldal nem negatív, a jobb oldal nem negatív. Ezért , |ρ|≤1.

13) Hogyan történik a variancia kiszámítása folytonos sűrűségű eloszlás esetén? f(x)? Bizonyítsuk be ezt egy valószínűségi változóra X sűrűséggel diszperzió D(X) nem létezik, és a matematikai elvárás M(X) létezik.

Egy f(x) sűrűségfüggvénnyel és m = M(X) matematikai elvárással rendelkező abszolút folytonos X valószínűségi változó varianciáját ugyanaz az egyenlőség határozza meg, mint egy diszkrét változó esetében.

Abban az esetben, ha egy abszolút folytonos X valószínűségi változó koncentrálódik az intervallumra,

∞ - az integrál divergál, ezért diszperzió nem létezik.

14) Bizonyítsuk be, hogy X normál valószínűségi változóra eloszlássűrűségfüggvénnyel matematikai elvárás M(X) = μ.

Képlet

Bizonyítsuk be, hogy μ a matematikai elvárás.

A folytonos r.v. matematikai elvárásának meghatározásával,

Vezessünk be egy új változót. Innen. Figyelembe véve, hogy az integráció új korlátai megegyeznek a régiekkel, megkapjuk

A tagok közül az első egyenlő nullával az integrandusfüggvény páratlansága miatt. A kifejezések közül a második egyenlő μ (Poisson integrál ).

Így, M(X)=μ, azaz a normális eloszlás matematikai elvárása megegyezik a paraméterrel μ.

15) Bizonyítsuk be, hogy X normál valószínűségi változóra eloszlássűrűségfüggvénnyel dyspresia D(X) = σ 2 .

Képlet egy folytonos valószínűségi változó normális valószínűségi eloszlásának sűrűségét írja le.

Bizonyítsuk be, hogy ez a normál eloszlás szórása. Vezessünk be egy új változót z=(x-μ)/ . Innen . Figyelembe véve, hogy az integráció új korlátai megegyeznek a régiekkel, megkapjuk a részenkénti integrálást, elhelyezést. u=z, azt találjuk Ezért .Tehát a normál eloszlás szórása egyenlő a paraméterrel.

16) Bizonyítsuk be, hogy egy exponenciális törvény szerint eloszló folytonos valószínűségi változó esetén a paraméterrel a matematikai elvárás .

Egy X valószínűségi változót, amely csak nem negatív értékeket vesz fel, az exponenciális törvény szerint eloszlónak mondjuk, ha valamilyen λ>0 pozitív paraméterre a sűrűségfüggvény alakja:

A matematikai elvárás meghatározásához a képletet használjuk

A teljes valószínűségi képlet levezetésénél azt feltételeztük, hogy az esemény A, amelynek valószínűségét meg kellett határozni, megtörténhet valamelyik esemény N 1 , N 2 , ... , N n, amely páronként összeférhetetlen események teljes csoportját alkotja. Ráadásul ezeknek az eseményeknek (hipotéziseknek) a valószínűsége előre ismert volt. Tételezzük fel, hogy egy kísérletet végeztek, melynek eredményeként az esemény A megérkezett. Ez a kiegészítő információ lehetővé teszi számunkra, hogy újraértékeljük a hipotézisek valószínűségét. N i, miután kiszámolta P(Hi/A).

vagy a teljes valószínűségi képlet segítségével azt kapjuk

Ezt a képletet Bayes formulának vagy hipotézistételnek nevezik. Bayes képlete lehetővé teszi, hogy „felülvizsgálja” a hipotézisek valószínűségét, miután az eseményt eredményező kísérlet eredménye ismertté válik A.

Valószínűségek Р(Н i)− ezek a hipotézisek a priori valószínűségei (a kísérlet előtt számítják ki). A valószínűségek P(H i /A)− ezek a hipotézisek utólagos valószínűségei (a kísérlet után számítják ki). Bayes képlete lehetővé teszi az utólagos valószínűségek kiszámítását az előző valószínűségekből és egy esemény feltételes valószínűségeiből A.

Példa. Ismeretes, hogy az összes férfi 5%-a és a nők 0,25%-a színvak. Az orvosi kártya száma alapján véletlenszerűen kiválasztott személy színvakságban szenved. Mennyi a valószínűsége, hogy férfi?

Megoldás. Esemény A– egy személy színvakságban szenved. A kísérlet elemi eseményeinek tere - egy személyt az orvosi kártya száma választ ki - Ω = ( N 1 , N 2 ) 2 eseményből áll:

N 1 - kiválasztanak egy férfit,

N 2 – egy nőt választanak ki.

Ezek az események hipotézisekként választhatók ki.

A probléma (véletlenszerű választás) feltételei szerint ezeknek az eseményeknek a valószínűsége azonos és egyenlő P(N 1 ) = 0.5; P(N 2 ) = 0.5.

Ebben az esetben annak feltételes valószínűsége, hogy egy személy színvakságban szenved, egyenlő:

R(A/N 1 ) = 0.05 = 1/20; R(A/N 2 ) = 0.0025 = 1/400.

Mivel ismert, hogy a kiválasztott személy színvak, azaz az esemény megtörtént, Bayes képletét használjuk az első hipotézis újraértékelésére:

Példa. Három egyforma kinézetű doboz van. Az első dobozban 20 fehér golyó, a másodikban 10 fehér és 10 fekete, a harmadikban 20 fekete golyó található. Egy véletlenszerűen kiválasztott dobozból fehér golyót veszünk. Számítsa ki annak a valószínűségét, hogy a golyót az első mezőből húzzák ki.

Megoldás. Jelöljük azzal A esemény - egy fehér labda megjelenése. A doboz kiválasztásával kapcsolatban három feltételezés (hipotézis) fogalmazható meg: N 1 ,N 2 , N 3 – az első, második és harmadik doboz kiválasztása.

Mivel bármelyik doboz kiválasztása egyaránt lehetséges, a hipotézisek valószínűsége megegyezik:

P(N 1 )=P(N 2 )=P(N 3 )= 1/3.

A probléma szerint annak a valószínűsége, hogy az első dobozból fehér golyót húzzunk

Annak valószínűsége, hogy fehér golyót húzzunk a második dobozból



Annak valószínűsége, hogy fehér golyót húzzunk a harmadik dobozból

A kívánt valószínűséget a Bayes-képlet segítségével találjuk meg:

A tesztek megismétlése. Bernoulli képlete.

N kísérletet hajtanak végre, amelyek mindegyikében előfordulhat A esemény, de előfordulhat, hogy nem, és az A esemény valószínűsége minden egyes kísérletben állandó, pl. tapasztalatról tapasztalatra nem változik. Már tudjuk, hogyan keressük meg az A esemény valószínűségét egy kísérletben.

Különösen érdekes az A esemény bizonyos számú (m-szeres) előfordulásának valószínűsége n kísérletben. Az ilyen problémák könnyen megoldhatók, ha a tesztek függetlenek.

Def. Számos tesztet hívnak független az A eseménytől , ha az A esemény valószínűsége mindegyikben nem függ más kísérletek eredményétől.

Annak P n (m) valószínűsége, hogy az A esemény pontosan m-szer bekövetkezik (nem bekövetkezik n-m alkalommal, esemény ) ebben az n próbában. Az A esemény nagyon különböző sorrendben jelenik meg m-szer).

- Bernoulli képlete.

A következő képletek nyilvánvalóak:

Р n (m kevesebb k-szer n próbában.

P n (m>k) = P n (k+1) + P n (k+2) +…+ P n (n) - az A esemény bekövetkezésének valószínűsége több k-szer n próbában.

Bayes képlet

Bayes tétele- az elemi valószínűségszámítás egyik fő tétele, amely meghatározza egy esemény bekövetkezésének valószínűségét olyan körülmények között, ahol megfigyelések alapján csak részinformáció ismeretes az eseményekről. Bayes képletével pontosabban újraszámolható a valószínűség, figyelembe véve mind a korábban ismert információkat, mind az új megfigyelések adatait.

"Fizikai jelentés" és terminológia

Bayes képlete lehetővé teszi az „ok és okozat átrendezését”: egy esemény ismert ténye alapján számítsa ki annak valószínűségét, hogy azt egy adott ok okozta.

Az „okok” működését tükröző események ebben az esetben általában ún hipotéziseket, hiszen azok állítólagos az ehhez vezető eseményeket. A hipotézis igazának feltétlen valószínűségét ún eleve(mennyire valószínű az oka egyáltalán), és feltételes - az esemény tényét figyelembe véve - a posteriori(mennyire valószínű az oka kiderült, hogy figyelembe veszi az esemény adatait).

Következmény

A Bayes-képlet fontos következménye egy esemény teljes valószínűségének képlete attól függően számos ellentmondó hipotézisek ( és csak tőlük!).

- egy esemény bekövetkezésének valószínűsége B, számos hipotézistől függően A én, ha e hipotézisek megbízhatósági foka ismert (például kísérletileg mérve);

A képlet levezetése

Ha egy esemény csak az okoktól függ A én, akkor ha megtörtént, az azt jelenti, hogy az egyik ok biztosan bekövetkezett, pl.

Bayes képlete szerint

Átutalással P(B) jobbra megkapjuk a kívánt kifejezést.

Spam szűrési módszer

A Bayes-tételen alapuló módszer sikeres alkalmazást talált a levélszemétszűrésben.

Leírás

A szűrő betanítása során minden betűben talált szó „súlya” kiszámításra és tárolásra kerül - annak a valószínűsége, hogy egy ilyen szót tartalmazó levél spam (a legegyszerűbb esetben - a valószínűség klasszikus meghatározása szerint: „megjelenések a spamben / megjelenések összesen”).

Egy újonnan érkezett levél ellenőrzésekor a fenti képlet segítségével számítjuk ki annak valószínűségét, hogy levélszemétről van szó. Ebben az esetben a „hipotézisek” szavak, és minden szónál a „hipotézis megbízhatósága” a szó %-os aránya a levélben, és „az esemény függése a hipotézistől” P(B | A én) - a szó korábban kiszámított „súlya”. Vagyis egy betű „súlya” ebben az esetben nem más, mint az összes szavának átlagos „súlya”.

Egy levelet „spam” vagy „nem levélszemét” kategóriába sorolunk, ha a „súlya” meghaladja-e a felhasználó által megadott bizonyos szintet (általában 60-80%). Miután egy levélről döntés születik, a benne szereplő szavak „súlyozása” frissül az adatbázisban.

Jellegzetes

Ez a módszer egyszerű (az algoritmusok elemiek), kényelmes (lehetővé teszi a „feketelista” és hasonló mesterséges technikák nélkülözését), hatékony (a kellően nagy mintán végzett betanítás után a spam 95-97%-át kivágja, és esetleges hiba esetén áttanítható). Általánosságban elmondható, hogy minden jel arra utal, hogy széles körben elterjedt, ami a gyakorlatban is megtörténik - szinte minden modern spamszűrő erre épül.

A módszernek azonban van egy alapvető hátránya is: az feltételezés alapján, Mi Egyes szavak gyakrabban fordulnak elő a spamben, míg mások a hagyományos e-mailekben, és hatástalan, ha ez a feltételezés helytelen. A gyakorlat azonban azt mutatja, hogy még egy személy sem tudja „szemmel” észlelni az ilyen spamet - csak a levél elolvasásával és jelentésének megértésével.

Egy másik, nem alapvető hátránya a megvalósítással kapcsolatban, hogy a módszer csak szöveggel működik. Ezt a korlátot ismerve a spammerek rekláminformációkat kezdtek beilleszteni a képbe, de a levél szövege vagy hiányzott, vagy értelmetlen volt. Ennek ellensúlyozására vagy szövegfelismerő eszközöket kell használni (egy „drága” eljárás, csak akkor, ha feltétlenül szükséges), vagy régi szűrési módszereket - „fekete listákat” és reguláris kifejezéseket (mivel az ilyen betűk gyakran sztereotip alakúak).

Lásd még

Megjegyzések

Linkek

Irodalom

  • Madár Kiwi. Bayes tiszteletes tétele. // Computerra magazin, 2001. augusztus 24.
  • Paul Graham. Spam-terv (angol). // Paul Graham személyes honlapja.

Wikimédia Alapítvány.

2010.

    Nézze meg, mi a „Bayes Formula” más szótárakban: Egy képlet, amelynek a következő alakja van: ahol a1, A2,..., An inkompatibilis események, Az f.v általános alkalmazási sémája. g.: ha B esemény különböző. olyan feltételek, amelyekre vonatkozóan n hipotézis A1, A2, ..., An készül a kísérlet előtt ismert P(A1), ... valószínűséggel.

    Földtani enciklopédia

    Lehetővé teszi egy érdekes esemény valószínűségének kiszámítását az esemény feltételes valószínűségein keresztül bizonyos hipotézisek feltételezése mellett, valamint ezeknek a hipotéziseknek a valószínűségét. Fogalmazás Legyen megadva egy valószínűségi tér, és a teljes csoport párban... ... Wikipédia

    Lehetővé teszi egy érdekes esemény valószínűségének kiszámítását az esemény feltételes valószínűségein keresztül bizonyos hipotézisek feltételezése mellett, valamint ezeknek a hipotéziseknek a valószínűségét. Fogalmazás Legyen megadva egy valószínűségi tér, és egy teljes eseménycsoport, mint például... ... Wikipédia

    - (vagy Bayes-képlet) a valószínűségszámítás egyik fő tétele, amely lehetővé teszi, hogy meghatározza annak valószínűségét, hogy valamilyen esemény bekövetkezett (hipotézis) csak közvetett bizonyítékok (adatok) jelenlétében, amelyek pontatlanok... Wikipédia

    Bayes tétele az elemi valószínűségszámítás egyik fő tétele, amely meghatározza egy esemény bekövetkezésének valószínűségét olyan körülmények között, ahol megfigyelések alapján csak részinformációkat ismerünk az eseményekről. Bayes képletével... ... Wikipédia

    Bayes, Thomas Thomas Bayes tiszteletes Thomas Bayes Születési idő: 1702 (1702) Születési hely ... Wikipédia

    A Bayes-következtetés a statisztikai következtetés egyik olyan módszere, amelyben a Bayes-képletet a hipotézisek valósságának valószínűségi becsléseinek finomítására használják bizonyítékok beérkezésekor. A Bayes-féle frissítés használata különösen fontos a... ... Wikipédiában

    A cikk javítása érdekében kívánatos?: Keresse meg és lábjegyzetek formájában rendezze el a hiteles forrásokra mutató hivatkozásokat, amelyek megerősítik a leírtakat. A lábjegyzetek hozzáadása után adja meg a források pontosabb megjelölését. Pere... Wikipédia

    A foglyok önző érdekeiket követve elárulják egymást, vagy hallgatnak, minimalizálva ezzel az összbüntetést? Prisoner's dilemma (angolul: Prisoner's dilemma, ritkábban használják a „dilemma ... Wikipédia

Könyvek

  • Valószínűségszámítás és matematikai statisztika feladatokban: Több mint 360 feladat és gyakorlat, D. Borzykh A javasolt kézikönyv különböző bonyolultságú problémákat tartalmaz. A fő hangsúly azonban a közepes bonyolultságú feladatokon van. Ez szándékosan történik, hogy ösztönözze a tanulókat arra, hogy...

Ki az a Bayes? és mi köze ennek a menedzsmenthez? - következhet egy teljesen jogos kérdés. Egyelőre fogadjon szót: ez nagyon fontos!.. és érdekes (legalábbis számomra).

Mi az a paradigma, amelyben a legtöbb vezető működik: Ha megfigyelek valamit, milyen következtetéseket vonhatok le belőle? Mit tanít Bayes: minek kell valójában ott lennie, hogy megfigyelhessem ezt a valamit? Pontosan így fejlődik minden tudomány, és erről azt írja (emlékezetből idézek): akinek nincs a fejében elmélet, az egyik ötlettől a másikig visszariad a különféle események (megfigyelések) hatására. Nem hiába mondják: nincs gyakorlatiasabb egy jó elméletnél.

Példa a gyakorlatból. A beosztottam hibázik, és a kolléganőm (egy másik osztály vezetője) azt mondja, hogy a hanyag alkalmazotton vezetői befolyást kellene gyakorolni (vagyis megbüntetni/szidni). És tudom, hogy ez az alkalmazott havonta 4-5 ezer azonos típusú műveletet végez, és ezalatt legfeljebb 10 hibát követ el. Érzi a paradigma különbségét? A kolléga reagál a megfigyelésre, és eleve tudomásom van arról, hogy a munkavállaló bizonyos számú hibát vét, így még egy nem befolyásolta ezt a tudást... Most, ha a hónap végén kiderül, hogy vannak, például 15 ilyen hiba!.. Ez már ok lesz arra, hogy tanulmányozzuk a szabványok be nem tartásának okait.

Meg van győződve a bayesi megközelítés fontosságáról? Érdekelt? remélem igen. És most a légy a kenőcsben. Sajnos a bayesi ötletek ritkán adatnak meg azonnal. Őszintén nem volt szerencsém, hiszen a népi irodalom révén ismerkedtem meg ezekkel a gondolatokkal, amelyek elolvasása után sok kérdés maradt. Amikor jegyzetírást terveztem, összegyűjtöttem mindent, amit korábban Bayes-en jegyzeteltem, és tanulmányoztam az interneten leírtakat is. Bemutatom a figyelmedbe a legjobb tippemet a témával kapcsolatban. Bevezetés a Bayes-féle valószínűségbe.

Bayes tételének levezetése

Tekintsük a következő kísérletet: felhívunk egy tetszőleges számot, amely a szakaszon fekszik, és feljegyezzük, ha ez a szám például 0,1 és 0,4 között van (1a. ábra). Ennek az eseménynek a valószínűsége egyenlő a szegmens hosszának a szegmens teljes hosszához viszonyított arányával, feltéve, hogy a számok jelennek meg a szakaszon egyformán valószínű. Matematikailag ez leírható p(0,1 <= x <= 0,4) = 0,3, или кратко r(X) = 0,3, ahol r- valószínűség, X- valószínűségi változó a tartományban, X– valószínűségi változó a tartományban. Vagyis a szegmens eltalálásának valószínűsége 30%.

Rizs. 1. Valószínűségek grafikus értelmezése

Most vegyük figyelembe az x négyzetet (1b. ábra). Tegyük fel, hogy meg kell neveznünk számpárokat ( x, y), amelyek mindegyike nagyobb nullánál és kisebb egynél. Annak a valószínűsége x(első szám) a szegmensen belül lesz (kék terület 1), egyenlő a kék terület területének és a teljes négyzet területének arányával, azaz (0,4 – 0,1) * (1 – 0) ) / (1 * 1) = 0, 3, azaz ugyanaz a 30%. Annak a valószínűsége y a szegmensen belül (2. zöld terület) egyenlő a zöldterület területének és a teljes négyzet területének arányával p(0,5 <= y <= 0,7) = 0,2, или кратко r(Y) = 0,2.

Mit tanulhatsz meg egyszerre az értékekről? xÉs y. Például mennyi a valószínűsége annak, hogy ugyanakkor xÉs y a megfelelő adott szegmensekben vannak? Ehhez ki kell számítania a 3. terület (a zöld és kék csíkok metszéspontja) területének arányát a teljes négyzet területéhez: p(X, Y) = (0,4 – 0,1) * (0,7 – 0,5) / (1 * 1) = 0,06.

Tegyük fel, hogy tudni szeretnénk, mennyi ennek a valószínűsége y az if intervallumban van x már a tartományban van. Azaz valójában van egy szűrőnk, és amikor párokat hívunk ( x, y), akkor azonnal eldobjuk azokat a párokat, amelyek nem felelnek meg a megtalálás feltételének x adott intervallumban, majd a szűrt párokból azokat számoljuk, amelyekre y kielégíti a feltételünket, és a valószínűséget azon párok számának arányának tekinti, amelyekhez y a fenti szegmensben található a szűrt párok teljes számához (vagyis amelyhez x szegmensben fekszik). Ezt a valószínűséget így írhatjuk fel p(Y|X at X elérje a lőtávolságot." Nyilvánvaló, hogy ez a valószínűség egyenlő a 3. terület és az 1. kék terület területének arányával. A 3. terület területe (0,4 – 0,1) * (0,7 – 0,5) = 0,06, és az 1. kék terület területe ( 0,4 – 0,1) * (1 – 0) = 0,3, akkor ezek aránya 0,06 / 0,3 = 0,2. Más szóval, a megtalálás valószínűsége y azon a szegmensen, feltéve, hogy x szegmenshez tartozik p(Y|X) = 0,2.

Az előző bekezdésben tulajdonképpen megfogalmaztuk az azonosságot: p(Y|X) = p(X, Y) / p( X). Ez így szól: „az elütés valószínűsége at tartományban, feltéve, hogy X találati tartomány, amely megegyezik az egyidejű találati valószínűség arányával X a tartományba és at a tartományra, az eltalálás valószínűségére X a tartományba."

Analógia alapján vegyük figyelembe a valószínűséget p(X|Y). Párokat hívunk ( x, y), és szűrje ki azokat, amelyekre y 0,5 és 0,7 között van, akkor annak a valószínűsége x abban az intervallumban van, feltéve, hogy y szegmenshez tartozik egyenlő a 3. régió területének és a 2. zöld régió területének arányával: p(X|Y) = p(X, Y) / p(Y).

Vegye figyelembe, hogy a valószínűségek p(X, Y) És p(Y, X) egyenlőek, és mindkettő egyenlő a 3. zóna területének a teljes négyzet területéhez viszonyított arányával, de a valószínűségek p(Y|X) És p(X|Y) nem egyenlők; míg a valószínűség p(Y|X) egyenlő a 3. régió és az 1. régió területének arányával, és p(X|Y) – a 3. régiótól a 2. régióig. Vegye figyelembe azt is p(X, Y) gyakran így jelölik p(X&Y).

Ezért két definíciót vezettünk be: p(Y|X) = p(X, Y) / p( X) És p(X|Y) = p(X, Y) / p(Y)

Írjuk át ezeket az egyenlőségeket a következő alakba: p(X, Y) = p(Y|X) * p( X) És p(X, Y) = p(X|Y) * p(Y)

Mivel a bal oldalak egyenlőek, a jobb oldalak egyenlőek: p(Y|X) * p( X) = p(X|Y) * p(Y)

Vagy átírhatjuk az utolsó egyenlőséget a következőképpen:

Ez Bayes tétele!

Az ilyen egyszerű (majdnem tautologikus) transzformációkból tényleg nagy tétel születik!? Ne siesse el a következtetéseket. Beszéljük meg újra, hogy mit kaptunk. Volt egy bizonyos kezdeti (a priori) valószínűség r(X), hogy a valószínűségi változó X a szegmensen egyenletesen eloszló tartományba esik X. Esemény történt Y, melynek eredményeként megkaptuk ugyanannak a valószínűségi változónak a posterior valószínűségét X: r(X|Y), és ez a valószínűség eltér ettől r(X) együtthatóval. Esemény Y bizonyítéknak nevezett, többé-kevésbé megerősítő vagy cáfoló X. Ezt az együtthatót néha nevezik bizonyíték ereje. Minél erősebb a bizonyíték, annál inkább megváltoztatja az Y megfigyelésének ténye a priori valószínűséget, annál inkább eltér a posterior valószínűség a priortól. Ha a bizonyíték gyenge, a posterior valószínűsége majdnem megegyezik a korábbival.

Bayes-képlet diszkrét valószínűségi változókra

Az előző részben levezettük Bayes képletét az intervallumon definiált folytonos x és y valószínűségi változókra. Tekintsünk egy példát diszkrét valószínűségi változókkal, amelyek mindegyike két lehetséges értéket vesz fel. A rutin orvosi vizsgálatok során kiderült, hogy negyven évesen a nők 1%-a szenved mellrákban. A rákos nők 80%-a pozitív mammográfiai eredményt kap. Az egészséges nők 9,6%-a pozitív mammográfiai eredményeket is kap. A vizsgálat során egy nő ebben a korcsoportban kapott pozitív mammográfiai eredményt. Mennyi az esélye, hogy valóban mellrákja van?

Az érvelés/számítás menete a következő. A rákos betegek 1%-a közül a mammográfia 80%-ban ad pozitív eredményt = 1% * 80% = 0,8%. Az egészséges nők 99%-ánál a mammográfia 9,6% pozitív eredményt ad = 99% * 9,6% = 9,504%. Összesen 10,304% (9,504% + 0,8%) pozitív mammográfiai eredménnyel, mindössze 0,8% beteg, a maradék 9,504% egészséges. Így annak a valószínűsége, hogy egy pozitív mammográfiai eredménnyel rendelkező nő rákos lesz, 0,8% / 10,304% = 7,764%. 80%-ra gondoltál?

Példánkban a Bayes-képlet a következő formában jelenik meg:

Beszéljünk még egyszer ennek a képletnek a „fizikai” jelentéséről. X– valószínűségi változó (diagnózis), értékeket vesz fel: X 1- beteg és X 2- egészséges; Y– valószínűségi változó (mérési eredmény – mammográfia), értékek felvétele: I 1- pozitív eredmény és Y2- negatív eredmény; p(X 1)– a mammográfia előtti megbetegedések valószínűsége (a priori valószínűség) 1%; p(Y 1 |X 1 ) – a pozitív eredmény valószínűsége, ha a beteg beteg (feltételes valószínűség, mivel ezt a feladat feltételei között kell megadni), egyenlő 80%-kal; p(Y 1 |X 2 ) – a pozitív eredmény valószínűsége, ha a beteg egészséges (feltételes valószínűség is), 9,6%; p(X 2)– annak a valószínűsége, hogy a beteg egészséges a mammográfia előtt (a priori valószínűség), 99%; p(X 1|Y 1 ) – annak a valószínűsége, hogy a beteg beteg, pozitív mammográfiai eredmény esetén (posterior valószínűség).

Látható, hogy az utólagos valószínűség (amit keresünk) arányos az előzetes valószínűséggel (kezdeti) egy kicsit összetettebb együtthatóval . Hadd hangsúlyozzam még egyszer. Véleményem szerint ez a bayesi megközelítés alapvető aspektusa. Mérés ( Y) hozzáadott egy bizonyos mennyiségű információt az eredetileg rendelkezésre állóhoz (a priori), ami pontosította az objektumról szerzett ismereteinket.

Példák

A feldolgozott anyag összevonásához próbáljon meg több problémát megoldani.

1. példa 3 urna van; az elsőben 3 fehér golyó és 1 fekete; a másodikban - 2 fehér golyó és 3 fekete; a harmadikban 3 fehér golyó van. Valaki véletlenszerűen megközelíti az egyik urnát, és kivesz belőle 1 labdát. Ez a labda fehérnek bizonyult. Határozza meg annak utólagos valószínűségét, hogy a golyót az 1., 2., 3. urnából húzzák.

Megoldás. Három hipotézisünk van: H 1 = (az első urna van kiválasztva), H 2 = (a második urna van kiválasztva), H 3 = (a harmadik urna van kiválasztva). Mivel az urnát véletlenszerűen választják ki, a hipotézisek a priori valószínűségei egyenlőek: P(H 1) = P(H 2) = P(H 3) = 1/3.

A kísérlet eredményeként megjelent az A = esemény (a kiválasztott urnából fehér golyót húztunk). Az A esemény feltételes valószínűségei a H 1, H 2, H 3 hipotézisek mellett: P(A|H 1) = 3/4, P(A|H 2) = 2/5, P(A|H 3) = 1. Például az első egyenlőség így hangzik: „a valószínűsége, hogy fehér golyót húzunk, ha az első urnát választjuk, 3/4 (mivel az első urnában 4 golyó van, és ebből 3 fehér).

Bayes képletével megtaláljuk a hipotézisek utólagos valószínűségét:

Így az A esemény bekövetkezésére vonatkozó információk tükrében a hipotézisek valószínűségei megváltoztak: a H 3 hipotézis lett a legvalószínűbb, a H 2 hipotézis a legkevésbé valószínű.

2. példa Két lövő egymástól függetlenül lő ugyanarra a célpontra, mindegyik egy lövést ad le. Az első lövő célba találásának valószínűsége 0,8, a másodiké 0,4. Lövés után egy lyukat fedeztek fel a célban. Határozza meg annak valószínűségét, hogy ez a lyuk az első lövőhöz tartozik (Az eredményt (mindkét lyuk egybeesett) el kell hagyni, mint elhanyagolhatóan valószínűtlen).

Megoldás. A kísérlet előtt a következő hipotézisek lehetségesek: H 1 = (sem az első, sem a második nyíl nem fog eltalálni), H 2 = (mindkét nyíl eltalál), H 3 - (az első lövész eltalálja, de a második nem ), H 4 = (az első lövöldöző nem fog eltalálni, a második pedig eltalálja). A hipotézisek előzetes valószínűségei:

P(H1)=0,2*0,6=0,12; P(H2)=0,8*0,4=0,32; P(H3)=0,8*0,6=0,48; P(H4)=0,2*0,4=0,08.

A megfigyelt esemény A = (egy lyuk van a célpontban) feltételes valószínűségei ezeknél a hipotéziseknél egyenlők: P(A|H 1) = P(A|H 2) = 0; P(A|H3) = P(A|H4) = 1

A kísérlet után a H 1 és H 2 hipotézisek lehetetlenné válnak, és a H 3 és H 4 hipotézisek utólagos valószínűsége a Bayes-képlet szerint:

Bayes a spam ellen

Bayes formulája széles körben alkalmazható a spamszűrők fejlesztésében. Tegyük fel, hogy meg akar tanítani egy számítógépet annak meghatározására, hogy mely e-mailek minősülnek spamnek. A szótárból és a kifejezésekből indulunk tovább Bayesi becslések segítségével. Először hozzuk létre a hipotézisek terét. Bármely betűvel kapcsolatban legyen két hipotézisünk: H A spam, H B nem spam, hanem egy normális, szükséges betű.

Először is „tanítsuk be” jövőbeli levélszemét-elhárító rendszerünket. Vegyük az összes meglévő betűt, és osszuk fel két, egyenként 10 betűs „halomra”. Tegyük az egyikbe a spam leveleket, és nevezzük H A kupacnak, a másikba pedig a szükséges levelezést, és hívjuk H B kupacnak. Most pedig lássuk: milyen szavak és kifejezések találhatók a spamekben és a nem kívánt levelekben, és milyen gyakorisággal? Ezeket a szavakat és kifejezéseket bizonyítékoknak nevezzük, és E 1 , E 2 jelöléssel jelöljük... Kiderült, hogy a gyakran használt szavak (például a „tetszik”, „tiéd”) a H A és H B halmokban körülbelül a ugyanaz a frekvencia. Így ezeknek a szavaknak a jelenléte egy levélben semmit sem árul el arról, hogy melyik kupachoz rendeljük (gyenge bizonyíték). Adjunk ezekhez a szavakhoz semleges „spam” valószínűségi pontszámot, mondjuk 0,5-öt.

Az „angolul beszélt” kifejezés csak 10 betűben jelenjen meg, és gyakrabban a spam levelekben (például 10-ből 7 spamlevélben), mint a szükségesnél (10-ből 3-ban). Adjunk ennek a kifejezésnek magasabb értékelést a spamre: 7/10, és alacsonyabb értékelést a normál e-mailekre: 3/10. Ezzel szemben kiderült, hogy a „haver” szó gyakrabban fordult elő normál betűkkel (10-ből 6). És akkor kaptunk egy rövid levelet: „Barátom! Hogy beszélsz angolul?”. Próbáljuk meg értékelni a „spam” jellegét. Megadjuk az egyes kupacokhoz tartozó betűk P(H A), P(H B) általános becsléseit egy kissé leegyszerűsített Bayes-képlet és hozzávetőleges becsléseink segítségével:

P(H A) = A/(A+B), Ahol A = p a1 *p a2 *…*p an, B = p b1 *p b2 *…*p b n = (1 – p a1)*(1 – p a2)*… *(1 – p an).

1. táblázat. Az írás egyszerűsített (és hiányos) Bayes-becslése.

Így hipotetikus levelünk a „spam” hangsúllyal való összetartozás valószínűségét kapta. Dönthetünk úgy, hogy bedobjuk a levelet valamelyik kupacba? Határozzuk meg a döntési küszöböket:

  • Feltételezzük, hogy a betű a H i kupachoz tartozik, ha P(H i) ≥ T.
  • Egy betű nem tartozik a kupacba, ha P(H i) ≤ L.
  • Ha L ≤ P(H i) ≤ T, akkor nem lehet döntést hozni.

Felveheti T = 0,95 és L = 0,05. Mivel a kérdéses levélre és 0,05< P(H A) < 0,95, и 0,05 < P(H В) < 0,95, то мы не сможем принять решение, куда отнести данное письмо: к спаму (H A) или к нужным письмам (H B). Можно ли улучшить оценку, используя больше информации?

Igen. Számítsuk ki az egyes bizonyítékok pontszámát más-más módon, ahogy Bayes is javasolta. Legyen:

F a a spam e-mailek teljes száma;

F ai a tanúsítvánnyal rendelkező betűk száma én egy halom spamben;

F b a szükséges betűk teljes száma;

F bi a tanúsítvánnyal rendelkező betűk száma én egy csomó szükséges (releváns) levélben.

Ekkor: p ai = F ai /F a, p bi = F bi /F b. P(H A) = A/(A+B), P(H B) = B/(A+B), Ahol A = p a1 *p a2 *…*p an, B = p b1 *p b2 *…*p b n

Felhívjuk figyelmét, hogy a p ai és p bi bizonyítékszavak értékelése objektívvé vált, és emberi beavatkozás nélkül is kiszámítható.

2. táblázat: Pontosabb (de hiányos) Bayes-becslés egy levélben elérhető szolgáltatások alapján

Nagyon határozott eredményt kaptunk - nagy előnnyel a betű a kívánt betűk közé sorolható, hiszen P(H B) = 0,997 > T = 0,95. Miért változott az eredmény? Mivel több információt használtunk fel - figyelembe vettük az egyes halmok betűinek számát, és mellesleg sokkal pontosabban határoztuk meg a p ai és p bi becsléseket. Ugyanúgy határoztuk meg őket, mint maga Bayes, feltételes valószínűségek kiszámításával. Más szavakkal, p a3 annak a valószínűsége, hogy a „haver” szó megjelenik egy levélben, feltéve, hogy ez a betű már a H A spam kupachoz tartozik. Az eredmény nem váratott sokáig magára – úgy tűnik, nagyobb biztonsággal tudunk dönteni.

Bayes a vállalati csalás ellen

A Bayes-féle megközelítés egy érdekes alkalmazását írta le MAGNUS8.

Jelenlegi projektem (gyártóvállalati csalások felderítésére) a Bayes képlet segítségével határozza meg a csalás (csalás) valószínűségét több olyan tény megléte/hiánya esetén, amelyek közvetve a csalás lehetőségére vonatkozó hipotézis mellett tanúskodnak. Az algoritmus öntanuló (visszajelzéssel), azaz. újraszámítja együtthatóit (feltételes valószínűségét), ha a gazdaságbiztonsági szolgálat ellenőrzése során a csalást ténylegesen megerősíti vagy nem erősíti meg.

Valószínűleg érdemes azt mondani, hogy az algoritmusok tervezésénél az ilyen módszerek meglehetősen magas matematikai kultúrát igényelnek a fejlesztőtől, mert a legkisebb hiba a számítási képletek levezetésében és/vagy megvalósításában érvényteleníti és hiteltelenné teszi az egész módszert. A valószínűségi módszerek különösen hajlamosak erre, mivel az emberi gondolkodás nem alkalmazkodik a valószínűségi kategóriákkal való munkavégzéshez, és ennek megfelelően a köztes és végső valószínűségi paraméterek „fizikai jelentésének” nincs „láthatósága” és megértése. Ez a megértés csak a valószínűségszámítás alapfogalmainál létezik, és akkor csak nagyon óvatosan kell kombinálni és levezetni a bonyolult dolgokat a valószínűségszámítás törvényei szerint - a józan ész többé nem segít az összetett objektumok esetében. Ez különösen a valószínűségszámítás filozófiájáról szóló modern könyvek lapjain zajló meglehetősen komoly módszertani csatákhoz, valamint számos szofizmushoz, paradoxonhoz és furcsa rejtvényhez kapcsolódik ebben a témában.

Egy másik árnyalat, amivel szembesülnöm kellett, hogy sajnos szinte minden, ami a GYAKORLATBAN HASZNOSÍTÓBAN többé-kevésbé HASZNOS, ebben a témában angolul van írva. Az orosz nyelvű forrásokban többnyire csak egy jól ismert elmélet található, csak a legprimitívebb esetekre demonstrációs példákkal.

Az utolsó megjegyzéssel teljesen egyetértek. Például a Google, amikor valami olyasmit próbált találni, mint „a Bayes-féle valószínűség könyv”, nem produkált semmi érthetőt. Igaz, arról számolt be, hogy Kínában betiltottak egy bayesi statisztikákat tartalmazó könyvet. (Andrew Gelman statisztikaprofesszor a Columbia Egyetem blogján számolt be arról, hogy az Adatelemzés regresszióval és többszintű/hierarchikus modellekkel című könyvét Kínában betiltották. Az ottani kiadó arról számolt be, hogy "a könyvet a hatóságok nem hagyták jóvá különféle politikailag érzékeny okok miatt. anyag a szövegben.") Kíváncsi vagyok, vajon hasonló ok vezetett-e a Bayes-féle valószínűségről szóló könyvek hiányához Oroszországban?

Konzervativizmus az emberi információfeldolgozásban

A valószínűségek határozzák meg a bizonytalanság mértékét. A valószínűség, mind Bayes, mind megérzéseink szerint, egyszerűen egy szám nulla és a között, amely azt jelzi, hogy egy kissé idealizált személy milyen mértékben hiszi el az állítást igaznak. Az ok, amiért az embert némileg idealizálják, az az, hogy két egymást kizáró esemény valószínűségeinek összege meg kell, hogy egyenlő legyen bármelyik esemény bekövetkezésének valószínűségével. Az additív tulajdonság olyan következményekkel jár, hogy kevés valódi ember találkozhat mindegyikkel.

Bayes tétele az additivitás tulajdonságának triviális következménye, vitathatatlan és minden valószínűségi elmélet egyetértett vele, legyen az Bayes-féle és más. Ennek egyik módja a következő. Ha P(H A |D) annak a későbbi valószínűsége, hogy az A hipotézis egy adott D érték megfigyelése után következett be, P(H A) a korábbi valószínűsége egy adott D érték megfigyelése előtt, P(D|H A ) annak a valószínűsége, hogy adott D értéket akkor figyeljük meg, ha H A igaz, és P(D) egy adott D érték feltétlen valószínűsége, akkor

(1) P(H A |D) = P(D|H A) * P(H A) / P(D)

A P(D) legjobban normalizáló állandónak tekinthető, ami azt eredményezi, hogy az utólagos valószínűségek összeadódnak a vizsgált, egymást kölcsönösen kizáró hipotézisek kimerítő halmazához képest. Ha ki kell számolni, akkor ez így lehet:

De gyakrabban a P(D) ki van küszöbölve, nem pedig kiszámítva. Ennek kiküszöbölésének egy kényelmes módja, ha Bayes tételét valószínűség-esély arány formává alakítjuk.

Tekintsünk egy másik hipotézist, a H B -t, amely kölcsönösen kizárja H A -t, és gondolja meg ugyanazt a megadott mennyiséget, amely megváltoztatta a véleményét H A -val kapcsolatban

(2) P(H B |D) = P(D|H B) * P(H B) / P(D)

Most osszuk el az 1. egyenletet a 2. egyenlettel; így lesz az eredmény:

ahol Ω 1 a H A-tól H B-ig tartó utólagos esély, Ω 0 az előzetes esély, L pedig a statisztikusok számára ismert valószínűségi arány. A 3. egyenlet Bayes tételének ugyanaz a releváns változata, mint az 1. egyenlet, és gyakran lényegesen hasznosabb, különösen a hipotéziseket tartalmazó kísérleteknél. A Bayes-pártiak azzal érvelnek, hogy Bayes tétele formálisan optimális szabály arra vonatkozóan, hogyan kell felülvizsgálni a véleményeket az új bizonyítékok fényében.

Arra vagyunk kíváncsiak, hogy összehasonlítsuk a Bayes-tétel által meghatározott ideális viselkedést az emberek tényleges viselkedésével. Hogy némi fogalmat adjunk arról, hogy ez mit jelent, próbáljunk meg egy kísérletet Önnel, mint tesztalanyal. Ez a táska 1000 póker zsetont tartalmaz. Két ilyen zacskóm van, az egyikben 700 piros és 300 blue chip van, a másikban 300 piros és 700 kék. Feldobtam egy érmét, hogy eldöntsem, melyiket használjam. Tehát, ha a véleményünk megegyezik, akkor a jelenlegi valószínűsége, hogy több piros chipet tartalmazó zacskót kap, 0,5. Most egy véletlenszerű kiválasztást végez, és minden chip után visszatér. 12 zsetonnal 8 pirosat és 4 kéket kapsz. Nos, mindazok alapján, amiket tud, mennyi a valószínűsége annak, hogy a táskába kerül a legtöbb piros? Nyilvánvaló, hogy magasabb, mint 0,5. Kérjük, ne folytassa az olvasást, amíg fel nem jegyezte pontszámát.

Ha olyan, mint egy átlagos tesztfelvevő, akkor a pontszáma 0,7 és 0,8 közötti tartományba esett. Ha azonban elvégeznénk a megfelelő számítást, akkor a válasz 0,97 lenne. Valóban nagyon ritka, hogy egy olyan személy, akinél korábban nem mutatták ki a konzervativizmus hatását, ilyen magas becslésre jut, még akkor is, ha ismerte Bayes tételét.

Ha a vörös chipek aránya a zacskóban az r, akkor az átvétel valószínűsége r piros chips és ( n –r) kék be n minták visszaküldéssel – p r (1–p)n-r. Tehát egy tipikus kísérletben egy zacskóval és pókerzsetonnal, ha NA azt jelenti, hogy a piros chipek aránya r AÉs NB– azt jelenti, hogy a részvény az rB, akkor a valószínűségi arány:

Bayes képletének alkalmazásakor csak a tényleges megfigyelés valószínűségét kell figyelembe venni, nem pedig más megfigyelések valószínűségét, amelyeket esetleg megtett volna, de nem. Ennek az elvnek széles körű következményei vannak a Bayes-tétel minden statisztikai és nem statisztikai alkalmazására; ez a bayesi érvelés legfontosabb technikai eszköze.

Bayesi forradalom

Barátai és kollégái valamiről beszélnek, amit "Bayes-tételnek" vagy "Bayes-szabálynak" hívnak, vagy valamiről, amit Bayes-féle érvelésnek hívnak. Nagyon érdekli őket ez, úgyhogy felmész az internetre, és találsz egy oldalt Bayes tételéről, és... Ez egy egyenlet. És ennyi... Miért kelt ekkora lelkesedést a fejekben egy matematikai fogalom? Milyen „bayesi forradalom” zajlik a tudósok körében, és azt állítják, hogy még maga a kísérleti megközelítés is annak különleges eseteként írható le? Mi a titka, amit a bayesiek ismernek? Milyen fényt látnak?

A bayesi forradalom a tudományban azért nem következett be, mert egyre több kognitív tudós kezdte észrevenni, hogy a mentális jelenségeknek bayesi szerkezetük van; nem azért, mert a tudósok minden területen elkezdték használni a bayesi módszert; hanem azért, mert maga a tudomány Bayes tételének speciális esete; a kísérleti bizonyíték Bayes-féle bizonyíték. A bayesi forradalmárok azzal érvelnek, hogy amikor egy kísérletet végez, és olyan bizonyítékot szerez, amely „megerősíti” vagy „cáfolja” az elméletét, akkor ez a megerősítés vagy cáfolat a bayesi szabályok szerint történik. Például nemcsak azt kell figyelembe vennie, hogy az elmélete megmagyarázhat egy jelenséget, hanem azt is, hogy vannak más lehetséges magyarázatok is, amelyek szintén megjósolhatják azt a jelenséget.

Korábban a legnépszerűbb tudományfilozófia a régi filozófia volt, amelyet a bayesi forradalom kiszorított. Karl Popper gondolata, hogy az elméleteket teljesen meg lehet hamisítani, de soha nem lehet teljesen ellenőrizni, a Bayes-szabályok másik speciális esete; ha p(X|A) ≈ 1 – ha az elmélet helyes előrejelzéseket ad, akkor a ~X megfigyelése nagyon erősen meghamisítja A-t. Másrészt, ha p(X|A) ≈ 1 és X-et figyelünk meg, ez nem erősíti meg erősen. az elmélet; esetleg más B feltétel is lehetséges, például p(X|B) ≈ 1, és amely mellett az X megfigyelés nem A mellett, hanem B mellett tesz tanúbizonyságot. Ha X megfigyelés határozottan megerősíti A-t, akkor az lenne a célunk, hogy nem tudni, hogy p(X|A) ≈ 1 és p(X|~A) ≈ 0, amit nem tudhatunk, mert nem tudunk minden lehetséges alternatív magyarázatot figyelembe venni. Például amikor Einstein általános relativitáselmélete felülmúlta Newton jól alátámasztott gravitációs elméletét, Newton elméletének összes előrejelzését Einstein előrejelzéseinek különleges esetévé tette.

Hasonló módon Popper azon állítása, miszerint egy eszmének meghamisíthatónak kell lennie, a bayesi valószínűség-megőrző szabály megnyilvánulásaként értelmezhető; ha az X eredmény pozitív bizonyíték az elméletre, akkor a ~X eredménynek bizonyos mértékig meg kell cáfolnia az elméletet. Ha megpróbálod az X-et és a ~X-et is úgy értelmezni, mint ami „megerősíti” az elméletet, a Bayes-szabályok szerint ez lehetetlen! Egy elmélet valószínűségének növelése érdekében olyan teszteknek kell alávetni, amelyek potenciálisan csökkenthetik annak valószínűségét; ez nem csupán egy szabály a sarlatánok azonosítására a tudományban, hanem a Bayes-féle valószínűségi tétel következménye. Másrészt téves Popper azon elképzelése, hogy csak hamisításra van szükség, megerősítésre nincs szükség. Bayes tétele azt mutatja, hogy a hamisítás nagyon erős bizonyíték a megerősítéshez képest, de a hamisítás továbbra is valószínűségi jellegű; nem szabályozzák alapvetően eltérő szabályok, és ily módon nem különbözik a megerősítéstől, ahogy azt Popper állítja.

Így azt találjuk, hogy a kognitív tudományok számos jelensége, plusz a tudósok által használt statisztikai módszerek, plusz maga a tudományos módszer, mind Bayes-tétel speciális esetei. Ez a bayesi forradalom.

Üdvözöljük a Bayes-féle összeesküvésben!

A Bayes-i valószínűségről szóló irodalom

2. Bayes számos különböző alkalmazását írja le a közgazdasági Nobel-díjas Kahneman (és társai) egy csodálatos könyvben. Csak ennek a nagyon nagy könyvnek a rövid összefoglalójában 27-szer számoltam meg egy presbiteri lelkész nevének említését. Minimális képletek. (.. nagyon tetszett. Igaz, kicsit bonyolult, sok a matematika (és hol lennénk nélküle), de az egyes fejezetek (pl. 4. Tájékoztatás) egyértelműen a témához tartoznak. mindenkinek, még ha nehéz is a matematika, olvass el minden második sort, kihagyva a matematikát, és a hasznos gabonák után horgászva...

14. (2017. január 15-i kiegészítés), egy fejezet Tony Crilly könyvéből. 50 ötlet, amit tudnod kell. Matematika.

A Nobel-díjas fizikus, Richard Feynman, egy különösen nagy önjelentőségű filozófusról beszélve, egyszer azt mondta: „Nem a filozófia mint tudomány irritál, hanem a körülötte létrejövő pompozíció. Bárcsak a filozófusok tudnának magukon nevetni! Bárcsak azt mondanák: „Azt mondom, hogy ez így van, de Von Lipcsei másnak gondolta, és ő is tud róla valamit.” Ha eszébe jutna tisztázni, hogy csak az övék .

Legyenek ismertek a valószínűségeik és a hozzájuk tartozó feltételes valószínűségek. Ekkor az esemény bekövetkezésének valószínűsége:

Ezt a képletet az ún teljes valószínűségi képletek. A tankönyvekben tételként van megfogalmazva, melynek bizonyítása elemi: szerint események algebra, (esemény történt És vagy esemény történt És után jött egy esemény vagy esemény történt És után jött egy esemény vagy …. vagy esemény történt És miután jött egy esemény). Hipotézisek óta összeférhetetlenek, és az esemény függő, akkor aszerint az összeférhetetlen események valószínűségeinek összeadásának tétele (első lépés)És függő események valószínűségeinek szorzási tétele (második lépés):

Sokan valószínűleg előre látják az első példa tartalmát =)

Ahova köpsz, ott van egy urna:

1. probléma

Három egyforma urna van. Az első urnában 4 fehér és 7 fekete golyó, a másodikban csak fehér, a harmadikban csak fekete golyó található. Véletlenszerűen kiválasztanak egy urnát, és véletlenszerűen húznak belőle egy labdát. Mennyi a valószínűsége, hogy ez a golyó fekete?

Megoldás: fontolja meg az eseményt - egy véletlenszerűen kiválasztott urnából fekete golyót húznak. Ez az esemény az alábbi hipotézisek egyikének eredményeként következhet be:
– az 1. urna kerül kiválasztásra;
– a 2. urna kerül kiválasztásra;
– a 3. urna kerül kiválasztásra.

Mivel az urnát véletlenszerűen választják ki, a három urna bármelyike ​​választható ugyanúgy lehetséges, tehát:

Felhívjuk figyelmét, hogy a fenti hipotézisek kialakulnak rendezvények teljes csoportja, vagyis a feltétel szerint fekete golyó csak ezekből az urnákból tűnhet fel, és például biliárdasztalról nem jöhet. Végezzünk egy egyszerű köztes ellenőrzést:
, OK, menjünk tovább:

Az első urnában 4 fehér + 7 fekete = 11 golyó van, mindegyik klasszikus meghatározás:
– fekete golyó húzásának valószínűsége tekintettel arra, hogy az 1. urna kerül kiválasztásra.

A második urna csak fehér golyókat tartalmaz, tehát ha választják a fekete golyó megjelenése válik lehetetlen: .

És végül a harmadik urna csak fekete golyókat tartalmaz, ami a megfelelőt jelenti feltételes valószínűség a fekete golyó kivonása lesz (megbízható az esemény).



– annak a valószínűsége, hogy egy véletlenszerűen kiválasztott urnából fekete golyót húznak.

Válasz:

Az elemzett példa ismét azt sugallja, hogy mennyire fontos az ÁLLAPOT elmélyülése. Vegyük ugyanazokat a problémákat urnákkal és labdákkal – külső hasonlóságuk ellenére a megoldási módok teljesen eltérőek lehetnek: valahol csak használni kell a valószínűség klasszikus meghatározása, valahol események független, valahol függő, valahol pedig hipotézisekről beszélünk. Ugyanakkor a megoldás kiválasztásának nincs egyértelmű formai kritériuma - szinte mindig el kell gondolkodni rajta. Hogyan fejlesztheti képességeit? Döntünk, döntünk és még egyszer döntünk!

2. probléma

A lőtéren 5 különböző pontosságú puska található. Egy adott lövő célba találásának valószínűsége rendre 0,5; 0,55; 0,7; 0,75 és 0,4. Mennyi annak a valószínűsége, hogy eltalálja a célt, ha a lövő egy véletlenszerűen kiválasztott puskából ad le egy lövést?

Rövid megoldás és válasz a lecke végén.

A legtöbb tematikus problémában a hipotézisek természetesen nem egyformán valószínűek:

3. probléma

A piramisban 5 puska található, amelyek közül három optikai irányzékkal van felszerelve. 0,95 annak a valószínűsége, hogy egy lövő célba talál egy teleszkópos irányzékkal rendelkező puskát; optikai irányzék nélküli puskánál ez a valószínűség 0,7. Határozza meg annak valószínűségét, hogy a célpontot eltalálják, ha a lövő egy véletlenszerűen vett puskából ad le egy lövést.

Megoldás: ebben a feladatban a puskák száma pontosan ugyanannyi, mint az előzőben, de csak két hipotézis létezik:
– a lövész optikai irányzékkal ellátott puskát választ;
– a lövész optikai irányzék nélküli puskát választ.
Által a valószínűség klasszikus meghatározása: .
Ellenőrzés:

Tekintsük az eseményt: – egy lövő célba talál egy véletlenszerűen vett puskával.
Feltétel szerint: .

A teljes valószínűségi képlet szerint:

Válasz: 0,85

A gyakorlatban teljesen elfogadható a feladat formázásának egy Ön által is ismert rövidített módja:

Megoldás: a klasszikus definíció szerint: – az optikai irányzékos, illetve optikai célzó nélküli puska kiválasztásának valószínűsége.

A feltétel szerint, – a megfelelő típusú puskák célba találásának valószínűsége.

A teljes valószínűségi képlet szerint:
- annak a valószínűsége, hogy egy lövő célt talál egy véletlenszerűen kiválasztott puskával.

Válasz: 0,85

A következő feladatot önnek kell megoldania:

4. probléma

A motor három üzemmódban működik: normál, kényszerített és alapjáraton. Üres üzemmódban a meghibásodás valószínűsége 0,05, normál üzemmódban 0,1, kényszerített üzemmódban pedig 0,7. A motor az esetek 70%-ában normál üzemmódban, 20%-ában kényszer üzemmódban működik. Mennyi a valószínűsége a motor meghibásodásának működés közben?

Minden esetre hadd emlékeztesselek arra, hogy a valószínűségi értékek kiszámításához a százalékokat el kell osztani 100-zal. Legyen nagyon óvatos! Megfigyeléseim szerint az emberek gyakran megpróbálják összekeverni a problémák feltételeit a teljes valószínűségi képlet kapcsán; és kifejezetten ezt a példát választottam. Elárulok egy titkot - majdnem összezavarodtam =)

Megoldás a lecke végén (röviden formázva)

Problémák a Bayes-képletek használatával

Az anyag szorosan kapcsolódik az előző bekezdés tartalmához. Hagyja, hogy az esemény az egyik hipotézis megvalósításának eredményeként következzen be . Hogyan határozható meg egy adott hipotézis bekövetkezésének valószínűsége?

Tekintettel arra azt az eseményt már megtörtént, hipotézis valószínűségek túlértékelt a képletek szerint, amelyek Thomas Bayes angol pap nevét kapták:


– a hipotézis megvalósulásának valószínűsége;
– a hipotézis megvalósulásának valószínűsége;

– annak a valószínűsége, hogy a hipotézis megvalósult.

Első pillantásra teljesen abszurdnak tűnik – miért kell újraszámolni a hipotézisek valószínűségét, ha már ismertek? De valójában van különbség:

- Ezt eleve(becsült hogy tesztek) valószínűsége.

- Ezt a posteriori(becsült után tesztek) ugyanazon hipotézisek valószínűsége, az „újonnan felfedezett körülmények” kapcsán újraszámítva - figyelembe véve azt a tényt, hogy az esemény határozottan megtörtént.

Nézzük meg ezt a különbséget egy konkrét példával:

5. probléma

2 tétel termék érkezett a raktárba: az első - 4000 darab, a második - 6000 darab. A nem szabványos termékek átlagos százaléka az első tételben 20%, a másodikban pedig 10%. A raktárból véletlenszerűen kivett termék szabványosnak bizonyult. Határozza meg annak valószínűségét, hogy: a) az első kötegből, b) a második kötegből származik.

Első rész megoldásokat A teljes valószínűségi képlet használatából áll. Más szóval, számításokat végeznek azzal a feltételezéssel, hogy a teszt még nem gyártottákés esemény „A termék szabványosnak bizonyult” még nem.

Tekintsünk két hipotézist:
– véletlenszerűen kiválasztott termék az 1. tételből lesz;
– véletlenszerűen kiválasztott termék a 2. tételből lesz.

Összesen: 4000 + 6000 = 10000 darab raktáron. A klasszikus definíció szerint:
.

Ellenőrzés:

Tekintsük a függő eseményt: – a raktárból véletlenszerűen kivett termék akarat standard.

Az első tételben 100% – 20% = 80% standard termékek, ezért: tekintettel arra hogy az 1. félhez tartozik.

Hasonlóképpen a második tételben 100% - 10% = 90% standard termékek és – annak a valószínűsége, hogy a raktárból véletlenszerűen kivett termék szabványos lesz tekintettel arra hogy a 2. félhez tartozik.

A teljes valószínűségi képlet szerint:
– annak a valószínűsége, hogy a raktárból véletlenszerűen kivett termék szabványos lesz.

Második rész. Legyen egy raktárból véletlenszerűen kivett termék szabványos. Ez a kifejezés közvetlenül szerepel a feltételben, és kimondja azt a tényt, hogy az esemény történt.

A Bayes-képletek szerint:

a) annak a valószínűsége, hogy a kiválasztott standard termék az 1. tételhez tartozik;

b) annak a valószínűsége, hogy a kiválasztott standard termék a 2. tételhez tartozik.

Után átértékelés hipotézisek természetesen továbbra is formálódnak teljes csoport:
(vizsgálat;-))

Válasz:

Ivan Vasziljevics, aki ismét szakmát váltott és az üzem igazgatója lett, segít megérteni a hipotézisek átértékelésének jelentését. Tudja, hogy ma az 1. műhely 4000, a 2.műhely 6000 terméket szállított a raktárba, és eljön erről meggyőződni. Tegyük fel, hogy minden termék azonos típusú és ugyanabban a tartályban van. Ivan Vasziljevics természetesen előzetesen úgy számolta, hogy azt a terméket, amelyet most ellenőrzésre eltávolít, nagy valószínűséggel az 1. műhely fogja gyártani, és nagy valószínűséggel a második. Ám miután kiderül, hogy a kiválasztott termék szabványos, felkiált: „Micsoda menő csavar! "Inkább a 2. műhely adta ki." Így a második hipotézis valószínűsége jobbra túlbecsült, az első hipotézis valószínűsége pedig alulbecsült: . És ez az átértékelés nem alaptalan - elvégre a 2. műhely nemcsak több terméket gyártott, hanem 2-szer jobban is működik!

Tiszta szubjektivizmus, azt mondod? Részben - igen, ráadásul maga Bayes tolmácsolta a posteriori valószínűségek mint a bizalom szintje. Azonban nem minden ilyen egyszerű – a bayesi megközelítésben van egy objektív szál is. Végül is annak a valószínűsége, hogy a termék szabványos lesz (0,8 és 0,9 az 1. és 2. műhely esetében) Ez előzetes(a priori) és átlagosértékelések. De filozófiailag szólva minden folyik, minden változik, beleértve a valószínűségeket is. Nagyon is lehetséges, hogy a vizsgálat idején a sikeresebb 2. műhely növelte a standard termékek arányát (és/vagy az 1. workshop csökkentve), és ha nagyobb számot vagy mind a 10 ezer terméket ellenőriz a raktárban, akkor a túlbecsült értékek sokkal közelebb állnak az igazsághoz.

Mellesleg, ha Ivan Vasziljevics kivonat egy nem szabványos részt, akkor éppen ellenkezőleg, inkább „gyanús” lesz az 1. műhelyre, és kevésbé a másodikra. Azt javaslom, nézze meg ezt saját szemével:

6. probléma

2 tétel termék érkezett a raktárba: az első - 4000 darab, a második - 6000 darab. A nem szabványos termékek átlagos százaléka az első tételben 20%, a másodikban 10%. A raktárból véletlenszerűen kivett termékről kiderült Nem standard. Határozza meg annak valószínűségét, hogy: a) az első kötegből, b) a második kötegből származik.

A feltételt két betű különbözteti meg, amelyeket félkövérrel kiemeltem. A probléma a semmiből, vagy a korábbi számítások eredményeinek felhasználásával megoldható. A mintában teljes megoldást hajtottam végre, de az 5. feladattal való formai átfedés elkerülése érdekében az esemény „a raktárból véletlenszerűen vett termék nem szabványos”által jelzett.

A valószínűségek újrabecslésére szolgáló Bayes-féle séma mindenhol megtalálható, és különféle típusú csalók is aktívan kihasználják. Tekintsünk egy ismertté vált hárombetűs részvénytársaságot, amely betéteket vonz a lakosságtól, állítólag befekteti valahova, rendszeresen fizet osztalékot stb. Mi történik? Telnek napról napra, hónapról hónapra, és egyre több új, reklámon és szájhagyományon keresztül közvetített tény csak növeli a pénzügyi piramisba vetett bizalmat. (utólagos Bayes-féle újrabecslés a múltbeli események miatt!). Vagyis a befektetők szemében folyamatosan növekszik annak a valószínűsége “Ez egy komoly társaság”; míg az ellenkező hipotézis valószínűsége ("ezek csak több csalók"), természetesen csökken és csökken. Ami ezután következik, az szerintem egyértelmű. Figyelemre méltó, hogy a megszerzett hírnév időt ad a szervezőknek, hogy sikeresen elrejtőzzenek Ivan Vasziljevics elől, aki nemcsak csavarok, hanem nadrágok nélkül is maradt.

Ugyanilyen érdekes példákra kicsit később visszatérünk, de egyelőre a következő lépés talán a leggyakoribb eset három hipotézissel:

7. probléma

Az elektromos lámpákat három gyárban gyártják. Az 1. üzem az összes lámpa 30% -át állítja elő, a 2. - 55%, a 3. - a többit. Az 1. üzem termékei 1% hibás lámpát tartalmaznak, a 2. - 1,5%, a 3. - 2%. Az üzlet mindhárom gyár termékeit fogadja. A vásárolt lámpa hibásnak bizonyult. Mennyi a valószínűsége, hogy a 2. üzem állította elő?

Vegye figyelembe, hogy a Bayes-képletek problémáinál a feltételben Szükségszerűen van egy bizonyos Mi történt esemény, jelen esetben egy lámpa vásárlása.

Az események megszaporodtak, és megoldás Kényelmesebb "gyors" stílusban rendezni.

Az algoritmus pontosan ugyanaz: első lépésben megkeressük annak valószínűségét, hogy a vásárolt lámpa az kiderül hibás.

A kezdeti adatok felhasználásával a százalékokat valószínűségekké alakítjuk:
– annak a valószínűsége, hogy a lámpát az 1., 2. és 3. gyár gyártotta.
Ellenőrzés:

Hasonlóan: – a hibás lámpa gyártásának valószínűsége a megfelelő gyárak számára.

A teljes valószínűségi képlet szerint:

– annak a valószínűsége, hogy a vásárolt lámpa hibás lesz.

Második lépés. Hagyja, hogy a vásárolt lámpa hibás legyen (az esemény megtörtént)

Bayes képlete szerint:
– annak a valószínűsége, hogy a megvásárolt hibás lámpát egy második üzem gyártotta

Válasz:

Miért nőtt a 2. hipotézis kezdeti valószínűsége az átértékelés után? Végül is a második üzem átlagos minőségű lámpákat gyárt (az első jobb, a harmadik rosszabb). Akkor miért növekedett a posteriori Lehetséges, hogy a hibás lámpa a 2. üzemből származik? Ezt már nem a „hírnév”, hanem a méret magyarázza. Mivel a 2. számú üzem gyártotta a legtöbb lámpát, ezt hibáztatják (legalábbis szubjektíven): "valószínűleg onnan származik ez a hibás lámpa".

Érdekes megjegyezni, hogy az 1. és 3. hipotézis valószínűségét a várt irányban túlbecsülték, és egyenlővé váltak:

Ellenőrzés: , amit ellenőrizni kellett.

Egyébként az alul- és túlbecsült becslésekről:

8. probléma

A tanulócsoportban 3 fő magas, 19 fő átlagos és 3 fő alacsony szintű. A sikeres vizsga valószínűsége ezeknél a diákoknál rendre egyenlő: 0,95; 0,7 és 0,4. Ismeretes, hogy néhány diák sikeres vizsgát tett. Mennyi a valószínűsége annak, hogy:

a) nagyon jól felkészült;
b) közepesen felkészült volt;
c) rosszul volt felkészülve.

Végezzen számításokat és elemezze a hipotézisek újraértékelésének eredményeit.

A feladat közel áll a valósághoz, és különösen elfogadható a részmunkaidős hallgatók csoportja számára, ahol a tanár gyakorlatilag nem ismeri egy adott diák képességeit. Ebben az esetben az eredmény egészen váratlan következményeket okozhat. (különösen az 1. félévi vizsgákhoz). Ha egy rosszul felkészült diáknak szerencséje van jegyet szerezni, akkor a tanár valószínűleg jó tanulónak, vagy akár erős tanulónak fogja tekinteni, ami jó hasznot hoz a jövőben. (természetesen "emelni kell a lécet" és meg kell őrizni az imázst). Ha egy diák 7 napig és 7 éjszakán keresztül tanult, zsúfolódott és ismételt, de egyszerűen nem volt szerencséje, akkor a további események a lehető legrosszabb módon alakulhatnak - számos ismétléssel és a kiesés szélén egyensúlyozva.

Mondanunk sem kell, hogy a hírnév a legfontosabb tőke, nem véletlen, hogy sok vállalat viseli alapító atyáit, akik 100-200 évvel ezelőtt vezették az üzletet, és kifogástalan hírnevükről váltak híressé.

Igen, a bayesi megközelítés bizonyos mértékig szubjektív, de... így működik az élet!

Rögzítsük az anyagot egy utolsó ipari példával, amelyben a megoldás eddig ismeretlen technikai bonyodalmairól fogok beszélni:

9. probléma

Az üzem három műhelye azonos típusú alkatrészeket gyárt, amelyeket egy közös konténerbe küldenek összeszerelésre. Ismeretes, hogy az első műhely 2-szer több alkatrészt gyárt, mint a második műhely, és 4-szer többet, mint a harmadik műhely. Az első műhelyben 12%, a másodikban 8%, a harmadikban 4% a hibaarány. Az ellenőrzéshez egy részt kivesznek a tartályból. Mennyi a valószínűsége, hogy hibás lesz? Mennyi a valószínűsége, hogy a kitermelt hibás alkatrészt a 3. műhely gyártotta?

Ivan Vasziljevics ismét lóháton =) Biztosan happy end lesz a film =)

Megoldás: az 5-8. feladattól eltérően itt egy kérdést kifejezetten feltesznek, amelyet a teljes valószínűségi képlet segítségével oldanak meg. Másrészt a feltétel egy kicsit „titkosított”, és az egyszerű egyenletalkotás iskolai készsége segít megoldani ezt a rejtvényt. Célszerű a legkisebb értéket „x”-nek venni:

Legyen a harmadik műhely által gyártott alkatrészek aránya.

A feltétel szerint az első műhely 4-szer többet termel, mint a harmadik műhely, így az 1. műhely részesedése .

Ráadásul az első műhely 2-szer több terméket gyárt, mint a második műhely, ami az utóbbi részarányát jelenti: .

Hozzuk létre és oldjuk meg az egyenletet:

Így: – annak a valószínűsége, hogy a konténerből kivett alkatrészt az 1., 2. és 3. műhely állította elő.

Vezérlés: . Ráadásul nem ártana újra megnézni a kifejezést „Ismert, hogy az első műhelyben kétszer annyi terméket állítanak elő, mint a másodikban, és 4-szer többet, mint a harmadikban.”és győződjön meg arról, hogy a kapott valószínűségi értékek valóban megfelelnek ennek a feltételnek.

Kezdetben az 1. vagy a 2. műhely részesedését vehetnénk „X”-nek – a valószínűségek azonosak lennének. De így vagy úgy, a legnehezebb része már túl van, és a megoldás jó úton halad:

A feltételből a következőket találjuk:
– a hibás alkatrész előállításának valószínűsége a megfelelő műhelyek számára.

A teljes valószínűségi képlet szerint:
– annak a valószínűsége, hogy a tartályból véletlenszerűen eltávolított alkatrész nem szabványos lesz.

Második kérdés: mekkora a valószínűsége annak, hogy a kitermelt hibás alkatrészt a 3. műhely gyártotta? Ez a kérdés feltételezi, hogy az alkatrészt már eltávolították, és hibásnak bizonyult. Újraértékeljük a hipotézist a Bayes-képlet segítségével:
– a kívánt valószínűség. Teljesen elvárható - elvégre a harmadik műhely nem csak a legkisebb arányban gyártja az alkatrészeket, hanem minőségben is vezet!

Ebben az esetben szükség volt rá egyszerűsítse a négyemeletes tört, amit elég gyakran meg kell tennie Bayes-képletek használatával kapcsolatos problémák esetén. De ehhez a leckéhez valahogy véletlenszerűen kiválasztottam olyan példákat, amelyekben sok számítás elvégezhető közönséges törtek nélkül.

Mivel a feltétel nem tartalmaz „a” és „be” pontot, ezért jobb, ha szöveges megjegyzésekkel adjuk meg a választ:

Válasz: – annak a valószínűsége, hogy a tartályból eltávolított alkatrész hibás lesz; – annak a valószínűsége, hogy a kitermelt hibás alkatrészt a 3. műhely állította elő.

Amint látja, a teljes valószínűség képlettel és a Bayes-formulával kapcsolatos problémák meglehetősen egyszerűek, és valószínűleg ezért is próbálják oly gyakran bonyolítani a feltételt, amelyet már a cikk elején említettem.

További példák a fájlban találhatók kész megoldások F.P.V. és Bayes képletek, ráadásul valószínűleg más forrásokban is lesznek, akik szeretnének mélyebben megismerkedni ezzel a témával. A téma pedig tényleg nagyon érdekes – mit ér? Bayes paradoxona, ami indokolja azt a mindennapi tanácsot, hogy ha valakinél ritka betegséget diagnosztizálnak, akkor érdemes ismételt, vagy akár két ismételt független vizsgálatot elvégeznie. Úgy tűnik, hogy ezt kizárólag kétségbeesésből teszik... - de nem! De ne beszéljünk szomorú dolgokról.


annak a valószínűsége, hogy egy véletlenszerűen kiválasztott diák sikeres vizsgát tesz.
Hagyja, hogy a diák sikeres vizsgát tegyen. A Bayes-képletek szerint:
A) – annak a valószínűsége, hogy a sikeres vizsgázó diák nagyon jól felkészült. Az objektív kezdeti valószínűség túlbecsültnek bizonyul, hiszen szinte mindig néhány „átlagos” diák szerencsés a kérdésekkel, és nagyon határozottan válaszol, ami a kifogástalan felkészültség téves benyomását kelti.
b) – annak a valószínűsége, hogy a sikeres vizsgát teljesítő hallgató átlagosan felkészült. A kezdeti valószínűség kissé túlbecsültnek bizonyul, mert Általában az átlagos felkészültségű tanulók vannak többségben, ráadásul itt a tanárba bekerül a „kiváló” sikertelenül válaszoló, illetve esetenként egy-egy rosszul teljesítő tanuló, akinek nagy szerencséje volt a jeggyel.
V) – annak a valószínűsége, hogy a sikeres vizsgát végző hallgató rosszul felkészült. A kezdeti valószínűséget túlbecsülték a rosszabbra. Nem csoda.
Vizsgálat:
Válasz :

Előző cikk: Következő cikk:

© 2015 .
Az oldalról | Kapcsolatok
| Webhelytérkép