në shtëpi » Kërpudha helmuese » Kur të përdoret metoda e gradientit. Metodat e gradientit

Kur të përdoret metoda e gradientit. Metodat e gradientit

Në shumë aplikime praktikisht të rëndësishme rol të madh luan shpërndarjen Poisson. Shumë nga numrat sasi diskrete janë zbatime të një procesi Poisson me vetitë e mëposhtme:

  • Ne jemi të interesuar se sa herë ndodh një ngjarje e caktuar në një zonë të caktuar rezultatet e mundshme eksperiment i rastësishëm. Zona e rezultateve të mundshme mund të jetë një interval kohor, një segment, një sipërfaqe, etj.
  • Probabiliteti i një ngjarjeje të caktuar është i njëjtë për të gjitha fushat e rezultateve të mundshme.
  • Numri i ngjarjeve që ndodhin në një zonë me rezultate të mundshme është i pavarur nga numri i ngjarjeve që ndodhin në zona të tjera.
  • Probabiliteti që një ngjarje e caktuar të ndodhë më shumë se një herë në të njëjtën zonë të rezultateve të mundshme priret në zero ndërsa zona e rezultateve të mundshme zvogëlohet.

Për të kuptuar më tej kuptimin e procesit Poisson, supozojmë se ekzaminojmë numrin e klientëve që vizitojnë një degë banke të vendosur në distriktin qendror të biznesit gjatë drekës, d.m.th. nga ora 12 deri në 13. Supozoni se dëshironi të përcaktoni numrin e klientëve që vijnë në një minutë. A ka kjo situatë karakteristikat e listuara më sipër? Së pari, ngjarja që na intereson është ardhja e një klienti dhe diapazoni i rezultateve të mundshme është një interval prej një minutë. Sa klientë do të vijnë në bankë në një minutë - asnjë, një, dy ose më shumë? Së dyti, është e arsyeshme të supozohet se probabiliteti që një klient të arrijë brenda një minutë është i njëjtë për të gjitha intervalet një minutëshe. Së treti, ardhja e një klienti gjatë çdo intervali një minutësh është e pavarur nga mbërritja e çdo klienti tjetër gjatë çdo intervali tjetër një minutësh. Dhe së fundi, probabiliteti që më shumë se një klient të vijë në bankë tenton në zero nëse intervali kohor tenton në zero, për shembull, bëhet më pak se 0.1 s. Pra, numri i klientëve që vijnë në bankë gjatë drekës brenda një minute përshkruhet nga shpërndarja Poisson.

Shpërndarja Poisson ka një parametër, të shënuar me λ ( shkronja greke"lambda") është numri mesatar i provave të suksesshme në një zonë të caktuar të rezultateve të mundshme. Varianca e shpërndarjes Poisson është gjithashtu λ, dhe devijimi standard i saj është . Numri i provave të suksesshme X Variabla e rastësishme Poisson varion nga 0 në pafundësi. Shpërndarja Poisson përshkruhet me formulën:

Ku P(X)- probabiliteti X prova të suksesshme, λ - numri i pritur i sukseseve, e- bazë logaritmi natyror, e barabartë me 2.71828, X- numri i sukseseve për njësi të kohës.

Le të kthehemi te shembulli ynë. Le të supozojmë se gjatë Pushimi i drekes Mesatarisht, tre klientë vijnë në bankë në minutë. Sa është probabiliteti që dy klientë të vijnë në bankë në një moment të caktuar? Sa është probabiliteti që më shumë se dy klientë të vijnë në bankë?

Le të zbatojmë formulën (1) me parametrin λ = 3. Atëherë probabiliteti që dy klientë të vijnë në bankë brenda një minutë të caktuar është i barabartë me

Probabiliteti që më shumë se dy klientë të vijnë në bankë është i barabartë me P(X > 2) = P(X = 3) + P(X = 4) + … + P(X = ∞). Meqenëse shuma e të gjitha probabiliteteve duhet të jetë e barabartë me 1, termat e serisë në anën e djathtë të formulës paraqesin probabilitetin e mbledhjes së ngjarjes X ≤ 2. Me fjalë të tjera, shuma e kësaj serie është e barabartë me 1 - P(X ≤ 2). Kështu, P(X>2) = 1 – P(X≤2) = 1 – [P(X = 0) + P(X = 1) + P(X = 2)]. Tani, duke përdorur formulën (1), marrim:

Kështu, probabiliteti që brenda një minutë të vijnë në bankë jo më shumë se dy klientë është 0.423 (ose 42.3%), dhe probabiliteti që më shumë se dy klientë të vijnë në bankë brenda një minutë është 0.577 (ose 57.7 %).

Llogaritjet e tilla mund të duken të lodhshme, veçanërisht nëse parametri λ është mjaft i madh. Per te shmangur llogaritjet komplekse, shumë probabilitete Poisson mund të gjenden në tabela të veçanta (Fig. 1). Për shembull, probabiliteti që dy klientë të vijnë në bankë në një minutë të caktuar, nëse mesatarisht tre klientë vijnë në bankë në minutë, është në kryqëzimin e linjës. X= 2 dhe kolona λ = 3. Kështu, është e barabartë me 0,2240 ose 22,4%.

Oriz. 1. Probabiliteti Poisson në λ = 3

Në ditët e sotme, nuk ka gjasa që dikush të përdorë tabela nëse ka Excel me funksionin e tij =POISSON.DIST() në dorë (Fig. 2). Ky funksion ka tre parametra: numri i provave të suksesshme X, numri mesatar i pritshëm i provave të suksesshme λ, parametri Integrale, duke marrë dy vlera: FALSE - në këtë rast llogaritet probabiliteti i numrit të provave të suksesshme X(Vetëm X), E VËRTETË – në këtë rast probabiliteti i numrit të provave të suksesshme nga 0 në X.

Oriz. 2. Llogaritja në Probabilitetet në Excel Shpërndarja e Poissonit në λ = 3

Përafrimi i shpërndarjes binomiale duke përdorur shpërndarjen Poisson

Nëse numri nështë i madh dhe numri R- e vogël, shpërndarja binomiale mund të përafrohet duke përdorur shpërndarjen Poisson. Si numër më i madh n Dhe më pak numër R, aq më e lartë është saktësia e përafrimit. Modeli i mëposhtëm Poisson përdoret për të përafruar shpërndarjen binomiale.

Ku P(X)- probabiliteti X sukses me parametrat e dhënë n Dhe R, n- Madhësia e mostrës, R- probabiliteti i vërtetë i suksesit, e- baza e logaritmit natyror, X- numri i sukseseve në kampion (X = 0, 1, 2, ..., n).

Në teori vlerë e rastësishme, e cila ka një shpërndarje Poisson, merr vlera nga 0 në ∞. Megjithatë, në situatat kur shpërndarja Poisson përdoret për të përafruar shpërndarjen binomiale, ndryshorja e rastësishme Poisson është numri i sukseseve midis n vëzhgimet - nuk mund të tejkalojë numrin n. Nga formula (2) del se me rritjen e numrit n dhe një ulje të numrit R probabiliteti i zbulimit nje numer i madh i shkalla e suksesit zvogëlohet dhe tenton në zero.

Siç u përmend më lart, pritshmëria µ dhe varianca σ 2 e shpërndarjes Poisson janë të barabarta me λ. Prandaj, kur përafrojmë shpërndarjen binomiale duke përdorur shpërndarjen Poisson, formula (3) duhet të përdoret për të përafruar pritshmërinë matematikore.

(3) µ = E(X) = λ =n.p.

Për të përafruar devijimin standard, përdoret formula (4).

Ju lutemi vini re se devijimi standard i llogaritur duke përdorur formulën (4) tenton të devijimi standard në modelin binomial – kur probabiliteti i suksesit fq priret në zero, dhe, në përputhje me rrethanat, probabiliteti i dështimit 1 – fq priret në unitet.

Le të supozojmë se 8% e gomave të prodhuara në një fabrikë të caktuar janë me defekt. Për të ilustruar përdorimin e shpërndarjes Poisson për të përafruar shpërndarjen binomiale, ne llogarisim probabilitetin e gjetjes së një gome me defekt në një kampion prej 20 gomash. Le të zbatojmë formulën (2), marrim

Nëse do të llogarisnim shpërndarjen e vërtetë binomiale në vend të përafrimit të saj, do të merrnim rezultatin e mëposhtëm:

Megjithatë, këto llogaritje janë mjaft të lodhshme. Megjithatë, nëse përdorni Excel për të llogaritur probabilitetet, atëherë përdorimi i përafrimit të shpërndarjes Poisson bëhet i tepërt. Në Fig. Figura 3 tregon se kompleksiteti i llogaritjeve në Excel është i njëjtë. Megjithatë, kjo pjesë, për mendimin tim, është e dobishme për të kuptuar se në kushte të caktuara shpërndarja binomiale dhe shpërndarja Poisson japin rezultate të ngjashme.

Oriz. 3. Krahasimi i kompleksitetit të llogaritjeve në Excel: (a) Shpërndarja Poisson; (b) shpërndarje binomiale

Pra, në këtë dhe dy shënime të mëparshme, u morën parasysh tre shpërndarje numerike diskrete: , dhe Poisson. Për të kuptuar më mirë se si këto shpërndarje lidhen me njëra-tjetrën, ne paraqesim një pemë të vogël pyetjesh (Fig. 4).

Oriz. 4. Klasifikimi shpërndarje diskrete probabilitetet

Përdoren materiale nga libri Levin et al. – M.: Williams, 2004. – f. 320–328

Ku λ është e barabartë me numrin mesatar të ndodhive të ngjarjeve në prova identike të pavarura, d.m.th. λ = n × p, ku p është probabiliteti i një ngjarjeje në një provë, e = 2,71828.

Seria e shpërndarjes së ligjit Poisson ka formën:


Qëllimi i shërbimit. Llogaritësi online përdoret për të ndërtuar shpërndarjen Poisson dhe për të llogaritur të gjitha karakteristikat e serisë: pritjet matematikore, variancën dhe devijimin standard. Raporti me vendimin përpilohet në format Word.
Numri i testeve: n= , Probabiliteti p =
Llogaritni probabilitetin për: m =
do te vije një herë
më pak një herë
jo më pak një herë
më shumë një herë
jo më një herë
jo më pak dhe jo më shumë një herë
do të ndodhë të paktën një herë
Në rastin kur n është i madh dhe λ = p n > 10, formula Poisson jep një përafrim shumë të përafërt dhe teorema lokale dhe integrale e Moivre-Laplace përdoren për të llogaritur P n (m).

Karakteristikat numerike të ndryshores së rastësishme X

Vlera e pritshme Shpërndarja Poisson
M[X] = λ

Varianca e shpërndarjes Poisson
D[X] = λ

Shembulli nr. 1. Farat përmbajnë 0.1% barërat e këqija. Sa është probabiliteti për të gjetur 5 fara barërat e këqija nëse zgjidhni rastësisht 2000 fara?
Zgjidhje.
Probabiliteti p është i vogël, por numri n është i madh. np = 2 P(5) = λ 5 e -5 /5! = 0,03609
Vlera e pritshme: M[X] = λ = 2
Dispersion: D[X] = λ = 2

Shembulli nr. 2. Midis farave të thekrës ka 0,4% fara të barërave të këqija. Hartoni një ligj të shpërndarjes për numrin e barërave të këqija me një përzgjedhje të rastësishme prej 5000 farash. Gjeni pritshmërinë matematikore dhe variancën e kësaj ndryshoreje të rastësishme.
Zgjidhje. Pritshmëria matematikore: M[X] = λ = 0,004*5000 = 20. Dispersioni: D[X] = λ = 20
Ligji i shpërndarjes:

X0 1 2 m
Pe -2020e -20200e -2020 m e -20 /m!

Shembulli nr. 3. Në një central telefonik, ndodh një lidhje e gabuar me një probabilitet prej 1/200. Gjeni probabilitetin që midis 200 lidhjeve të ndodhin:
a) saktësisht një lidhje e gabuar;
b) më pak se tre lidhje të pasakta;
c) më shumë se dy lidhje të pasakta.
Zgjidhje. Sipas kushteve të problemit, probabiliteti i ngjarjes është i ulët, prandaj përdorim formulën Poisson (15).
a) Jepet: n = 200, p = 1/200, k = 1. Le të gjejmë P 200 (1).
Ne marrim: . Pastaj P 200 (1) ≈ e -1 ≈ 0,3679.
b) Jepet: n = 200, p = 1/200, k< 3. Найдем P 200 (k < 3).
Kemi: a = 1.

c) Jepet: n = 200, p = 1/200, k > 2. Gjeni P 200 (k > 2).
Ky problem mund të zgjidhet më thjesht: gjeni probabilitetin ngjarje e kundërt, pasi në këtë rast duhen llogaritur më pak terma. Duke marrë parasysh rastin e mëparshëm, kemi

Merrni parasysh rastin kur n është mjaft i madh dhe p mjaftueshëm i vogël; le të vendosim np = a, ku a është një numër. Në këtë rast, probabiliteti i dëshiruar përcaktohet nga formula Poisson:


Probabiliteti i shfaqjes së k ngjarjeve gjatë një kohëzgjatjeje t mund të gjendet gjithashtu duke përdorur formulën Poisson:
ku λ është intensiteti i rrjedhës së ngjarjeve, domethënë numri mesatar i ngjarjeve që shfaqen për njësi të kohës.

Shembulli nr. 4. Probabiliteti që pjesa të jetë me defekt është 0.005. Janë kontrolluar 400 pjesë. Jepni një formulë për llogaritjen e probabilitetit që më shumë se 3 pjesë të jenë me defekt.

Shembulli nr. 5. Mundësia e shfaqjes së pjesëve me defekt kur ato janë prodhim ne mase e barabartë me p. përcaktoni probabilitetin që një grup N pjesësh përmban a) saktësisht tre pjesë; b) jo më shumë se tre pjesë me defekt.
p=0.001; N = 4500
Zgjidhje.
Probabiliteti p është i vogël, por numri n është i madh. np = 4,5< 10. Значит случайная величина Х – распределена по Shpërndarja Poisson. Le të bëjmë një ligj.
Ndryshorja e rastësishme X ka një gamë vlerash (0,1,2,...,m). Probabilitetet e këtyre vlerave mund të gjenden duke përdorur formulën:

Le të gjejmë serinë e shpërndarjes së X.
Këtu λ = np = 4500*0.001 = 4.5
P(0) = e - λ = e -4,5 = 0,01111
P(1) = λe -λ = 4,5e -4,5 = 0,04999

Atëherë probabiliteti që një grup N pjesësh përmban saktësisht tre pjesë është i barabartë me:

Atëherë probabiliteti që një grup N pjesësh përmban jo më shumë se tre pjesë të dëmtuara:
P(x<3) = P(0) + P(1) + P(2) = 0,01111 + 0,04999 + 0,1125 = 0,1736

Shembulli nr. 6. Një central telefonik automatik merr N thirrje mesatarisht në orë. Përcaktoni probabilitetin që në një minutë të caktuar ajo të marrë: a) saktësisht dy thirrje; b) më shumë se dy thirrje.
N=18
Zgjidhje.
Në një minutë, centrali automatik merr mesatarisht λ = 18/60 min. = 0.3
Duke supozuar se një numër i rastësishëm X i thirrjeve të marra në PBX në një minutë,
i bindet ligjit të Poisson-it, duke përdorur formulën do të gjejmë probabilitetin e dëshiruar

Le të gjejmë serinë e shpërndarjes së X.
Këtu λ = 0.3
P(0) = e - λ = e -0,3 = 0,7408
P(1) = λe -λ = 0,3e -0,3 = 0,2222

Probabiliteti që ajo të marrë saktësisht dy telefonata në një minutë të caktuar është:
P(2) = 0,03334
Probabiliteti që ajo të marrë më shumë se dy telefonata në një minutë të caktuar është:
P(x>2) = 1 - 0.7408 - 0.2222 - 0.03334 = 0.00366

Shembulli nr. 7. Janë marrë në konsideratë dy elemente që veprojnë të pavarur nga njëri-tjetri. Kohëzgjatja e funksionimit pa dështim ka një shpërndarje eksponenciale me parametrin λ1 = 0,02 për elementin e parë dhe λ2 = 0,05 për elementin e dytë. Gjeni probabilitetin që në 10 orë: a) të dy elementët të funksionojnë pa dështim; b) vetëm probabiliteti që elementi nr. 1 të mos dështojë në 10 orë:
Vendimi.
P 1 (0) = e -λ1*t = e -0.02*10 = 0.8187

Probabiliteti që elementi nr. 2 të mos dështojë në 10 orë:
P 2 (0) = e -λ2*t = e -0,05*10 = 0,6065

a) të dy elementët do të funksionojnë pa të meta;
P (2) = P 1 (0) * P 2 (0) = 0,8187 * 0,6065 = 0,4966
b) vetëm një element do të dështojë.
P(1) = P 1 (0)*(1-P 2 (0)) + (1-P 1 (0))*P 2 (0) = 0,8187*(1-0,6065) + (1-0,8187) *0,6065 = 0,4321

Shembulli nr. 7. Prodhimi prodhon 1% defekte. Sa është probabiliteti që nga 1100 produkte të marra për kërkime, jo më shumë se 17 të refuzohen?
shënim: meqenëse këtu n*p =1100*0.01=11 > 10, është e nevojshme të përdoret

1. Koncepti i metodave të gradientit. Një kusht i domosdoshëm për ekzistencën e një ekstremi të një funksioni të vazhdueshëm të diferencueshëm janë kushtet e formës

ku janë argumentet e funksionit. Ky kusht mund të shkruhet më kompakt në formë

(2.4.1)

ku është përcaktimi i gradientit të funksionit në një pikë të caktuar.

Quhen metodat e optimizimit që përdorin një gradient për të përcaktuar ekstremin e funksionit objektiv gradient. Ato përdoren gjerësisht në optimale kontrolli adaptiv gjendjet e qëndrueshme në të cilat bëhet kërkimi për gjendjen e qëndrueshme optimale (në kuptimin e kriterit të zgjedhur) të sistemit kur ndryshojnë parametrat, struktura ose ndikimet e jashtme të tij.

Ekuacioni (2.4.1) in rast i përgjithshëm jolineare. Një zgjidhje e drejtpërdrejtë për të është ose e pamundur ose shumë e vështirë. Gjetja e zgjidhjeve për këtë lloj ekuacionesh është e mundur duke organizuar një procedurë të veçantë për kërkimin e një pike ekstreme, bazuar në përdorimin e llojeve të ndryshme të formulave të përsëritura.

Procedura e kërkimit ndërtohet në formën e një procesi me shumë hapa, në të cilin çdo hap pasues çon në një rritje ose ulje të funksionit objektiv, d.m.th., plotësohen kushtet në rastin e kërkimit të maksimumit dhe minimumit, përkatësisht:

Nëpërmjet n Dhe n- 1 tregon numrin e hapave, dhe janë vektorët që korrespondojnë me vlerat e argumenteve të funksionit objektiv në n-m dhe ( P- 1) hapat. Pas hapit r-të mund të marrim

dmth pas r - hapave - funksioni i synuar nuk do të rritet (zvogëlohet) me ndonjë ndryshim të mëtejshëm në argumentet e tij;. Kjo e fundit nënkupton arritjen e një pike me koordinata për të cilën mund ta shkruajmë atë

(2.4.2)
(2.4.3)

ku është vlera ekstreme e funksionit objektiv.

Për të zgjidhur (2.4.1), në rastin e përgjithshëm, mund të zbatohet procedura e mëposhtme. Le të shkruajmë vlerën e koordinatave të funksionit objektiv në formë

ku është një koeficient (skalar) jo i barabartë me zero.

Në pikën ekstreme që nga ajo kohë

Zgjidhja e ekuacionit (2.4.1) në këtë mënyrë është e mundur nëse kushti i konvergjencës së procesit iterativ është i kënaqur për çdo vlerë fillestare.

Metodat për përcaktimin, bazuar në zgjidhjen e ekuacionit (2.2.), ndryshojnë nga njëra-tjetra në zgjedhjen e , pra në zgjedhjen e hapit të ndryshimit të funksionit objektiv në procesin e kërkimit të ekstremit. Ky hap mund të jetë i përhershëm ose ndryshore Në rastin e dytë, ligji i ndryshimit të vlerës së hapit, nga ana tjetër, mund të paracaktohet ose. varen nga vlera aktuale (mund të jetë jolineare).

2. Metoda e zbritjes më të pjerrët Ideja e metodës së zbritjes më të pjerrët është që kërkimi i ekstremit duhet të kryhet në drejtim të ndryshimit më të madh të gradientit ose antigradientit, pasi kjo është rruga më e shkurtër për t'u arritur. pikë ekstreme. Kur e zbatoni atë, para së gjithash, është e nevojshme të llogaritni gradientin në një pikë të caktuar dhe të zgjidhni vlerën e hapit.

Llogaritja e gradientit. Meqenëse si rezultat i optimizimit, gjenden koordinatat e pikës ekstreme për të cilat është e vlefshme lidhja e mëposhtme:

atëherë procedura llogaritëse për përcaktimin e gradientit mund të zëvendësohet me procedurën e përcaktimit të përbërësve të gradientit në pika diskrete në hapësirën e funksionit objektiv

(2.4.5)

ku ka një ndryshim të vogël në koordinatë

Duke supozuar se pika e përcaktimit të gradientit është në mes

segment pastaj

Zgjedhja e (2.4.5) ose (2.4.6) varet nga pjerrësia e funksionit në seksionin - Ax;; nëse pjerrësia nuk është e madhe, duhet t'i jepet përparësi (2.4.5), pasi këtu ka më pak llogaritje; V ndryshe më shumë rezultate të sakta jep llogaritjen sipas (2.4.4). Rritja e saktësisë së përcaktimit të gradientit është gjithashtu e mundur duke mesatarizuar devijimet e rastësishme.

Zgjedhja e vlerës së hapit Vështirësia në zgjedhjen e një vlere hapi është se drejtimi i gradientit mund të ndryshojë nga pika në pikë. Në këtë rast, një hap shumë i madh do të çojë në një devijim nga trajektorja optimale, d.m.th., nga drejtimi përgjatë gradientit ose anti-gradientit, dhe një hap shumë i vogël do të çojë në një lëvizje shumë të ngadaltë drejt ekstremit për shkak të nevojës. për të kryer vëllim i madh llogaritjet.

Nje nga metodat e mundshme Vlerësimi i vlerës së hapit është metoda Njuton-Raphson. Le ta shqyrtojmë duke përdorur shembullin e një rasti njëdimensional nën supozimin se ekstremi arrihet në pikën e përcaktuar nga zgjidhja e ekuacionit (Fig. 2.4.2).

Le të fillojë kërkimi nga një pikë dhe në afërsi të kësaj pike funksioni mund të zgjerohet në një seri konvergjente Taylor. Pastaj

Drejtimi i gradientit në një pikë përkon me drejtimin e tangjentes. Kur kërkoni për pikën minimale ekstreme, ndryshoni koordinatat X kur lëvizni përgjatë një gradienti mund të shkruhet si:

Fig.2.4.2 Skema për llogaritjen e hapit duke përdorur metodën Newton–Raphson.

Duke zëvendësuar (2.4.7) në (2.4.8), marrim:

Që nga kushti ky shembull vlera arrihet në pikën e përcaktuar nga zgjidhja e ekuacionit, atëherë mund të përpiqeni të bëni një hap të tillë që dmth te

Le të zëvendësojmë një vlerë të re te funksioni i synuar. Nëse atëherë në pikë përsëritet procedura e përcaktimit, si rezultat i së cilës gjendet vlera:



etj. llogaritja ndalon nëse ndryshimet në funksionin objektiv janë të vogla, d.m.th.

Ku gabim i lejuar në përcaktimin e funksionit objektiv.

Metoda optimale e gradientit. Ideja e kësaj metode është si më poshtë. NË metoda e zakonshme Hapi më i pjerrët i zbritjes zgjidhet në rastin e përgjithshëm [kur] në mënyrë arbitrare, i udhëhequr vetëm nga fakti që nuk duhet të kalojë një vlerë të caktuar. Në metodën e gradientit optimal, vlera e hapit zgjidhet bazuar në kërkesën që duhet lëvizur nga një pikë e caktuar në drejtim të gradientit (antigradienti) derisa funksioni objektiv të rritet (zvogëlohet). Nëse kjo kërkesë nuk plotësohet, është e nevojshme të ndalet lëvizja dhe të përcaktohet një drejtim i ri lëvizjeje (drejtimi i gradientit) etj. (derisa të gjendet pika optimale).

Kështu, vlerat optimale për dhe për kërkimin e minimumit dhe maksimumit, përkatësisht, përcaktohen nga zgjidhja e ekuacioneve:

Në (1) dhe (2) respektivisht

Prandaj, përkufizimi në çdo hap konsiston në gjetjen nga ekuacionet (1) ose (2) për secilën pikë të trajektores së lëvizjes përgjatë gradientit, duke filluar nga ajo fillestare.

Metoda bazohet në modifikimin e mëposhtëm përsëritës të formulës

x k +1 = x k + a k s(x k),

x k+1 = x k - a k Ñ f(x k), ku

a është një koeficient pozitiv i dhënë;

Ñ f(x k) është gradienti i funksionit objektiv të rendit të parë.

Të metat:

    nevoja për të zgjedhur një vlerë të përshtatshme ;

    konvergjenca e ngadaltë në pikën minimale për shkak të vogëlsisë së f(x k) në afërsi të kësaj pike.

Metoda e zbritjes më të pjerrët

I lirë nga pengesa e parë e metodës më të thjeshtë të gradientit, sepse a k llogaritet duke zgjidhur problemin e minimizimit të Ñ f(x k) përgjatë drejtimit Ñ f(x k) duke përdorur një nga metodat e optimizimit njëdimensional x k+1 = x k - a k Ñ f(x k).

Kjo metodë nganjëherë quhet metoda Cauchy.

Algoritmi karakterizohet nga një shkallë e ulët konvergjence gjatë zgjidhjes së problemeve praktike. Kjo shpjegohet me faktin se ndryshimet në variabla varen drejtpërdrejt nga vlera e gradientit, e cila tenton në zero në afërsi të pikës minimale dhe nuk ka mekanizëm nxitimi në përsëritjet e fundit. Prandaj, duke marrë parasysh stabilitetin e algoritmit, metoda e zbritjes më të pjerrët shpesh përdoret si procedurë fillestare për gjetjen e një zgjidhjeje (nga pikat e vendosura në distanca të konsiderueshme nga pika minimale).

Metoda e drejtimeve të konjuguara

Detyrë e përgjithshme programim jolinear pa kufizime reduktohet në sa vijon: minimizoni f(x), x E n , ku f(x) është funksioni objektiv. Gjatë zgjidhjes së këtij problemi, ne përdorim metoda minimizimi që çojnë në një pikë stacionare f(x), të përcaktuar nga ekuacioni f(x *)=0. Metoda e drejtimit të konjuguar i referohet metodave të minimizimit të pakufizuara që përdorin derivate. Problemi: minimizoni f(x), x E n, ku f(x) është funksioni objektiv i n variablave të pavarur. Karakteristikë e rëndësishmeështë konvergjencë e shpejtë për faktin se kur zgjedh një drejtim, përdoret matrica Hessian, e cila përshkruan rajonin e topologjisë së sipërfaqes së përgjigjes. Në veçanti, nëse funksioni objektiv është kuadratik, atëherë pika minimale mund të merret në jo më shumë se një numër hapash të barabartë me dimensionin e problemit.

Për të zbatuar metodën në praktikë, ajo duhet të plotësohet me procedura për kontrollin e konvergjencës dhe pavarësisë lineare të sistemit të drejtimit. Metodat e rendit të dytë

Metoda e Njutonit

Zbatimi i vazhdueshëm i skemës së përafrimit kuadratik çon në zbatimin e metodës së optimizimit të Njutonit sipas formulës

x k +1 = x k - Ñ 2 f(x k -1) Ñ f(x k).

Disavantazhi i metodës së Njutonit është besueshmëria e saj e pamjaftueshme kur optimizohen funksionet objektive jo-kuadratike. Prandaj, shpesh modifikohet:

x k +1 = x k - a k Ñ 2 f(x k -1) Ñ f(x k), ku

a k është një parametër i zgjedhur në mënyrë që f(x k+1) min.

2. Gjetja e ekstremumit të një funksioni pa kufizim

Jepet një funksion i caktuar f(x) në një interval të hapur (a, b) të ndryshimeve në argumentin x. Supozojmë se exst ekziston brenda këtij intervali (duhet thënë se në rastin e përgjithshëm kjo nuk mund të thuhet matematikisht paraprakisht; megjithatë, në aplikimet teknike, shumë shpesh prania e exst brenda një intervali të caktuar ndryshimi në intervalin e ndryshimit të argumenti mund të parashikohet nga konsideratat fizike).

Përkufizim exst. Funksioni f(x) i dhënë në intervalin (a, b) ka në pikën x * max(min), nëse kjo pikë mund të rrethohet nga një interval i tillë (x * -ε, x * +ε) që përmbahet në intervali (a, b) , që për të gjitha pikat e tij x që i përkasin intervalit (x * -ε, x * +ε), vlen pabarazia e mëposhtme:

f(x) ≤ f(x *) → për max

f(x) ≥ f(x *) → për min

Ky përkufizim nuk vendos asnjë kufizim në klasën e funksioneve f(x), e cila, natyrisht, është shumë e vlefshme.

Nëse kufizohemi për funksionet f(x), në një klasë mjaft të zakonshme, por ende më të ngushtë funksionesh të lëmuara (me funksione të lëmuara nënkuptojmë ato funksione që janë të vazhdueshme së bashku me derivatet e tyre në intervalin e variacionit të argumentit), atëherë ne mund të përdorë teoremën e Fermatit, e cila jep kushtet e nevojshme për ekzistencën e exst.

Teorema e Fermatit. Le të përcaktohet funksioni f(x) në një interval të caktuar (a, b) dhe në pikën “c” të këtij intervali të marrë vlerën më të madhe (më të vogël). Nëse një derivat i fundëm i dyanshëm ekziston në këtë pikë, atëherë ekzistenca e exst është e nevojshme.

Shënim. Derivati ​​i dyanshëm karakterizohet nga vetia, me fjalë të tjera, ne po flasim për se në pikën "c" derivati ​​në kufi është i njëjtë kur i afrohemi pikës "c" nga e majta dhe nga e djathta, d.m.th f(x) - funksion të qetë.

* Në rastin e min, dhe në → max. Së fundi, nëse në x=x 0, atëherë përdorimi i derivatit të 2-të nuk ju ndihmon dhe duhet të përdorni, për shembull, përkufizimin e exst.

Gjatë zgjidhjes së problemit I, kushtet e nevojshme ekzistuese (d.m.th. teorema e Fermatit) përdoren shumë shpesh.

Nëse ekuacioni exst ka rrënjë reale, atëherë pikat që u korrespondojnë këtyre rrënjëve janë të dyshimta në exst (por jo domosdoshmërisht vetë ekstremet, pasi kemi të bëjmë me kushte të nevojshme, dhe jo të nevojshme dhe të mjaftueshme). Kështu, për shembull, në pikën e lakimit ndodh X p, megjithatë, siç dihet, ky nuk është një ekstrem.

Le të theksojmë gjithashtu se:

    nga kushtet e nevojshmeështë e pamundur të thuhet se çfarë lloji i ekstremit është gjetur, max apo min: nevojiten kërkime shtesë për të përcaktuar këtë;

    Nga kushtet e nevojshme është e pamundur të përcaktohet nëse ky ekstrem është global apo lokal.

Prandaj, kur gjenden pika të dyshimta për exst, ato shqyrtohen më tej, për shembull, bazuar në përkufizimin e exst ose derivatit të 2-të.

Metodat e optimizimit të gradientit

Problemet e optimizimit me marrëdhënie jolineare ose të vështira për t'u llogaritur që përcaktojnë kriteret dhe kufizimet e optimizimit janë objekt i programimit jolinear. Si rregull, zgjidhjet për problemet e programimit jolinear mund të gjenden vetëm duke përdorur metoda numerike teknologji kompjuterike. Midis tyre, më shpesh përdoren metodat e gradientit (metodat e relaksimit, gradienti, zbritja dhe ngjitja më e pjerrët), metodat e kërkimit përcaktues pa gradient (metodat e skanimit, simplex, etj.) dhe metodat e kërkimit të rastësishëm. Të gjitha këto metoda përdoren në përcaktimin numerik të optimës dhe mbulohen gjerësisht në literaturën e specializuar.

Në përgjithësi, vlera e kriterit të optimizimit R mund të konsiderohet si funksion R(x b xx..., x n), përcaktuar në hapësirë ​​l-dimensionale. Meqenëse nuk ka vizuale imazh grafik hapësirë ​​i-dimensionale, le të përdorim rastin e hapësirës dydimensionale.

Nëse R(l b x 2) të vazhdueshme në rajon D, pastaj rreth pikës optimale M°(xi°, x g°) mund të vizatohen në këtë rrafsh vijë e mbyllur, përgjatë së cilës vlera R= konst. Shumë linja të tilla, të quajtura vija të niveleve të barabarta, mund të vizatohen rreth pikës optimale (në varësi të hapit

Ndër metodat e përdorura për zgjidhjen e problemeve të programimit jolinear, një vend të rëndësishëm zënë metodat për gjetjen e zgjidhjeve të bazuara në analizën e derivatit në lidhje me drejtimin e funksionit që optimizohet. Nëse në çdo pikë të hapësirës një funksion skalar i disa ndryshoreve merr vlera të përcaktuara mirë, atëherë në në këtë rast kemi të bëjmë me një fushë skalare (fushë temperaturë, fushë presioni, fushë densiteti etj.). Në mënyrë të ngjashme përcaktohet një fushë vektoriale (fusha e forcave, shpejtësive etj.). Izotermat, izobaret, izokronet etj. - të gjitha këto janë vija (sipërfaqe) të niveleve të barabarta, vlera të barabarta funksionet (temperatura, presioni, vëllimi, etj.). Meqenëse vlera e një funksioni ndryshon nga pika në pikë në hapësirë, bëhet e nevojshme të përcaktohet shpejtësia e ndryshimit të funksionit në hapësirë, domethënë derivati ​​në drejtim.

Koncepti i gradientit përdoret gjerësisht në llogaritjet inxhinierike kur gjenden ekstremet funksionet jolineare. Metodat e gradientit janë metoda të kërkimit numerik. Ato janë universale dhe veçanërisht efektive në rastet e kërkimit të ekstremeve të funksioneve jolineare me kufizime, si dhe kur funksioni analitik krejtësisht i panjohur. Thelbi i këtyre metodave është përcaktimi i vlerave të variablave që sigurojnë ekstremin e funksionit të qëllimit duke lëvizur përgjatë gradientit (kur kërkoni maksimumi) ose në drejtim i kundërt (min). Metodat e ndryshme të gradientit ndryshojnë nga njëra-tjetra në mënyrën se si përcaktojnë lëvizjen drejt optimumit. Përfundimi është se nëse linja me nivele të barabarta R(xu x i) karakterizojnë grafikisht varësinë R(x\jc?), atëherë kërkimi i pikës optimale mund të bëhet në mënyra të ndryshme. Për shembull, vizatoni një rrjetë në një aeroplan x\, xr duke treguar vlerat R në nyjet e rrjetit (Fig. 2.13).

Pastaj mund të zgjidhni vlerën ekstreme nga vlerat e nyjeve. Kjo rrugë nuk është racionale, është e lidhur me të sasi e madhe llogaritjet, dhe saktësia është e ulët, pasi varet nga hapi, dhe optimali mund të jetë midis nyjeve.

Metodat numerike

Modelet matematikore përmbajnë marrëdhënie të bazuara në analiza teorike proceset që studiohen ose merren si rezultat i eksperimenteve të përpunimit (tabelat e të dhënave, grafikët). Në çdo rast, modeli matematik vetëm përafërsisht përshkruan proces real. Prandaj, çështja e saktësisë dhe përshtatshmërisë së modelit është më e rëndësishmja. Nevoja për përafrime lind edhe kur zgjidhen vetë ekuacionet. Deri vonë, modelet që përmbajnë ekuacione diferenciale jolineare ose ekuacione diferenciale të pjesshme nuk mund të zgjidheshin me metoda analitike. E njëjta gjë vlen edhe për klasa të shumta të integraleve të qiellit. Sidoqoftë, zhvillimi i metodave të analizës numerike ka bërë të mundur zgjerimin e pakufishëm të kufijve të aftësive të analizës. modele matematikore, sidomos kjo u bë e vërtetë me përdorimin e kompjuterëve.

Metodat numerike përdoren për të përafruar funksionet për të zgjidhur ekuacionet diferenciale dhe sistemet e tyre, për integrimin dhe diferencimin, për llogaritjen e shprehjeve numerike.

Funksioni mund të specifikohet në mënyrë analitike, si tabelë ose grafik. Gjatë kryerjes së hulumtimit, një detyrë e zakonshme është përafrimi i funksionit shprehje analitike, duke plotësuar kushtet e vendosura. Kjo zgjidh katër probleme:

Zgjedhja e pikave nodale, kryerja e eksperimenteve në vlera (nivele) të caktuara të variablave të pavarur (nëse hapi i ndryshimit të një faktori është zgjedhur gabimisht, ne ose do të "humbim" një tipar karakteristik të procesit që studiohet, ose do të zgjasim procedurën dhe rrisin kompleksitetin e kërkimit të një modeli);

Përzgjedhja e funksioneve përafruese në formë polinomesh, formula empirike në varësi të përmbajtjes detyrë specifike(duhet të përpiqemi të thjeshtojmë funksionet e përafrimit sa më shumë që të jetë e mundur);

Përzgjedhja dhe përdorimi i kritereve të marrëveshjes, mbi bazën e të cilave gjenden parametrat e funksioneve të përafrimit;

Plotësimi i kërkesave të një saktësie të caktuar për zgjedhjen e një funksioni të përafrimit.

Në problemet e përafrimit të funksioneve me polinome përdoren tre klasa

Kombinim linear funksionet e fuqisë(Seria Taylor, polinomet e Lagranzhit, Njutonit etj.);

Kombinimi i funksioneve cos ph, me ato(seri Fourier);

Polinom i formuar nga funksionet exp(-a, d).

Gjatë gjetjes së funksionit të përafërt, përdoren kritere të ndryshme për përputhjen me të dhënat eksperimentale.



Artikulli i mëparshëm: Artikulli vijues:

© 2015 .
Rreth sajtit | Kontaktet
| Harta e faqes