në shtëpi » kultivimi » Shembuj të sistemeve të njohjes së modeleve. Detyra e formimit të një kampioni trajnimi

Shembuj të sistemeve të njohjes së modeleve. Detyra e formimit të një kampioni trajnimi

Kapitulli 3: Rishikimi analitik i metodave të njohjes së modelit dhe vendimmarrjes

Teoria e njohjes së modelit dhe automatizimi i kontrollit

Detyrat kryesore të njohjes së modeleve adaptive

Njohja është një proces informacioni i zbatuar nga disa konvertues informacioni (kanali inteligjent informacioni, sistemi i njohjes) që ka një hyrje dhe dalje. Hyrja e sistemit është informacion se cilat veçori kanë objektet e paraqitura. Dalja e sistemit shfaq informacion se cilat klasa (imazhe të përgjithësuara) u janë caktuar objektet e njohura.

Kur krijoni dhe përdorni një sistem të automatizuar të njohjes së modelit, zgjidhen një sërë detyrash. Le t'i shqyrtojmë shkurtimisht dhe thjesht këto detyra. Duhet të theksohet se formulimet e këtyre problemeve, dhe vetë grupi, nuk përkojnë me autorë të ndryshëm, pasi në një masë të caktuar varet nga modeli specifik matematik mbi të cilin bazohet ky apo ai sistem njohjeje. Për më tepër, disa detyra në modele të caktuara të njohjes nuk kanë zgjidhje dhe, në përputhje me rrethanat, nuk parashtrohen.

Detyra e formalizimit të fushës lëndore

Në fakt, kjo detyrë është një detyrë e kodimit. Përpilohet një listë e klasave të përgjithësuara, e cila mund të përfshijë zbatime specifike të objekteve, si dhe një listë të veçorive që këto objekte, në parim, mund të kenë.

Detyra e formimit të një kampioni trajnimi

Mostra e trajnimit është një bazë të dhënash që përmban përshkrime të zbatimeve specifike të objekteve në gjuhën e veçorive, të plotësuar me informacione për përkatësinë e këtyre objekteve në klasa të caktuara njohjeje.

Detyra e trajnimit të sistemit të njohjes

Mostra e trajnimit përdoret për të formuar imazhe të përgjithësuara të klasave të njohjes bazuar në përgjithësimin e informacionit se cilat veçori kanë objektet e kampionit të trajnimit që i përkasin kësaj klase dhe klasave të tjera.

Problemi i reduktimit të dimensionit të hapësirës së veçorive

Pas trajnimit të sistemit të njohjes (marrja e statistikave për shpërndarjen e frekuencave të veçorive sipas klasës), bëhet e mundur të përcaktohet për secilën veçori vlera e tij për zgjidhjen e problemit të njohjes. Pas kësaj, veçoritë më pak të vlefshme mund të hiqen nga sistemi i veçorive. Pastaj sistemi i njohjes duhet të rikualifikohet, pasi si rezultat i heqjes së disa veçorive, statistikat e shpërndarjes së veçorive të mbetura sipas klasave ndryshojnë. Ky proces mund të përsëritet, d.m.th. të jetë përsëritës.

Detyrë njohjeje

Njihen objektet e një kampioni të njohur, të cilat, në veçanti, mund të përbëhen nga një objekt. Mostra e njohur është formuar në mënyrë të ngjashme me atë të trajnimit, por nuk përmban informacione për përkatësinë e objekteve në klasa, pasi kjo është pikërisht ajo që përcaktohet në procesin e njohjes. Rezultati i njohjes së secilit objekt është një shpërndarje ose një listë e të gjitha klasave të njohjes në rend zbritës të shkallës së ngjashmërisë së objektit të njohur me to.

Detyra e kontrollit të cilësisë së njohjes

Pas njohjes, mund të përcaktohet përshtatshmëria e tij. Për objektet e mostrës së trajnimit, kjo mund të bëhet menjëherë, pasi për ta thjesht dihet se cilës klasa i përkasin. Për objektet e tjera, ky informacion mund të merret më vonë. Në çdo rast, aktuale probabiliteti mesatar gabimet për të gjitha klasat e njohjes, si dhe probabiliteti i një gabimi kur i caktohet një objekt i njohur një klase të caktuar.

Rezultatet e njohjes duhet të interpretohen duke marrë parasysh informacionin e disponueshëm për cilësinë e njohjes.

Detyrë përshtatjeje

Nëse, si rezultat i procedurës së kontrollit të cilësisë, konstatohet se është e pakënaqshme, atëherë përshkrimet e objekteve të njohura gabimisht mund të kopjohen nga mostra e njohur në atë të trajnimit, të plotësohen me informacion të përshtatshëm klasifikues dhe të përdoren për të riformuar vendimin. rregullat, d.m.th. duke marrë parasysh. Për më tepër, nëse këto objekte nuk i përkasin klasave tashmë ekzistuese të njohjes, gjë që mund të jetë arsyeja e njohjes së gabuar të tyre, atëherë kjo listë mund të zgjerohet. Si rezultat, sistemi i njohjes përshtatet dhe fillon t'i klasifikojë në mënyrë adekuate këto objekte.

Problemi i njohjes së kundërt

Detyra e njohjes është që për një objekt të caktuar, sipas veçorive të tij të njohura, sistemi vendos përkatësinë e tij në një klasë të panjohur më parë. Në problemin e njohjes së kundërt, përkundrazi, për një klasë të caktuar njohjeje, sistemi përcakton se cilat veçori janë më karakteristike për objektet e kësaj klase dhe cilat jo (ose cilat objekte të mostrës së trajnimit i përkasin kësaj klase).

Detyrat e analizës grupore dhe konstruktive

Grupet janë grupe të tilla objektesh, klasash ose veçorish që brenda çdo grupi ato janë sa më të ngjashme, dhe midis grupimeve të ndryshme ato janë sa më të ndryshme.

Një konstrukt (në kontekstin e konsideruar në këtë seksion) është një sistem grupimesh të kundërta. Kështu, në një kuptim të caktuar, konstruktet janë rezultat i një analize të grupimeve të grupimeve.

Në analizën e grupimeve, shkalla e ngjashmërisë dhe dallimit të objekteve (klasave, veçorive) matet në mënyrë sasiore dhe ky informacion përdoret për klasifikim. Rezultati i analizës së grupimeve është vetë klasifikimi i objekteve sipas grupimeve. Ky klasifikim mund të përfaqësohet në formën e rrjeteve semantike.

Detyra e analizës konjitive

Në analizën kognitive, informacioni për ngjashmërinë dhe ndryshimin e klasave ose veçorive është në vetvete me interes për studiuesin dhe jo për ta përdorur atë për klasifikim, si në analizën grupore dhe konstruktive.

Nëse dy klasa të njohjes karakterizohen nga e njëjta veçori, atëherë kjo kontribuon në ngjashmërinë e këtyre dy klasave. Nëse për njërën nga klasat kjo veçori nuk është karakteristike, atëherë kjo kontribuon në ndryshimin.

Nëse dy shenja lidhen me njëra-tjetrën, atëherë në një kuptim të caktuar ato mund të konsiderohen si një shenjë, dhe nëse janë antikorrelative, atëherë si të ndryshme. Duke marrë parasysh këtë rrethanë, një kontribut në ngjashmërinë dhe ndryshimin e tyre jep edhe prania e veçorive të ndryshme në klasa të ndryshme.

Rezultatet e analizës kognitive mund të paraqiten në formën e diagrameve njohëse.

Metodat e njohjes së modeleve dhe karakteristikat e tyre

Parimet e klasifikimit të metodave të njohjes së modeleve

Njohja e modelit është detyra e ndërtimit dhe zbatimit të operacioneve formale mbi paraqitjet numerike ose simbolike të objekteve në botën reale ose ideale, rezultatet e të cilave pasqyrojnë marrëdhëniet ekuivalente midis këtyre objekteve. Marrëdhëniet ekuivalente shprehin përkatësinë e objekteve të vlerësuara në disa klasa, të konsideruara si njësi semantike të pavarura.

Gjatë ndërtimit të algoritmeve të njohjes, klasat e ekuivalencës mund të vendosen nga një studiues i cili përdor idetë e tij kuptimplota ose përdor informacion shtesë të jashtëm për ngjashmërinë dhe ndryshimin e objekteve në kontekstin e problemit që zgjidhet. Më pas flitet për “njohje me mësuesin”. NË ndryshe, d.m.th. Kur sistem i automatizuar zgjidh problemin e klasifikimit pa përfshirjen e informacionit të jashtëm të trajnimit, flitet për klasifikim automatik ose "njohje të pambikëqyrur". Shumica e algoritmeve të njohjes së modeleve kërkojnë përfshirjen e fuqisë llogaritëse shumë të rëndësishme, e cila mund të sigurohet vetëm nga teknologjia kompjuterike me performancë të lartë.

Autorë të ndryshëm (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, F. E. Temnikov, J. Tu, R. Gonzalez, P. K. Fu, Ya. Z. Tsypkin dhe të tjerë) japin një tipologji të ndryshme të metodave të njohjes së modeleve. Disa autorë bëjnë dallimin ndërmjet metodave parametrike, joparametrike dhe heuristike, ndërsa të tjerë veçojnë grupe metodash të bazuara në shkollat ​​historike dhe prirjet në këtë fushë. Për shembull, në veprën, e cila jep një pasqyrë akademike të metodave të njohjes, përdoret tipologjia e mëposhtme e metodave të njohjes së modeleve:

  • metodat e bazuara në parimin e ndarjes;
  • metodat statistikore;
  • metodat e ndërtuara në bazë të " funksionet e mundshme»;
  • metodat për llogaritjen e notave (votim);
  • metoda të bazuara në llogaritjen propozicionale, veçanërisht në aparatin e algjebrës së logjikës.

Ky klasifikim bazohet në ndryshimin në metodat formale të njohjes së modelit, dhe për këtë arsye nuk merret parasysh qasja heuristike e njohjes, e cila ka marrë zhvillim të plotë dhe adekuat në sistemet e ekspertëve. Qasja heuristike bazohet në njohuritë dhe intuitën e vështirë për t'u formalizuar të studiuesit. Në të njëjtën kohë, vetë studiuesi përcakton se çfarë informacioni dhe si duhet të përdorë sistemi për të arritur efektin e dëshiruar të njohjes.

Një tipologji e ngjashme e metodave të njohjes me shkallë të ndryshme detajesh gjendet në shumë vepra mbi njohjen. Në të njëjtën kohë, tipologjitë e njohura nuk marrin parasysh një karakteristikë shumë domethënëse që pasqyron specifikat e mënyrës së njohurive rreth fusha lëndore duke përdorur disa algoritme formale të njohjes së modelit.

D.A. Pospelov (1990) identifikon dy mënyra kryesore të përfaqësimit të njohurive:

  • intensional, në formën e një skeme lidhjesh ndërmjet atributeve (veçorive).
  • shtrirë, me ndihmën e fakteve specifike (objekte, shembuj).

Përfaqësimi intensiv kap modelet dhe marrëdhëniet që shpjegojnë strukturën e të dhënave. Në lidhje me detyrat diagnostike, një fiksim i tillë konsiston në përcaktimin e operacioneve mbi atributet (veçoritë) e objekteve që çojnë në rezultatin e kërkuar diagnostik. Paraqitjet intensive zbatohen përmes operacioneve mbi vlerat e atributeve dhe nuk nënkuptojnë operacione mbi fakte specifike informacioni (objekte).

Nga ana tjetër, paraqitjet shtrirëse të njohurive shoqërohen me përshkrimin dhe fiksimin e objekteve specifike nga fusha lëndore dhe zbatohen në operacione, elementët e të cilave janë objekte si sisteme të plota.

Është e mundur të bëhet një analogji midis paraqitjeve intensive dhe zgjeruese të njohurive dhe mekanizmave që qëndrojnë në themel të aktivitetit të hemisferës së majtë dhe të djathtë të trurit të njeriut. Nëse hemisfera e djathtë karakterizohet nga një përfaqësim holistik prototip i botës përreth, atëherë hemisferën e majtë operon me modele që pasqyrojnë lidhjet e atributeve të kësaj bote.

Dy mënyrat themelore të përfaqësimit të njohurive të përshkruara më sipër na lejojnë të propozojmë klasifikimin e mëposhtëm të metodave të njohjes së modelit:

  • metodat intensive të bazuara në operacione me atribute.
  • metodat zgjeruese të bazuara në operacionet me objekte.

Është e nevojshme të theksohet se ekzistenca e këtyre dy (dhe vetëm dy) grupeve të metodave të njohjes: ato që veprojnë me veçori dhe ato që veprojnë me objekte, është thellësisht e natyrshme. Nga ky këndvështrim, asnjë nga këto metoda, të marra veçmas nga tjetra, nuk bën të mundur formimin e një pasqyrimi adekuat të fushës së lëndës. Sipas autorëve, midis këtyre metodave ekziston një lidhje komplementariteti në kuptimin e N. Bohr-it, prandaj, sistemet premtuese të njohjes duhet të sigurojnë zbatimin e të dyja këtyre metodave dhe jo të njërës prej tyre.

Kështu, klasifikimi i metodave të njohjes së propozuar nga D. A. Pospelov bazohet në ligjet themelore që qëndrojnë në themel të mënyrës njerëzore të njohjes në përgjithësi, gjë që e vendos atë në një pozicion shumë të veçantë (të privilegjuar) në krahasim me klasifikimet e tjera, të cilat, në këtë sfond, duken më e lehtë dhe artificiale.

Metodat intensive

Një tipar dallues i metodave intensive është se ato përdorin si elemente të operacioneve në ndërtimin dhe aplikimin e algoritmeve të njohjes së modeleve. karakteristika të ndryshme veçoritë dhe marrëdhëniet e tyre. Elementë të tillë mund të jenë vlerat individuale ose intervalet e vlerave të veçorive, vlerat mesatare dhe variancat, matricat e marrëdhënieve të veçorive, etj., mbi të cilat kryhen veprimet, të shprehura në formë analitike ose konstruktive. Në të njëjtën kohë, objektet në këto metoda nuk konsiderohen si njësi informacioni integrale, por veprojnë si tregues për vlerësimin e ndërveprimit dhe sjelljes së atributeve të tyre.

Grupi i metodave intensive të njohjes së modeleve është i gjerë dhe ndarja e tij në nënklasa është disi arbitrare.

Metodat e bazuara në vlerësimet e densitetit të shpërndarjes së vlerave të veçorive

Këto metoda të njohjes së modeleve janë huazuar nga teoria klasike e vendimeve statistikore, në të cilën objektet e studimit konsiderohen si zbatime të një shumëdimensionale. ndryshore e rastësishme të shpërndara në hapësirën e veçorive sipas ndonjë ligji. Ato bazohen në një skemë vendimmarrëse Bayesian që apelon në probabilitete a priori të objekteve që i përkasin një klase të veçantë të njohur dhe densitet të shpërndarjes së kushtëzuar të vlerave të vektorit të veçorive. Këto metoda reduktohen në përcaktimin e raportit të gjasave në fusha të ndryshme hapësirë ​​shumëdimensionale shenjat.

Grupi i metodave të bazuara në vlerësimin e densitetit të shpërndarjes së vlerave të veçorive lidhet drejtpërdrejt me metodat e analizës diskriminuese. Qasja Bayesiane ndaj vendimmarrjes është një nga më të zhvilluarat në statistikat moderne, të ashtuquajturat metoda parametrike, për të cilat konsiderohet e njohur. shprehje analitike ligji i shpërndarjes (në këtë rast ligj normal) dhe duhet të vlerësohen vetëm një numër i vogël parametrash (vektorët mesatarë dhe matricat e kovariancës).

Vështirësitë kryesore në zbatimin e këtyre metodave konsiderohen si nevoja për të mbajtur mend të gjithë kampionin e trajnimit për të llogaritur vlerësimet e densitetit lokal të shpërndarjes së probabilitetit dhe ndjeshmëri e lartë për mospërfaqësimin e kampionit të trajnimit.

Metodat e bazuara në supozimet për klasën e funksioneve të vendimit

Në këtë grup metodash, forma e përgjithshme e funksionit të vendimmarrjes konsiderohet e njohur dhe jepet cilësia e tij funksionale. Bazuar në këtë funksional, përafrimi më i mirë i funksionit të vendimit gjendet nga sekuenca e trajnimit. Më të zakonshmet janë paraqitjet e funksioneve të vendimit në formën e polinomeve jolineare lineare dhe të përgjithësuara. Cilësia funksionale e rregullit të vendimit zakonisht shoqërohet me gabimin e klasifikimit.

Avantazhi kryesor i metodave të bazuara në supozimet për klasën e funksioneve të vendimit është qartësia e formulimit matematikor të problemit të njohjes si problem i gjetjes së një ekstremi. Shpjegohet shumëllojshmëria e metodave të këtij grupi një gamë të gjerë përdori funksione cilësore të rregullit të vendimit dhe algoritme të kërkimit ekstrem. Një përgjithësim i algoritmeve të konsideruara, të cilat përfshijnë, në veçanti, algoritmin e Njutonit, algoritmet e tipit perceptron, etj., është metoda e përafrimit stokastik.

Janë studiuar mjaft mirë mundësitë e algoritmeve të gradientit për gjetjen e një ekstremumi, veçanërisht në grupin e rregullave të vendimmarrjes lineare. Konvergjenca e këtyre algoritmeve është vërtetuar vetëm për rastin kur klasat e dallueshme të objekteve shfaqen në hapësirën e veçorive nga struktura kompakte gjeometrike.

Cilësia mjaft e lartë e rregullit të vendimit mund të arrihet duke përdorur algoritme që nuk kanë një provë rigoroze matematikore të konvergjencës së zgjidhjes me ekstremin global. Algoritme të tilla përfshijnë një grup të madh procedurash programimi heuristik që përfaqësojnë drejtimin e modelimit evolucionar. Modelimi evolucionar është një metodë bionike e huazuar nga natyra. Ai bazohet në përdorimin e mekanizmave të njohur të evolucionit për të zëvendësuar procesin e modelimit kuptimplotë të një objekti kompleks me modelimin fenomenologjik të evolucionit të tij. Një përfaqësues i njohur i modelimit evolucionar në njohjen e modelit është metoda e kontabilitetit në grup të argumenteve (MGUA). GMDH bazohet në parimin e vetë-organizimit, dhe algoritmet GMDH riprodhojnë skemën e përzgjedhjes masive.

Megjithatë, arritja e qëllimeve praktike në këtë rast nuk shoqërohet me nxjerrjen e njohurive të reja për natyrën e objekteve të dallueshme. Mundësia e nxjerrjes së kësaj njohurie, veçanërisht njohurive në lidhje me mekanizmat e ndërveprimit të atributeve (veçorive), kufizohet thelbësisht këtu nga struktura e caktuar e një ndërveprimi të tillë, e fiksuar në formën e zgjedhur të funksioneve vendimtare.

Metodat Boolean

Metodat logjike të njohjes së modelit bazohen në aparatin e algjebrës logjike dhe lejojnë të operojnë me informacionin që përmbahet jo vetëm në veçori individuale, por edhe në kombinime të vlerave të veçorive. Në këto metoda, vlerat e çdo atributi konsiderohen si ngjarje elementare.

Në shumë pamje e përgjithshme metodat logjike mund të karakterizohen si një lloj kërkimi i modeleve logjike në kampionin e trajnimit dhe formimi i një sistemi të caktuar rregullash vendimesh logjike (për shembull, në formën e lidhjeve të ngjarjeve elementare), secila prej të cilave ka peshën e vet. Grupi i metodave logjike është i larmishëm dhe përfshin metoda me kompleksitet dhe thellësi të ndryshme analize. Për veçoritë dikotomike (boolean), janë të njohura të ashtuquajturit klasifikues të ngjashëm me pemën, metoda e testimit në fund të fundit, algoritmi Bark, etj.

Algoritmi Kora, si metodat e tjera logjike të njohjes së modelit, është mjaft i mundimshëm për sa i përket llogaritjes, pasi një numërim i plotë është i nevojshëm kur zgjidhni lidhëzat. Prandaj, kur aplikohen metoda logjike, vendosen kërkesa të larta organizim efektiv procesi llogaritës dhe këto metoda funksionojnë mirë për dimensione relativisht të vogla të hapësirës së veçorive dhe vetëm në kompjuterë të fuqishëm.

Metodat gjuhësore (strukturore).

Metodat gjuhësore të njohjes së modeleve bazohen në përdorimin e gramatikave speciale që gjenerojnë gjuhë që mund të përdoren për të përshkruar një sërë vetive të objekteve të dallueshme.

Për klasa të ndryshme objektesh, dallohen elementet jo-derivative (atomike) (nënimazhet, shenjat) dhe marrëdhëniet e mundshme ndërmjet tyre. Gramatika i referohet rregullave për ndërtimin e objekteve nga këta elementë jo të prejardhur.

Pra, çdo objekt është një përmbledhje elementësh jo-derivativ, të "lidhur" me njëri-tjetrin në një mënyrë ose në një tjetër, ose, thënë ndryshe, nga një "fjali" e ndonjë "gjuhe". Do të doja të theksoja vlerën shumë domethënëse ideologjike të këtij mendimi.

Duke analizuar ( analizë gramatikore) "fjalia" përcaktohet nga "korrektësia" e saj sintaksore ose, në mënyrë ekuivalente, nëse një gramatikë fikse që përshkruan një klasë mund të gjenerojë një përshkrim ekzistues të objektit.

Sidoqoftë, problemi i rivendosjes (përcaktimit) të gramatikave nga një grup i caktuar deklaratash (fjali - përshkrime të objekteve) gjeneron gjuhën e dhënë, është e vështirë të zyrtarizohet.

Metodat Zgjeruese

Në metodat e këtij grupi, në ndryshim nga drejtimi intensiv, çdo objekti të studiuar i jepet një vlerë e pavarur diagnostike në një masë më të madhe ose më të vogël. Në thelbin e tyre, këto metoda janë afër qasjes klinike, e cila i konsideron njerëzit jo si një zinxhir objektesh të renditura sipas një ose një treguesi tjetër, por si sisteme integrale, secila prej të cilave është individuale dhe ka një vlerë të veçantë diagnostikuese. Një qëndrim i tillë i kujdesshëm ndaj objekteve të studimit nuk lejon që dikush të përjashtojë ose të humbasë informacionin për secilin objekt individual, i cili ndodh kur aplikoni metodat e drejtimit intensiv, duke përdorur objekte vetëm për të zbuluar dhe rregulluar modelet e sjelljes së atributeve të tyre.

Operacionet kryesore në njohjen e modelit duke përdorur metodat e diskutuara janë operacionet e përcaktimit të ngjashmërisë dhe ndryshimit të objekteve. Objektet në grupin e specifikuar të metodave luajnë rolin e precedentëve diagnostikues. Megjithatë, në varësi të kushteve detyrë specifike roli i një precedenti individual mund të ndryshojë në një gamë të gjerë: nga pjesëmarrja kryesore dhe përcaktuese deri te pjesëmarrja shumë indirekte në procesin e njohjes. Nga ana tjetër, kushtet e problemit mund të kërkojnë pjesëmarrjen e sasi të ndryshme precedentë diagnostikues: nga një në çdo klasë të njohur deri në të gjithë madhësinë e kampionit, dhe menyra te ndryshme llogaritja e masave të ngjashmërisë dhe dallimit të objekteve. Këto kërkesa shpjegojnë ndarjen e mëtejshme të metodave zgjeruese në nënklasa.

Metoda e krahasimit të prototipit

Kjo është metoda më e thjeshtë e njohjes zgjatuese. Përdoret, për shembull, në rastin kur klasat e njohura shfaqen në hapësirën e veçorive nga grupime kompakte gjeometrike. Në këtë rast, qendra e grupimit gjeometrik të klasës (ose objekti më afër qendrës) zakonisht zgjidhet si pikë prototip.

Për të klasifikuar një objekt të panjohur, gjendet prototipi më i afërt me të dhe objekti i përket së njëjtës klasë si ky prototip. Natyrisht, në këtë metodë nuk formohen imazhe të përgjithshme të klasës.

Lloje të ndryshme distancash mund të përdoren si masë e afërsisë. Shpesh për tipare dikotomike përdoret distanca Hamming, e cila në këtë rast është e barabartë me katrorin e distancës Euklidiane. Në këtë rast, rregulli i vendimit për klasifikimin e objekteve është i barabartë me një funksion vendimi linear.

Ky fakt duhet theksuar veçanërisht. Ai tregon qartë lidhjen midis prototipit dhe paraqitjes treguese të informacionit rreth strukturës së të dhënave. Duke përdorur paraqitjen e mësipërme, ju mund, për shembull, çdo shkallë matëse tradicionale, e cila është funksion linear nga vlerat e veçorive dikotomike, të konsiderohet si një prototip hipotetik diagnostik. Nga ana tjetër, nëse analiza e strukturës hapësinore të klasave të njohura na lejon të konkludojmë se ato janë gjeometrikisht kompakte, atëherë mjafton që secila prej këtyre klasave të zëvendësohet me një prototip, i cili në fakt është i barabartë me një model diagnostik linear.

Në praktikë, natyrisht, situata është shpesh e ndryshme nga shembulli i idealizuar i përshkruar. Një studiues që synon të aplikojë një metodë njohjeje të bazuar në krahasimin me prototipet e klasave diagnostikuese përballet me probleme të vështira.

Së pari, është zgjedhja e një mase afërsie (metrike), e cila mund të ndryshojë ndjeshëm konfigurimin hapësinor të shpërndarjes së objekteve. Së dyti, një problem i pavarur është analiza e strukturave shumëdimensionale të të dhënave eksperimentale. Të dyja këto probleme janë veçanërisht të mprehta për studiuesin në kushtet e dimensionit të lartë të hapësirës së veçorive, e cila është tipike për problemet reale.

k metoda e fqinjit më të afërt

Metoda e k fqinjëve më të afërt për zgjidhjen e problemeve të analizës diskriminuese u propozua për herë të parë në vitin 1952. Është si më poshtë.

Gjatë klasifikimit të një objekti të panjohur, gjendet një numër i caktuar (k) i objekteve të tjera gjeometrikisht më të afërta me të në hapësirën e veçorive (fqinjët më të afërt) me përkatësi tashmë të njohur në klasa të njohura. Vendimi për t'i caktuar një objekt të panjohur një klase të caktuar diagnostikuese merret duke analizuar informacionin rreth këtij anëtarësimi të njohur të fqinjëve të tij më të afërt, për shembull, duke përdorur një numërim të thjeshtë votash.

Fillimisht, metoda k fqinjët më të afërt u konsiderua si një metodë joparametrike për vlerësimin e raportit të gjasave. Për këtë metodë, përftohen vlerësime teorike të efektivitetit të saj në krahasim me klasifikuesin optimal Bayesian. Është vërtetuar se probabilitetet e gabimit asimptotik për metodën k fqinji më i afërt i tejkalojnë gabimet e rregullit të Bayes jo më shumë se dy herë.

Kur përdor metodën k fqinjët më të afërt për njohjen e modelit, studiuesi duhet të zgjidhë problemin e vështirë të zgjedhjes së një metrike për të përcaktuar afërsinë e objekteve të diagnostikuara. Ky problem në kushtet e dimensionalitetit të lartë të hapësirës së veçorive është tepër i rënduar për shkak të intensitetit të mjaftueshëm të punës. këtë metodë, e cila bëhet e rëndësishme edhe për kompjuterët me performancë të lartë. Prandaj, këtu, ashtu si në metodën e krahasimit të prototipit, është e nevojshme të zgjidhet problemi krijues i analizimit të strukturës shumëdimensionale të të dhënave eksperimentale në mënyrë që të minimizohet numri i objekteve që përfaqësojnë klasat diagnostike.

Nevoja për të zvogëluar numrin e objekteve në kampionin e trajnimit (precedentë diagnostikues) është një disavantazh i kësaj metode, pasi zvogëlon përfaqësimin e kampionit të trajnimit.

Algoritmet për llogaritjen e pikëve ("votim")

Parimi i funksionimit të algoritmeve të vlerësimit (ABO) është llogaritja e përparësive (pikat e ngjashmërisë) që karakterizojnë "afërsinë" e objekteve të njohura dhe referuese sipas sistemit të ansambleve të veçorive, i cili është një sistem nëngrupesh të një grupi të caktuar karakteristikash. .

Ndryshe nga të gjitha metodat e konsideruara më parë, algoritmet për llogaritjen e vlerësimeve funksionojnë me përshkrimet e objekteve në një mënyrë thelbësisht të re. Për këto algoritme, objektet ekzistojnë njëkohësisht në nënhapësira shumë të ndryshme të hapësirës së veçorive. Klasa ABO sjell idenë e përdorimit të veçorive në përfundimin e saj logjik: meqenëse nuk dihet gjithmonë se cilat kombinime të veçorive janë më informuese, në ABO shkalla e ngjashmërisë së objekteve llogaritet duke krahasuar të gjitha kombinimet e mundshme ose të caktuara të veçorive. të përfshira në përshkrimet e objekteve.

Kombinimet e përdorura të atributeve (nënhapësirave) quhen grupe mbështetëse ose grupe përshkrimesh të pjesshme të objekteve. Prezantohet koncepti i afërsisë së përgjithësuar midis objektit të njohur dhe objekteve të kampionit të trajnimit (me një klasifikim të njohur), të cilat quhen objekte referencë. Kjo afërsi përfaqësohet nga një kombinim i afërsisë së objektit të njohur me objektet e referencës të llogaritura në grupe përshkrimesh të pjesshme. Kështu, ABO është një shtrirje e metodës k fqinjët më të afërt, në të cilën afërsia e objekteve merret parasysh vetëm në një hapësirë ​​të caktuar të veçorive.

Një tjetër shtrirje e ABO është se në këto algoritme problemi i përcaktimit të ngjashmërisë dhe ndryshimit të objekteve formulohet si parametrik dhe zgjidhet faza e akordimit të ABO në kampionin e trajnimit, në të cilën vlerat optimale të futura. zgjidhen parametrat. Kriteri i cilësisë është gabimi i njohjes, dhe fjalë për fjalë gjithçka është e parametrizuar:

  • rregullat për llogaritjen e afërsisë së objekteve sipas veçorive individuale;
  • rregullat për llogaritjen e afërsisë së objekteve në nënhapësirat e veçorive;
  • shkalla e rëndësisë së një objekti të caktuar referimi si precedent diagnostik;
  • rëndësia e kontributit të çdo grupi referencë karakteristikash në vlerësimin përfundimtar të ngjashmërisë së objektit të njohur me çdo klasë diagnostike.

Parametrat e ftohësit të ajrit vendosen në formën e vlerave të pragut dhe (ose) si pesha të përbërësve të treguar.

Mundësitë teorike të ABO nuk janë të paktën jo më të ulëta se ato të çdo algoritmi tjetër të njohjes së modelit, pasi me ndihmën e ABO mund të zbatohen të gjitha operacionet e mundshme me objektet në studim.

Por, siç ndodh zakonisht, zgjatja potencial has në vështirësi të mëdha në zbatimin praktik të tyre, veçanërisht në fazën e ndërtimit (akordimit) të algoritmeve të këtij lloji.

Vështirësi të veçanta u vunë re më herët kur diskutohej metoda e k fqinjëve më të afërt, e cila mund të interpretohet si një version i cunguar i ABO. Mund të konsiderohet gjithashtu në një formë parametrike dhe ta zvogëlojë problemin në gjetjen e një metrike të ponderuar të llojit të zgjedhur. Në të njëjtën kohë, pyetjet komplekse teorike dhe problemet që lidhen me organizimin e një procesi llogaritës efikas tashmë lindin këtu për problemet me dimensione të larta.

Për ABO, nëse përpiqeni të përdorni plotësisht aftësitë e këtyre algoritmeve, këto vështirësi rriten shumëfish.

Problemet e vërejtura shpjegojnë faktin se në praktikë përdorimi i ABO për zgjidhjen e problemeve me dimensione të larta shoqërohet me futjen e çdo kufizimi dhe supozimi heuristik. Në veçanti, ekziston një shembull i përdorimit të ABO në psikodiagnostikë, në të cilin u testua një version i ABO, i cili në fakt është ekuivalent me metodën k fqinjët më të afërt.

Rregulla vendimtare Kolektive

Në fund të rishikimit të metodave të njohjes së modelit, le të ndalemi në një qasje tjetër. Këto janë të ashtuquajturat ekipe të rregullave të vendimit (CRC).

Meqenëse algoritme të ndryshme njohjeje manifestohen ndryshe në të njëjtin mostër objektesh, natyrshëm lind pyetja e sintetikës rregull vendimi, duke përdorur në mënyrë adaptive pikat e forta këto algoritme. Rregulli i vendimit sintetik përdor një skemë njohjeje me dy nivele. Në nivelin e parë, funksionojnë algoritmet e njohjes private, rezultatet e të cilave kombinohen në nivelin e dytë në bllokun e sintezës. Metodat më të zakonshme të një kombinimi të tillë bazohen në ndarjen e fushave të kompetencës së një algoritmi të veçantë. Mënyra më e thjeshtë për të gjetur fushat e kompetencës është të ndash a priori hapësirën e veçorive bazuar në konsideratat profesionale të një shkence të caktuar (për shembull, shtresimi i kampionit sipas ndonjë veçorie). Më pas, për secilën nga zonat e zgjedhura, ndërtohet algoritmi i tij i njohjes. Një metodë tjetër bazohet në përdorimin e analizave formale për të përcaktuar zonat lokale të hapësirës së veçorive si lagje të objekteve të dallueshme për të cilat është vërtetuar suksesi i çdo algoritmi të veçantë njohjeje.

Qasja më e përgjithshme për ndërtimin e një blloku sintezë i konsideron treguesit rezultues të algoritmeve të veçanta si shenjat fillestare për të ndërtuar një rregull të ri të përgjithësuar vendimi. Në këtë rast, mund të përdoren të gjitha metodat e mësipërme të drejtimeve intensive dhe zgjeruese në njohjen e modelit. Efektive për zgjidhjen e problemit të krijimit të një grupi rregullash vendimi janë algoritmet logjike të tipit "Kora" dhe algoritmet për llogaritjen e vlerësimeve (ABO), të cilat përbëjnë bazën e të ashtuquajturës qasje algjebrike, e cila ofron kërkime dhe një përshkrim konstruktiv të algoritmet e njohjes, brenda të cilave përshtaten të gjitha llojet ekzistuese të algoritmeve.

Analiza krahasuese e metodave të njohjes së modeleve

Le të krahasojmë metodat e njohjes së modelit të përshkruara më sipër dhe të vlerësojmë shkallën e përshtatshmërisë së tyre me kërkesat e formuluara në seksionin 3.3.3 për modelet SDA për sistemet e kontrollit të automatizuar adaptive. sisteme komplekse.

Për zgjidhjen e problemeve reale nga grupi i metodave të drejtimit intensiv, me vlerë praktike janë metodat parametrike dhe metodat e bazuara në sugjerime për formën e funksioneve të vendimit. Metodat parametrike formojnë bazën e metodologjisë tradicionale për ndërtimin e treguesve. Aplikimi i këtyre metodave në detyra reale lidhur me vendosjen e kufizimeve të forta në strukturën e të dhënave, të cilat çojnë në modele diagnostike lineare me vlerësime shumë të përafërta të parametrave të tyre. Kur përdor metoda të bazuara në supozime për formën e funksioneve të vendimmarrjes, studiuesi detyrohet gjithashtu t'i drejtohet modeleve lineare. Kjo është për shkak të dimensionit të lartë të hapësirës së veçorive, e cila është tipike për problemet reale, e cila, me një rritje të shkallës së funksionit të vendimmarrjes polinomiale, jep një rritje të madhe të numrit të anëtarëve të saj me një rritje problematike shoqëruese në cilësinë e njohjes. Kështu, duke projektuar zonën e aplikimit potencial të metodave të njohjes intensive për problemet reale, ne marrim një pamje që korrespondon me metodologjinë tradicionale të mirëvendosur të modeleve diagnostike lineare.

Vetitë e modeleve diagnostike lineare, në të cilat treguesi diagnostikues përfaqësohet nga një shumë e ponderuar e veçorive fillestare, janë studiuar mirë. Rezultatet e këtyre modeleve (me normalizimin e duhur) interpretohen si distanca nga objektet në studim në një hiperplan në hapësirën e veçorive ose, në mënyrë ekuivalente, si projeksione të objekteve në një vijë të drejtë në hapësirën e caktuar. Prandaj, modelet lineare janë adekuate vetëm për konfigurime të thjeshta gjeometrike të rajoneve të hapësirës së veçorive në të cilat hartohen objekte të klasave të ndryshme diagnostikuese. Me shpërndarje më komplekse, këto modele në thelb nuk mund të pasqyrojnë shumë veçori të strukturës së të dhënave eksperimentale. Në të njëjtën kohë, karakteristika të tilla mund të ofrojnë informacion të vlefshëm diagnostikues.

Në të njëjtën kohë, shfaqja në çdo problem real të strukturave të thjeshta shumëdimensionale (në veçanti, shpërndarjet normale shumëdimensionale) duhet të konsiderohet si një përjashtim dhe jo si rregull. Shpesh, klasat diagnostike formohen në bazë të kritereve komplekse të jashtme, të cilat automatikisht sjellin heterogjenitetin gjeometrik të këtyre klasave në hapësirën e veçorive. Kjo është veçanërisht e vërtetë për kriteret e "jetës" që hasen më shpesh në praktikë. Në kushte të tilla, përdorimi modele lineare rregullon vetëm modelet më "të përafërta" të informacionit eksperimental.

Përdorimi i metodave zgjeruese nuk shoqërohet me ndonjë supozim në lidhje me strukturën e informacionit eksperimental, përveç se brenda klasave të njohura duhet të ketë një ose më shumë grupe objektesh që janë disi të ngjashëm, dhe objektet e klasave të ndryshme duhet të ndryshojnë nga njëri-tjetri në disa mënyrë. Është e qartë se për çdo dimension të fundëm të kampionit të trajnimit (dhe nuk mund të jetë i ndryshëm), kjo kërkesë plotësohet gjithmonë thjesht sepse ka dallime të rastësishme midis objekteve. Masat e ngjashmërisë janë masa të ndryshme afërsia (largësia) e objekteve në hapësirën e veçorive. Kjo është arsyeja pse përdorim efektiv metodat zgjeruese të njohjes së modelit varen nga sa mirë janë përcaktuar këto masa të afërsisë, si dhe nga cilat objekte të kampionit të trajnimit (objekte me një klasifikim të njohur) luajnë rolin e precedentëve diagnostikues. Zgjidhja e suksesshme e këtyre problemeve jep një rezultat që i afrohet kufijve teorikisht të arritshëm të efikasitetit të njohjes.

Përparësitë e metodave zgjeruese të njohjes së modelit kundërshtohen, para së gjithash, nga kompleksiteti i lartë teknik i zbatimit të tyre praktik. Për hapësirat e veçorive me dimensione të larta, problemi në dukje i thjeshtë i gjetjes së çifteve të pikave më të afërta kthehet në problem serioz. Gjithashtu, shumë autorë vërejnë si problem nevojën për të mbajtur mend një numër mjaft të madh të objekteve që përfaqësojnë klasa të njohura.

Në vetvete, ky nuk është problem, por perceptohet si problem (për shembull, në metodën k fqinjët më të afërt) për arsye se kur njihet çdo objekt, ndodh një numërim i plotë i të gjitha objekteve në kampionin e trajnimit.

Prandaj, këshillohet të zbatohet modeli i sistemit të njohjes, në të cilin problemi i një numërimi të plotë të objekteve të mostrës së trajnimit gjatë njohjes hiqet, pasi kryhet vetëm një herë kur formohen imazhe të përgjithësuara të klasave të njohjes. Në vetë njohjen, objekti i identifikuar krahasohet vetëm me imazhe të përgjithësuara të klasave të njohjes, numri i të cilave është fiks dhe nuk varet aspak nga dimensioni i kampionit të trajnimit. Kjo qasje ju lejon të rritni dimensionin e kampionit të trajnimit derisa të arrihet cilësia e lartë e kërkuar e imazheve të përgjithësuara, pa frikë se kjo mund të çojë në një rritje të papranueshme të kohës së njohjes (pasi koha e njohjes në këtë model nuk varet nga dimensioni i trajnimit fare). mostra).

Problemet teorike të aplikimit të metodave të njohjes zgjeruese lidhen me problemet e kërkimit të grupeve informative të veçorive, gjetjes së metrikës optimale për matjen e ngjashmërisë dhe ndryshimit të objekteve dhe analizimit të strukturës së informacionit eksperimental. Në të njëjtën kohë, zgjidhja e suksesshme e këtyre problemeve lejon jo vetëm hartimin e algoritmeve efektive të njohjes, por edhe kalimin nga njohuritë e zgjeruara të fakteve empirike në njohuritë intensive për modelet e strukturës së tyre.

Kalimi nga njohuritë e zgjeruara në njohuritë intensive ndodh në fazën kur një algoritëm formal njohjeje tashmë është ndërtuar dhe efektiviteti i tij është demonstruar. Më pas bëhet studimi i mekanizmave me të cilët arrihet efikasiteti i fituar. Një studim i tillë, i lidhur me analizën e strukturës gjeometrike të të dhënave, mund, për shembull, të çojë në përfundimin se mjafton të zëvendësohen objektet që përfaqësojnë një ose një tjetër. klasa diagnostike, një përfaqësues tipik (prototip). Kjo është e barabartë, siç u përmend më lart, me vendosjen e një shkalle tradicionale lineare diagnostike. Është gjithashtu e mundur që mjafton të zëvendësohet çdo klasë diagnostike me disa objekte që kanë kuptim si përfaqësues tipik disa nënklasa, që është ekuivalente me ndërtimin e një tifozi të shkallëve lineare. Ka mundësi të tjera, të cilat do të diskutohen më poshtë.

Kështu, një rishikim i metodave të njohjes tregon se aktualisht është zhvilluar teorikisht linjë e tërë metoda të ndryshme të njohjes së modeleve. Literatura ofron një klasifikim të detajuar të tyre. Sidoqoftë, për shumicën e këtyre metodave, zbatimi i tyre i softuerit mungon, dhe kjo është thellësisht e natyrshme, madje mund të thuhet "e paracaktuar" nga karakteristikat e vetë metodave të njohjes. Kjo mund të gjykohet nga fakti se sisteme të tilla përmenden pak në literaturë e veçantë dhe burime të tjera informacioni.

Rrjedhimisht, çështja e zbatueshmërisë praktike të metodave të caktuara teorike të njohjes për zgjidhjen e detyra praktike me dimensione reale (d.m.th. mjaft domethënëse) të të dhënave dhe në kompjuterë realë modernë.

Rrethana e mësipërme mund të kuptohet nëse kujtojmë se kompleksiteti i modelit matematik rrit në mënyrë eksponenciale kompleksitetin e zbatimit të softuerit të sistemit dhe në të njëjtën masë zvogëlon shanset që ky sistem të funksionojë realisht. Kjo do të thotë se vetëm sistemet softuerike të bazuara në modele matematikore mjaft të thjeshta dhe "transparente" mund të zbatohen në treg. Prandaj, një zhvillues i interesuar në përsëritjen e tij produkt software, i qaset çështjes së zgjedhjes së një modeli matematikor jo thjesht nga një pikë shkencore vizion, por si pragmatist, duke marrë parasysh mundësitë e zbatimit të softuerit. Ai beson se modeli duhet të jetë sa më i thjeshtë, që do të thotë se duhet të zbatohet me kosto më të ulët dhe me cilësi më të mirë, si dhe duhet të funksionojë (të jetë praktikisht efektiv).

Në këtë drejtim, detyra e zbatimit në sistemet e njohjes së një mekanizmi për përgjithësimin e përshkrimeve të objekteve që i përkasin të njëjtës klasë, d.m.th. mekanizëm për formimin e imazheve kompakte të përgjithësuara. Është e qartë se një mekanizëm i tillë përgjithësimi do të lejojë "kompresimin" e çdo kampioni trajnimi për sa i përket dimensionit në një bazë imazhesh të përgjithësuara të njohura paraprakisht për nga dimensioni. Kjo gjithashtu do të na lejojë të vendosim dhe zgjidhim një sërë problemesh që nuk mund të formulohen as në metoda të tilla njohjeje si krahasimi me metodën prototip, metodën k fqinjët më të afërt dhe ABO.

Këto janë detyrat:

  • përcaktimi i kontributit të informacionit të veçorive në portretin e informacionit të një imazhi të përgjithësuar;
  • analiza grupore-konstruktive e imazheve të përgjithësuara;
  • përcaktimi i ngarkesës semantike të atributit;
  • analiza semantike klaster-konstruktive e veçorive;
  • një krahasim kuptimplotë i imazheve të përgjithësuara të klasës me njëra-tjetrën dhe veçorive me njëra-tjetrën (diagramet njohëse, duke përfshirë diagramet Merlin).

Metoda që bëri të mundur arritjen e zgjidhjes së këtyre problemeve dallon gjithashtu sistemin e perspektivës së bazuar në të nga sistemet e tjera, ashtu siç ndryshojnë kompajlerët nga interpretuesit, pasi për shkak të formimit të imazheve të përgjithësuara në këtë sistem perspektiv, koha e njohjes është e pavarur nga madhësia e kampionit të trajnimit. Dihet se është ekzistenca e kësaj varësie që çon në shpenzime praktikisht të papranueshme të kohës kompjuterike për njohje në metoda të tilla si metoda k fqinjët më të afërt, ABO dhe CRP në dimensione të tilla të kampionit të trajnimit, kur mund të flitet për mjaftueshëm. statistikat.

Së fundi pasqyrë e përgjithshme metodat e njohjes, ne paraqesim thelbin e sa më sipër në një tabelë përmbledhëse (Tabela 3.1), që përmban një përshkrim të shkurtër të metodave të ndryshme të njohjes së modelit në parametrat e mëposhtëm:

  • klasifikimi i metodave të njohjes;
  • fushat e aplikimit të metodave të njohjes;
  • klasifikimi i kufizimeve të metodave të njohjes.
Klasifikimi i metodave të njohjes Zona e aplikimit Kufizimet (disvantazhet)
Metodat intensive të njohjes Metodat e bazuara në vlerësimet e densitetit të shpërndarjes së vlerave të veçorive (ose ngjashmëritë dhe ndryshimet midis objekteve) Probleme me një shpërndarje të njohur, zakonisht normale, nevoja për të mbledhur statistika të mëdha Nevoja për të numëruar të gjithë grupin e trajnimit gjatë njohjes, ndjeshmëri e lartë ndaj mospërfaqësimit të grupit të trajnimit dhe objekteve
Metodat e bazuara në supozimet për klasën e funksioneve të vendimit Klasat duhet të jenë mirë të ndashme, sistemi i veçorive duhet të jetë ortonormal Forma e funksionit të vendimit duhet të njihet paraprakisht. Pamundësia për të marrë parasysh njohuritë e reja në lidhje me korrelacionet midis veçorive
Metodat Boolean Kur zgjidhni rregullat logjike të vendimit (lidhëzat), është i nevojshëm një numërim i plotë. Kompleksitet i lartë llogaritës
Metodat gjuhësore (strukturore). Problemet e dimensionit të vogël të hapësirës së veçorive Detyra e rivendosjes (përcaktimit) të gramatikës nga një grup i caktuar deklaratash (përshkrime të objekteve) është e vështirë të zyrtarizohet. Probleme teorike të pazgjidhura
Metodat e zgjeruara të njohjes Metoda e krahasimit të prototipit Problemet e dimensionit të vogël të hapësirës së veçorive Varësia e lartë e rezultateve të klasifikimit nga matjet e distancës (metrika). Pasiguria e metrikës optimale
k metoda e fqinjit më të afërt Varësia e lartë e rezultateve të klasifikimit nga matjet e distancës (metrika). Nevoja për një numërim të plotë të kampionit të trajnimit gjatë njohjes. Kompleksiteti llogaritës
Algoritme për llogaritjen e notave (votim) AVO Probleme të dimensioneve të vogla për sa i përket numrit të klasave dhe veçorive Varësia e rezultateve të klasifikimit nga matja e distancës (metrike). Nevoja për një numërim të plotë të kampionit të trajnimit gjatë njohjes. Kompleksiteti i lartë teknik i metodës
Kolektivët e Rregullave Vendimtare (CRC) Probleme të dimensioneve të vogla për sa i përket numrit të klasave dhe veçorive Kompleksiteti teknik shumë i lartë i metodës, numri i pazgjidhur i problemeve teorike, si në përcaktimin e fushave të kompetencës së metodave të veçanta, ashtu edhe në vetë metodat e veçanta

Tabela 3.1 - Tabela përmbledhëse e klasifikimit të metodave të njohjes, krahasimi i fushave të tyre të zbatimit dhe kufizimeve

Roli dhe vendi i njohjes së modelit në automatizimin e menaxhimit të sistemeve komplekse

Sistemi i automatizuar i kontrollit përbëhet nga dy pjesë kryesore: objekti i kontrollit dhe sistemi i kontrollit.

Sistemi i kontrollit kryen funksionet e mëposhtme:

  • identifikimi i gjendjes së objektit të kontrollit;
  • zhvillimi i një veprimi kontrolli bazuar në qëllimet e menaxhimit, duke marrë parasysh gjendjen e objektit të kontrollit dhe mjedisin;
  • duke siguruar një efekt kontrolli në objektin e kontrollit.

Njohja e modelit nuk është gjë tjetër veçse identifikimi i gjendjes së një objekti.

Prandaj, mundësia e përdorimit të sistemit të njohjes së modelit në fazën e identifikimit të gjendjes së objektit të kontrollit duket mjaft e dukshme dhe e natyrshme. Megjithatë, kjo mund të mos jetë e nevojshme. Prandaj, lind pyetja se në cilat raste këshillohet përdorimi i sistemit të njohjes në sistemin e kontrollit të automatizuar dhe në cilat jo.

Sipas literaturës, në shumë sisteme kontrolli të automatizuara të zhvilluara më parë dhe moderne, në nënsistemet për identifikimin e gjendjes së objektit të kontrollit dhe gjenerimin e veprimeve të kontrollit, përdoren modele matematikore përcaktuese të "numërimit të drejtpërdrejtë", të cilat në mënyrë të paqartë dhe mjaft thjesht përcaktojnë se çfarë duhet të bëni me objektin e kontrollit nëse ai ka disa parametra të jashtëm.

Në të njëjtën kohë, pyetja se si këto parametra lidhen me gjendje të caktuara të objektit të kontrollit nuk ngrihet ose zgjidhet. Ky pozicion korrespondon me këndvështrimin, i cili konsiston në faktin se marrëdhënia e tyre një me një pranohet "sipas parazgjedhjes". Prandaj, termat: "parametrat e objektit të kontrollit" dhe "gjendja e objektit të kontrollit" konsiderohen si sinonime, dhe koncepti "gjendja e objektit të kontrollit" nuk është paraqitur fare në mënyrë eksplicite. Megjithatë, është e qartë se në rast i përgjithshëm marrëdhënia ndërmjet parametrave të vëzhguar të objektit të kontrollit dhe gjendjes së tij është dinamike dhe probabiliste.

Kështu, sistemet tradicionale të kontrollit të automatizuara janë në thelb sisteme të kontrollit parametrik, d.m.th. sisteme që menaxhojnë jo gjendjet e objektit të kontrollit, por vetëm parametrat e tij të vëzhgueshëm. Vendimi për veprimin e kontrollit merret në sisteme të tilla sikur “verbërisht”, d.m.th. pa formuar një imazh holistik të objektit të kontrollit dhe mjedisit në gjendjen e tyre aktuale, si dhe pa parashikuar zhvillimin e mjedisit dhe reagimin e objektit të kontrollit ndaj veprimeve të caktuara të kontrollit mbi të, duke vepruar njëkohësisht me ndikimin e parashikuar të mjedisit. .

Nga pozicionet e zhvilluara në këtë punim, termi “vendimmarrje” në të kuptuarit modern vështirë se mund të jetë plotësisht i zbatueshëm për sistemet tradicionale të kontrollit të automatizuar. Fakti është se "vendimmarrja", të paktën, përfshin një vizion holistik të një objekti në mjedis, dhe jo vetëm në gjendjen e tij aktuale, por edhe në dinamikë dhe në ndërveprim si me njëri-tjetrin ashtu edhe me sistemin e kontrollit. përfshin konsiderata të ndryshme opsionet alternative zhvillimi i gjithë këtij sistemi, si dhe ngushtimi i shumëllojshmërisë (reduktimit) të këtyre alternativave bazuar në disa kritere të synuara. Asnjë nga këto, padyshim, nuk është në ACS tradicionale, ose është, por në një formë të thjeshtuar.

Sigurisht, metodë tradicionaleështë adekuat dhe zbatimi i tij është mjaft korrekt dhe i justifikuar në rastet kur objekti i kontrollit është me të vërtetë një sistem i qëndrueshëm dhe i përcaktuar fort, dhe ndikimi i mjedisit në të mund të neglizhohet.

Megjithatë, në raste të tjera kjo metodë është e paefektshme.

Nëse objekti i kontrollit është dinamik, atëherë modelet që qëndrojnë në bazë të algoritmeve të tij të kontrollit bëhen shpejt të papërshtatshëm, pasi marrëdhënia midis parametrave hyrës dhe dalës ndryshon, si dhe vetë grupi i parametrave thelbësorë. Në thelb, kjo do të thotë që sistemet tradicionale të automatizuara të kontrollit janë në gjendje të kontrollojnë gjendjen e objektit të kontrollit vetëm afër pikës së ekuilibrit me anë të veprimeve të dobëta të kontrollit mbi të, d.m.th. me metodën e perturbimeve të vogla. Larg gjendjes së ekuilibrit, nga këndvështrimi tradicional, sjellja e objektit të kontrollit duket e paparashikueshme dhe e pakontrollueshme.

Nëse nuk ka një lidhje të qartë midis parametrave hyrës dhe dalës të objektit të kontrollit (d.m.th., midis parametrave hyrës dhe gjendjes së objektit), me fjalë të tjera, nëse kjo marrëdhënie ka një natyrë të theksuar probabiliste, atëherë modelet përcaktuese, në për të cilin supozohet se rezultati i matjes së një parametri të caktuar është thjesht numër, fillimisht i pazbatueshëm. Për më tepër, forma e kësaj marrëdhënieje thjesht mund të jetë e panjohur, dhe atëherë është e nevojshme të vazhdohet nga supozimi më i përgjithshëm: se është probabilist, ose nuk përcaktohet fare.

Sistemi i automatizuar i kontrollit i ndërtuar mbi parimet tradicionale, mund të funksionojë vetëm në bazë të parametrave, modelet e marrëdhënieve të të cilave tashmë njihen, studiohen dhe pasqyrohen në modelin matematikor, në këtë studim u vendos detyra të zhvilloheshin metoda të tilla për projektimin e sistemeve të kontrollit të automatizuar që do të lejojnë krijimin e sistemeve që mund të identifikojë grupin e parametrave më domethënës dhe të përcaktojë natyrën e marrëdhënieve midis tyre dhe gjendjeve të objektit të kontrollit.

Në këtë rast, është e nevojshme të aplikohen metoda më të zhvilluara dhe adekuate të matjes për situatën reale:

  • klasifikimi ose njohja e modelit (të mësuarit bazuar në një kampion trajnimi, përshtatshmëria e algoritmeve të njohjes, përshtatshmëria e grupeve të klasave dhe parametrave të studiuar, përzgjedhja e parametrave më domethënës dhe zvogëlimi i dimensionit të përshkrimit duke ruajtur një tepricë të caktuar, etj.);
  • matjet statistikore, kur rezultati i matjes së një parametri të caktuar nuk është një numër i vetëm, por një shpërndarje probabiliteti: një ndryshim në një variabël statistikor nuk do të thotë një ndryshim në vlerën e tij në vetvete, por një ndryshim në karakteristikat e shpërndarjes së probabilitetit të vlerat e saj.

Si rezultat, sistemet e automatizuara të kontrollit të bazuara në qasjen tradicionale përcaktuese praktikisht nuk funksionojnë me objekte komplekse dinamike multi-parametrike të kontrollit të dobët përcaktues, siç janë, për shembull, sistemet makro dhe mikro-socio-ekonomike në një ekonomi dinamike të " periudha e tranzicionit”, elita hierarkike dhe grupet etnike, shoqëria dhe elektorati, fiziologjia dhe psikika njerëzore, ekosistemet natyrore dhe artificiale dhe shumë të tjera.

Është shumë domethënëse që në mesin e viteve '80, shkolla e I.Prigozhin zhvilloi një qasje, sipas së cilës në zhvillimin e çdo sistemi (përfshirë një person), alternohen periudhat gjatë të cilave sistemi sillet ose si "kryesisht determinist". ose si "kryesisht e rastësishme". Natyrisht, një sistem i vërtetë kontrolli duhet të menaxhojë në mënyrë të qëndrueshme objektin e kontrollit jo vetëm në seksionet "përcaktuese" të historisë së tij, por edhe në pikat kur sjellja e tij e mëtejshme bëhet shumë e pasigurt. Vetëm kjo do të thotë se është e nevojshme të zhvillohen qasje për menaxhimin e sistemeve në sjelljen e të cilave ekziston një element i madh rastësie (ose ajo që aktualisht përshkruhet matematikisht si "rastësia").

Prandaj, përbërja e sistemeve premtuese të kontrollit të automatizuar që sigurojnë kontrollin e sistemeve komplekse dinamike me shumë parametra me përcaktimin e dobët, si lidhje thelbësore funksionale, me sa duket do të përfshijë nënsisteme për identifikimin dhe parashikimin e gjendjeve të mjedisit dhe objektit të kontrollit, bazuar në metoda. inteligjence artificiale(kryesisht njohja e modelit), metodat e mbështetjes së vendimeve dhe teoria e informacionit.

Le të shqyrtojmë shkurtimisht çështjen e përdorimit të sistemeve të njohjes së imazhit për të marrë një vendim mbi një veprim kontrolli (kjo çështje do të diskutohet më në detaje më vonë, pasi është ajo kryesore për këtë punë). Nëse marrim objektivin dhe gjendjet e tjera të objektit të kontrollit si klasa njohjeje, dhe faktorët që ndikojnë në të si shenja, atëherë një masë e marrëdhënies midis faktorëve dhe gjendjeve mund të formohet në modelin e njohjes së modelit. Kjo lejon marrjen e informacionit në lidhje me faktorët që kontribuojnë ose pengojnë kalimin e tij në këtë gjendje, bazuar në një gjendje të caktuar të objektit të kontrollit, dhe, mbi këtë bazë, të zhvillohet një vendim për veprimin e kontrollit.

Faktorët mund të ndahen në grupet e mëposhtme:

  • karakterizimi i parahistorisë së objektit të kontrollit;
  • karakterizimi i gjendjes aktuale të objektit të kontrollit;
  • faktorët e mjedisit;
  • faktorët teknologjikë (të menaxhuar).

Kështu, sistemet e njohjes së imazhit mund të përdoren si pjesë e një sistemi kontrolli të automatizuar: në nënsistemet për identifikimin e gjendjes së një objekti kontrolli dhe gjenerimin e veprimeve të kontrollit.

Kjo është e dobishme kur objekti i kontrollit është një sistem kompleks.

Marrja e një vendimi për veprimin e kontrollit në sistemin e automatizuar të kontrollit

Zgjidhja e problemit të sintezës së sistemeve të kontrollit të automatizuar adaptive nga sisteme komplekse është shqyrtuar në këtë punim, duke marrë parasysh analogjitë e shumta dhe të thella midis metodave të njohjes së modeleve dhe vendimmarrjes.

Nga njëra anë, detyra e njohjes së modelit është një vendim në lidhje me përkatësinë e një objekti të njohur në një klasë të caktuar njohjeje.

Nga ana tjetër, autorët propozojnë që problemi i vendimmarrjes të konsiderohet si një problem i kundërt i dekodimit ose një problem inversi i njohjes së modelit (shih seksionin 2.2.2).

Përbashkësia e ideve bazë që qëndrojnë në themel të metodave të njohjes së modeleve dhe marrjes së vendimeve bëhet veçanërisht e dukshme kur i konsiderojmë ato nga këndvështrimi i teorisë së informacionit.

Shumëllojshmëri detyrash vendimmarrëse

Vendimmarrja si realizim i një qëllimi

Përkufizimi: marrja e një vendimi ("zgjedhja") është një veprim mbi një grup alternativash, si rezultat i të cilit grupi origjinal i alternativave ngushtohet, d.m.th. është reduktuar.

Zgjedhja është një veprim që i jep qëllimshmëri të gjithë veprimtarisë. Është përmes akteve të zgjedhjes që realizohet nënshtrimi i të gjithë veprimtarisë ndaj një qëllimi specifik ose një grupi qëllimesh të ndërlidhura.

Pra, në mënyrë që akti i zgjedhjes të bëhet i mundur, është e nevojshme si më poshtë:

  • gjenerimi ose zbulimi i një grupi alternativash mbi të cilat mund të bëhet një zgjedhje;
  • përcaktimi i qëllimeve për arritjen e të cilave bëhet zgjedhja;
  • zhvillimi dhe aplikimi i një metode për krahasimin e alternativave me njëra-tjetrën, d.m.th. përcaktimi i vlerësimit të preferencës për secilën alternativë sipas kritereve të caktuara, duke lejuar vlerësimin indirekt se si çdo alternativë përmbush qëllimin.

Puna moderne në fushën e mbështetjes së vendimeve ka zbuluar një situatë karakteristike, e cila konsiston në faktin se një formalizimi i plotë i gjetjes së zgjidhjes më të mirë (në një kuptim të caktuar) është i mundur vetëm për të studiuar mirë, relativisht. detyra të thjeshta, ndërsa në praktikë ka më shpesh probleme të strukturuara dobët për të cilat nuk janë zhvilluar algoritme plotësisht të formalizuara (përveç numërimit shterues dhe provave dhe gabimeve). Megjithatë, profesionistë me përvojë, kompetentë dhe të aftë shpesh bëjnë zgjedhje që rezultojnë mjaft të mira. Kjo është arsyeja pse trend modern Praktika e vendimmarrjes në situata natyrore konsiston në ndërthurjen e aftësisë së një personi për të zgjidhur problemet e paformalizuara me mundësitë metodat formale Dhe simulimi kompjuterik: sisteme ndërvepruese të mbështetjes së vendimeve, sisteme ekspertësh, sisteme kontrolli të automatizuara adaptive njeri-makinë, rrjetet nervore dhe sistemet njohëse.

Vendimmarrja si heqje e pasigurisë (qasja e informacionit)

Procesi i marrjes së informacionit mund të konsiderohet si një ulje e pasigurisë si rezultat i marrjes së një sinjali, dhe sasia e informacionit si një masë sasiore e shkallës së heqjes së pasigurisë.

Por si rezultat i zgjedhjes së një nëngrupi alternativash nga grupi, d.m.th. si rezultat i marrjes së një vendimi ndodh e njëjta gjë (ulja e pasigurisë). Kjo do të thotë se çdo zgjedhje, çdo vendim gjeneron një sasi të caktuar informacioni, dhe për këtë arsye mund të përshkruhet në termat e teorisë së informacionit.

Klasifikimi i problemeve të vendimmarrjes

Shumëllojshmëria e detyrave vendimmarrëse është për faktin se çdo komponent i situatës në të cilën kryhet vendimmarrja mund të zbatohet në opsione cilësisht të ndryshme.

Këtu janë vetëm disa nga këto opsione:

  • grupi i alternativave, nga njëra anë, mund të jetë i fundëm, i numërueshëm ose i vazhdueshëm, dhe nga ana tjetër, mund të jetë i mbyllur (pra i njohur plotësisht) ose i hapur (përfshirë elementë të panjohur);
  • alternativat mund të vlerësohen sipas një ose më shumë kritereve, të cilat, nga ana tjetër, mund të jenë sasiore ose cilësore;
  • mënyra e përzgjedhjes mund të jetë e vetme (një herë), ose e shumëfishtë, e përsëritur, duke përfshirë reagime sipas rezultateve të zgjedhjes, d.m.th. duke lejuar mësimin e algoritmeve të vendimmarrjes, duke marrë parasysh pasojat e zgjedhjeve të mëparshme;
  • pasojat e zgjedhjes së secilës alternativë mund të njihen me saktësi paraprakisht (zgjedhja nën siguri), kanë natyrë probabiliste kur probabilitetet janë të njohura. rezultatet e mundshme pasi të jetë bërë një zgjedhje (zgjedhja nën rrezik) ose të ketë një rezultat të paqartë me probabilitete të panjohura (zgjedhje nën pasiguri);
  • përgjegjësia për zgjedhjen mund të mungojë, të jetë individuale ose grupore;
  • shkalla e konsistencës së qëllimeve në një zgjedhje grupore mund të ndryshojë nga koincidenca e plotë e interesave të palëve (zgjedhja bashkëpunuese) në të kundërtën e tyre (zgjedhja në situatë konflikti). Opsionet e ndërmjetme janë gjithashtu të mundshme: një kompromis, një koalicion, një konflikt në rritje ose në zbehje.

Kombinime të ndryshme të këtyre opsioneve çojnë në probleme të shumta vendimmarrëse që janë studiuar në shkallë të ndryshme.

Gjuhët për përshkrimin e metodave të vendimmarrjes

Për të njëjtin fenomen mund të flitet në gjuhë të ndryshme të shkallëve të ndryshme të përgjithësisë dhe përshtatshmërisë. Deri më sot, ka pasur tre gjuhë kryesore për të përshkruar zgjedhjen.

Më e thjeshta, më e zhvilluara dhe më e njohura është gjuha kriter.

Gjuha e kritereve

Emri i kësaj gjuhe lidhet me supozimin bazë se çdo alternativë individuale mund të vlerësohet me një numër specifik (një), pas së cilës krahasimi i alternativave reduktohet në një krahasim të numrave të tyre përkatës.

Le të jetë, për shembull, (X) një grup alternativash dhe x një alternativë e caktuar që i përket kësaj bashkësie: x∈X. Atëherë konsiderohet se për të gjithë x mund të jepet funksioni q(x), i cili quhet kriter (kriteri i cilësisë, funksion objektiv, funksioni i preferencës, funksioni i dobisë etj.), i cili ka vetinë që nëse alternativa x 1 është e preferueshme për x 2 (shënohet: x 1 > x 2), atëherë q (x 1) > q (x 2).

Në këtë rast, zgjedhja reduktohet në gjetjen e një alternative me vlerën më të lartë të funksionit të kriterit.

Sidoqoftë, në praktikë, përdorimi i vetëm një kriteri për krahasimin e shkallës së preferencës së alternativave rezulton të jetë një thjeshtësim i pajustifikuar, pasi një shqyrtim më i detajuar i alternativave çon në nevojën për t'i vlerësuar ato jo sipas një, por sipas shumë. kritere që mund të jenë të një natyre të ndryshme dhe cilësisht të ndryshme nga njëra-tjetra.

Për shembull, kur zgjidhni llojin më të pranueshëm të avionit për pasagjerët dhe organizatën operuese lloje të caktuara shtigjet krahasohen njëkohësisht sipas shumë grupeve të kritereve: teknike, teknologjike, ekonomike, sociale, ergonomike etj.

Problemet me shumë kritere nuk kanë një zgjidhje unike të përgjithshme. Prandaj, propozohen shumë mënyra për t'i dhënë një problemi me shumë kritere një formë të veçantë që lejon një unik vendim të përbashkët. Natyrisht, këto zgjidhje janë përgjithësisht të ndryshme për metoda të ndryshme. Prandaj, ndoshta gjëja kryesore në zgjidhjen e një problemi me shumë kritere është justifikimi i këtij lloji të formulimit të tij.

Përdoren opsione të ndryshme për thjeshtimin e problemit të përzgjedhjes me shumë kritere. Le të rendisim disa prej tyre.

  1. Maksimizimi i kushtëzuar (nuk gjendet ekstremi global i kriterit integral, por ekstremi lokal i kriterit kryesor).
  2. Kërkoni një alternativë me vetitë e dhëna.
  3. Gjetja e grupit Pareto.
  4. Reduktimi i një problemi me shumë kritere në një me një kriter duke futur një kriter integral.

Le të shqyrtojmë më në detaje formulimin formal të metodës së reduktimit të një problemi me shumë kritere në një me një kriter.

Ne prezantojmë kriterin integral q 0 (x) si një funksion skalar të argumentit vektor:

q 0 (x) = q 0 ((q 1 (x), q 2 (x), ..., q n (x)).

Kriteri integral bën të mundur renditjen e alternativave me q 0, duke nxjerrë në pah më të mirën (në kuptimin e këtij kriteri). Forma e funksionit q 0 përcaktohet nga sa konkretisht e imagjinojmë kontributin e secilit kriter në kriterin integral. Zakonisht përdoren funksione shtesë dhe shumëzuese:

q 0 = ∑a i ⋅q i /s i

1 - q 0 = ∏(1 - b i ⋅q i /s i)

Koeficientët që jap:

  1. Padimensioni ose një dimension i vetëm i numrit a i ⋅q i /s i (kritere të ndryshme të veçanta mund të kenë dimensione të ndryshme, dhe atëherë është e pamundur të kryhen veprime aritmetike mbi to dhe t'i reduktosh në një kriter integral).
  2. Normalizimi, d.m.th. parashikimi i kushtit: b i ⋅q i /s i<1.

Koeficientët a i dhe b i pasqyrojnë kontributin relativ të kritereve të veçanta q i në kriterin integral.

Pra, në një mjedis me shumë kritere, problemi i marrjes së një vendimi për zgjedhjen e njërës prej alternativave reduktohet në maksimizimin e kriterit integral:

x * = arg max(q 0 (q 1 (x), q 2 (x), ..., q n (x)))

Problemi kryesor në formulimin me shumë kritere të problemit të vendimmarrjes është se është e nevojshme të gjendet një formë e tillë analitike e koeficientëve a i dhe b i, e cila do të siguronte vetitë e mëposhtme të modelit:

  • një shkallë e lartë e përshtatshmërisë së fushës lëndore dhe këndvështrimit të ekspertëve;
  • vështirësi minimale llogaritëse në maksimizimin e kriterit integral, d.m.th. llogaritja e tij për alternativa të ndryshme;
  • qëndrueshmëria e rezultateve të maksimizimit të kriterit integral nga perturbimet e vogla të të dhënave fillestare.
  • Stabiliteti i zgjidhjes do të thotë që një ndryshim i vogël në të dhënat fillestare duhet të çojë në një ndryshim të vogël në vlerën e kriterit integral dhe, në përputhje me rrethanat, në një ndryshim të vogël në vendimin që merret. Kështu, nëse të dhënat fillestare janë praktikisht të njëjta, atëherë vendimi duhet të merret ose i njëjtë ose shumë afër.

Gjuha sekuenciale e përzgjedhjes binare

Gjuha e marrëdhënieve binare është një përgjithësim i gjuhës shumëkriterore dhe bazohet në faktin se kur vlerësojmë ndonjë alternativë, ky vlerësim është gjithmonë relativ, d.m.th. në mënyrë eksplicite ose më shpesh në mënyrë implicite, alternativa të tjera nga grupi në studim ose nga popullata e përgjithshme përdoren si bazë ose kornizë referimi për krahasim. Mendimi njerëzor bazohet në kërkimin dhe analizën e të kundërtave (ndërtimeve), kështu që është gjithmonë më e lehtë për ne të zgjedhim një nga dy opsionet e kundërta sesa një opsion nga një grup i madh dhe në asnjë mënyrë i çrregullt.

Kështu, supozimet kryesore të kësaj gjuhe zbresin në sa vijon:

  • nuk vlerësohet një alternativë e vetme, d.m.th. funksioni i kriterit nuk është futur;
  • për çdo palë alternativa, mund të përcaktohet në një farë mënyre se njëra prej tyre është e preferueshme nga tjetra, ose se janë ekuivalente ose të pakrahasueshme;
  • relacioni i preferencës në asnjë çift alternativash nuk varet nga alternativat e tjera të paraqitura për zgjedhje.

Ka mënyra të ndryshme për të specifikuar marrëdhëniet binare: direkte, matricë, duke përdorur grafikët e preferencës, metodën e seksioneve, etj.

Marrëdhëniet ndërmjet alternativave të një çifti shprehen përmes koncepteve të ekuivalencës, rendit dhe mbizotërimit.

Funksionet e përgjithësuara të gjuhës së zgjedhur

Gjuha e funksioneve të zgjedhjes bazohet në teorinë e grupeve dhe lejon që dikush të operojë me hartëzimin e grupeve me nëngrupet e tyre që korrespondojnë me zgjedhje të ndryshme pa pasur nevojë të numërohen elementë. Kjo gjuhë është shumë e përgjithshme dhe potencialisht lejon që të përshkruhet çdo zgjedhje. Sidoqoftë, aparati matematikor i funksioneve të zgjedhjes së përgjithësuar aktualisht është duke u zhvilluar dhe testuar vetëm mbi problemet që tashmë janë zgjidhur duke përdorur qasje kritere ose binare.

zgjedhja e grupit

Le të ketë një grup njerëzish që kanë të drejtë të marrin pjesë në vendimmarrje kolektive. Supozoni se ky grup po shqyrton disa alternativa dhe secili anëtar i grupit bën zgjedhjen e tij. Detyra është të zhvillohet një zgjidhje që në një mënyrë të caktuar koordinon zgjedhjet individuale dhe në një farë kuptimi shpreh "mendimin e përgjithshëm" të grupit, d.m.th. merret si zgjedhje në grup.

Natyrisht, vendime të ndryshme në grup do të korrespondojnë me parime të ndryshme për koordinimin e vendimeve individuale.

Rregullat për bashkërendimin e vendimeve individuale në një zgjedhje grupore quhen rregullat e votimit. Më i zakonshmi është "rregulli i shumicës", në të cilin vendimi në grup merret nga alternativa që merr më shumë vota.

Duhet të kuptohet se një vendim i tillë pasqyron vetëm mbizotërimin e këndvështrimeve të ndryshme në grup, dhe jo një opsion vërtet optimal, për të cilin askush nuk mund të votojë fare. “E vërteta nuk përcaktohet me votim”.

Përveç kësaj, ekzistojnë të ashtuquajturat "paradokse të votimit", më i famshmi prej të cilëve është paradoksi i Arrow.

Këto paradokse mund të çojnë, dhe ndonjëherë çojnë, në karakteristika shumë të pakëndshme të procedurës së votimit: për shembull, ka raste kur grupi nuk mund të marrë fare një vendim të vetëm (nuk ka kuorum ose secili voton për opsionin e tij unik, etj. .), dhe nganjëherë (në votimin shumëfazor) pakica mund të imponojë vullnetin e saj mbi shumicën.

Zgjedhja nën pasiguri

Siguria është një rast i veçantë i pasigurisë, përkatësisht: është një pasiguri afër zeros.

Në teorinë moderne të zgjedhjes, besohet se ekzistojnë tre lloje kryesore të pasigurisë në problemet e vendimmarrjes:

  1. Pasiguria informative (statistikore) e të dhënave fillestare për vendimmarrje.
  2. Pasiguria e pasojave të vendimmarrjes (zgjedhja).
  3. Paqartësi në përshkrimin e komponentëve të procesit të vendimmarrjes.

Le t'i konsiderojmë ato me radhë.

Pasiguria informative (statistikore) në të dhënat fillestare

Të dhënat e marra për fushën lëndore nuk mund të konsiderohen absolutisht të sakta. Për më tepër, është e qartë se këto të dhëna janë me interes për ne jo në vetvete, por vetëm si sinjale që, ndoshta, mbajnë informacione të caktuara për atë që ne jemi të interesuar vërtet. Pra, është më realiste të konsiderojmë se kemi të bëjmë me të dhëna jo vetëm të zhurmshme dhe të pasakta, por edhe të tërthorta, dhe mundësisht të paplota. Për më tepër, këto të dhëna nuk kanë të bëjnë me të gjithë popullsinë (të përgjithshme) në studim, por vetëm një nëngrup të caktuar të saj, për të cilin ne kemi mundur të mbledhim të dhëna, por në të njëjtën kohë duam të nxjerrim përfundime për të gjithë popullsinë, dhe duam të dimë gjithashtu shkallën e besueshmërisë së këtyre përfundimeve.

Në këto kushte përdoret teoria e vendimeve statistikore.

Ekzistojnë dy burime kryesore të pasigurisë në këtë teori. Së pari, nuk dihet se çfarë shpërndarjeje i binden të dhënat origjinale. Së dyti, nuk dihet se çfarë shpërndarje ka grupi (popullsia e përgjithshme) për të cilën duam të nxjerrim përfundime nga nëngrupi i tij që formon të dhënat fillestare.

Procedurat statistikore janë procedurat e vendimmarrjes që heqin të dyja këto lloje të pasigurisë.

Duhet të theksohet se ka një sërë arsyesh që çojnë në aplikimin e gabuar të metodave statistikore:

  • konkluzionet statistikore, si çdo tjetër, kanë gjithmonë njëfarë besueshmërie ose siguri të caktuar. Por, ndryshe nga shumë raste të tjera, besueshmëria e gjetjeve statistikore dihet dhe përcaktohet në rrjedhën e hulumtimit statistikor;
  • cilësia e zgjidhjes së përftuar si rezultat i aplikimit të procedurës statistikore varet nga cilësia e të dhënave fillestare;
  • të dhënat që nuk kanë natyrë statistikore nuk duhet t'i nënshtrohen përpunimit statistikor;
  • është e nevojshme të përdoren procedura statistikore që korrespondojnë me nivelin e informacionit apriori për popullsinë në studim (për shembull, nuk duhet të aplikoni metoda të analizës së variancës për të dhënat jo-gausiane). Nëse shpërndarja e të dhënave origjinale është e panjohur, atëherë duhet ose të vendoset, ose të përdoren disa metoda të ndryshme dhe të krahasohen rezultatet. Nëse ato janë shumë të ndryshme, kjo tregon moszbatueshmërinë e disa prej procedurave të përdorura.

Pasiguria e Pasojave

Kur pasojat e zgjedhjes së një ose një tjetër alternative përcaktohen në mënyrë unike nga vetë alternativa, atëherë ne nuk mund të bëjmë dallimin midis një alternative dhe pasojave të saj, duke e marrë të mirëqenë se duke zgjedhur një alternativë, ne në fakt zgjedhim pasojat e saj.

Sidoqoftë, në praktikën reale, shpesh duhet të përballemi me një situatë më komplekse, kur zgjedhja e një ose një tjetër alternativë përcakton në mënyrë të paqartë pasojat e zgjedhjes së bërë.

Në rastin e një grupi diskrete alternativash dhe rezultatesh sipas zgjedhjes së tyre, me kusht që grupi i rezultateve të mundshme të jetë i përbashkët për të gjitha alternativat, mund të supozojmë se alternativat e ndryshme ndryshojnë nga njëra-tjetra në shpërndarjen e probabiliteteve të rezultateve. Këto shpërndarje probabiliteti, në rastin e përgjithshëm, mund të varen nga rezultatet e zgjedhjes së alternativave dhe nga rezultatet që kanë ndodhur në të vërtetë si rezultat i kësaj. Në rastin më të thjeshtë, rezultatet janë po aq të mundshme. Rezultatet në vetvete zakonisht kanë kuptimin e fitimeve ose humbjeve dhe kuantifikohen.

Nëse rezultatet janë të barabarta për të gjitha alternativat, atëherë nuk ka asgjë për të zgjedhur. Nëse ato janë të ndryshme, atëherë alternativat mund të krahasohen duke futur disa vlerësime sasiore për to. Shumëllojshmëria e problemeve në teorinë e lojës shoqërohet me një zgjedhje të ndryshme të karakteristikave numerike të humbjeve dhe fitimeve si rezultat i zgjedhjes së alternativave, shkallë të ndryshme konflikti midis palëve që zgjedhin alternativat, etj.

Konsideroni këtë lloj pasigurie si pasiguri të paqartë

Çdo problem i zgjedhjes është një synim ngushtim i grupit të alternativave. Si përshkrimi formal i alternativave (vetë lista e tyre, lista e atributeve ose parametrave të tyre), ashtu edhe përshkrimi i rregullave për krahasimin e tyre (kriteret, marrëdhëniet) jepen gjithmonë në terma të njërës ose tjetrës shkallë matëse (edhe kur ai që a kjo nuk e di për këtë).

Dihet që të gjitha shkallët janë të paqarta, por në shkallë të ndryshme. Termi “turbullim” i referohet vetive të peshores, e cila konsiston në faktin se është gjithmonë e mundur të paraqiten dy alternativa që janë të dallueshme, d.m.th. të ndryshme në një shkallë dhe të padallueshme, d.m.th. janë identike, në tjetrën - më të paqarta. Sa më pak gradime në një shkallë të caktuar, aq më e paqartë është.

Kështu, ne mund t'i shohim qartë alternativat dhe në të njëjtën kohë t'i klasifikojmë ato në mënyrë të paqartë, d.m.th. të jenë të paqarta se cilat klasa i përkasin.

Tashmë në punën e tyre të parë mbi marrjen e vendimeve në një situatë fuzzy, Bellman dhe Zadeh parashtruan idenë që të dy qëllimet dhe kufizimet duhet të përfaqësohen si grupe fuzzy (fuzzy) në një grup alternativash.

Mbi disa kufizime të qasjes së optimizimit

Në të gjitha problemet e përzgjedhjes dhe metodat e vendimmarrjes të konsideruara më sipër, problemi ishte gjetja e më të mirëve në grupin fillestar në kushte të dhëna, d.m.th. alternativa optimale në një kuptim të caktuar.

Ideja e optimizmit është ideja qendrore e kibernetikës dhe ka hyrë fort në praktikën e projektimit dhe funksionimit të sistemeve teknike. Në të njëjtën kohë, kjo ide duhet të trajtohet me kujdes kur përpiqemi ta transferojmë atë në fushën e menaxhimit të sistemeve komplekse, të mëdha dhe të përcaktuara dobët, siç janë, për shembull, sistemet socio-ekonomike.

Ka arsye të mira për këtë përfundim. Le të shqyrtojmë disa prej tyre:

  1. Zgjidhja optimale shpesh rezulton të jetë e paqëndrueshme, d.m.th. ndryshime të vogla në kushtet e problemit, të dhënat hyrëse ose kufizimet mund të çojnë në zgjedhjen e alternativave dukshëm të ndryshme.
  2. Modelet e optimizimit zhvillohen vetëm për klasa të ngushta detyrash mjaft të thjeshta që jo gjithmonë pasqyrojnë në mënyrë adekuate dhe sistematike objektet e kontrollit real. Më shpesh, metodat e optimizimit bëjnë të mundur optimizimin e vetëm nënsistemeve mjaft të thjeshta dhe të përshkruara mirë zyrtarisht të disa sistemeve të mëdha dhe komplekse, d.m.th. lejojnë vetëm optimizimin lokal. Megjithatë, nëse çdo nënsistem i ndonjë sistemi të madh funksionon në mënyrë optimale, kjo nuk do të thotë aspak se sistemi në tërësi do të funksionojë gjithashtu në mënyrë optimale. Prandaj, optimizimi i një nënsistemi nuk çon domosdoshmërisht në sjelljen e tij, e cila kërkohet prej tij gjatë optimizimit të sistemit në tërësi. Për më tepër, ndonjëherë optimizimi lokal mund të çojë në pasoja negative për sistemin në tërësi. Prandaj, kur optimizoni nënsistemet dhe sistemin në tërësi, është e nevojshme të përcaktohet pema e qëllimeve dhe nënqëllimeve dhe përparësia e tyre.
  3. Shpesh, maksimizimi i kriterit të optimizimit sipas ndonjë modeli matematikor konsiderohet të jetë qëllimi i optimizimit, por në realitet qëllimi është optimizimi i objektit të kontrollit. Kriteret e optimizimit dhe modelet matematikore lidhen gjithmonë me qëllimin vetëm në mënyrë indirekte, d.m.th. pak a shumë adekuate, por gjithmonë e përafërt.

Kështu, ideja e optimizmit, e cila është jashtëzakonisht e frytshme për sistemet që i nënshtrohen formalizimit adekuat matematikor, duhet të transferohet në sisteme komplekse me kujdes. Natyrisht, modelet matematikore që ndonjëherë mund të propozohen për sisteme të tilla mund të optimizohen. Megjithatë, duhet mbajtur gjithmonë parasysh thjeshtimi i fortë i këtyre modeleve, i cili në rastin e sistemeve komplekse nuk mund të neglizhohet më, si dhe fakti që shkalla e përshtatshmërisë së këtyre modeleve në rastin e sistemeve komplekse është në të vërtetë e panjohur. . Prandaj, nuk dihet se çfarë rëndësie thjesht praktike ka ky optimizim. Prakticiteti i lartë i optimizimit në sistemet teknike nuk duhet të krijojë iluzionin se do të jetë po aq efektiv në optimizimin e sistemeve komplekse. Modelimi matematikor kuptimplotë i sistemeve komplekse është shumë i vështirë, i përafërt dhe i pasaktë. Sa më kompleks të jetë sistemi, aq më i kujdesshëm duhet të jetë ideja e optimizimit të tij.

Prandaj, kur zhvillojnë metoda kontrolli për sisteme komplekse, të mëdha, të përcaktuara dobët, autorët e konsiderojnë gjënë kryesore jo vetëm optimalitetin e qasjes së zgjedhur nga një këndvështrim matematikor formal, por edhe përshtatshmërinë e tij me qëllimin dhe vetë natyrën e objekt kontrolli.

Metodat e përzgjedhjes së ekspertëve

Në studimin e sistemeve komplekse, shpesh lindin probleme që, për arsye të ndryshme, nuk mund të shtrohen dhe zgjidhen në mënyrë rigoroze duke përdorur aparatin matematikor të zhvilluar aktualisht. Në këto raste, përdoren shërbimet e ekspertëve (analistët e sistemit), përvoja dhe intuita e të cilëve ndihmojnë në uljen e kompleksitetit të problemit.

Megjithatë, duhet të kihet parasysh se vetë ekspertët janë sisteme shumë komplekse dhe aktivitetet e tyre varen edhe nga shumë kushte të jashtme dhe të brendshme. Prandaj, në metodat e organizimit të vlerësimeve të ekspertëve, shumë vëmendje i kushtohet krijimit të kushteve të favorshme të jashtme dhe psikologjike për punën e ekspertëve.

Faktorët e mëposhtëm ndikojnë në punën e një eksperti:

  • përgjegjësia për përdorimin e rezultateve të ekzaminimit;
  • duke ditur që ekspertë të tjerë janë të përfshirë;
  • disponueshmëria e kontaktit të informacionit ndërmjet ekspertëve;
  • marrëdhëniet ndërpersonale të ekspertëve (nëse ka kontakt informacioni ndërmjet tyre);
  • interesi personal i ekspertit në rezultatet e vlerësimit;
  • cilësitë personale të ekspertëve (vetëvlerësimi, konformiteti, vullneti, etj.)

Ndërveprimi ndërmjet ekspertëve mund të stimulojë ose pengojë aktivitetin e tyre. Prandaj, në raste të ndryshme përdoren metoda të ndryshme ekzaminimi, të cilat ndryshojnë në natyrën e ndërveprimit të ekspertëve me njëri-tjetrin: anketa dhe pyetësorë anonime dhe të hapura, takime, diskutime, lojëra biznesi, stuhi mendimesh etj.

Ekzistojnë metoda të ndryshme të përpunimit matematikor të mendimeve të ekspertëve. Ekspertëve u kërkohet të vlerësojnë alternativa të ndryshme ose me një ose me një sistem treguesish. Përveç kësaj, atyre u kërkohet të vlerësojnë shkallën e rëndësisë së secilit tregues ("peshën" ose "kontributin" e tij). Vetë ekspertëve u caktohet gjithashtu një nivel kompetence që korrespondon me kontributin e secilit prej tyre në opinionin që rezulton nga grupi.

Një metodë e zhvilluar e punës me ekspertë është metoda "Delphi". Ideja kryesore e kësaj metode është që kritika dhe argumentimi të kenë një efekt të dobishëm te eksperti, nëse vetëvlerësimi i tij nuk cenohet dhe sigurohen kushte që përjashtojnë konfrontimin personal.

Duhet theksuar se ka një ndryshim thelbësor në natyrën e përdorimit të metodave të ekspertëve në sistemet e ekspertëve dhe në mbështetjen e vendimeve. Nëse në rastin e parë, ekspertëve u kërkohet të zyrtarizojnë metodat e vendimmarrjes, atëherë në të dytën - vetëm vetë vendimi, si i tillë.

Meqenëse ekspertët janë të përfshirë në zbatimin e pikërisht atyre funksioneve që aktualisht ose nuk ofrohen fare nga sistemet e automatizuara, ose kryhen më keq se nga njerëzit, një drejtim premtues në zhvillimin e sistemeve të automatizuara është automatizimi maksimal i këtyre funksioneve.

Sisteme të automatizuara të mbështetjes së vendimeve

Një person ka përdorur gjithmonë asistentë në marrjen e vendimeve: ata ishin të dy thjesht ofrues të informacionit për objektin e kontrollit, dhe konsulentë (këshilltarë) që ofrojnë opsione për vendime dhe analizojnë pasojat e tyre. Vendimet i merrte gjithmonë në një mjedis të caktuar informacioni: për një komandant ushtarak ky është selia, për rektorin, këshilli akademik, për ministrin, kolegjiumi.

Në kohën tonë, infrastruktura informative e vendimmarrjes është e paimagjinueshme pa sisteme të automatizuara për vlerësimin iterativ të vendimeve dhe veçanërisht sistemet e mbështetjes së vendimeve (DDS - Decision Support Systems), d.m.th. sisteme të automatizuara që janë krijuar posaçërisht për të përgatitur informacionin që i nevojitet një personi për të marrë një vendim. Zhvillimi i sistemeve të mbështetjes së vendimeve kryhet, në veçanti, në kuadrin e një projekti ndërkombëtar të kryer nën kujdesin e Institutit Ndërkombëtar për Analizën e Sistemeve të Aplikuara në Laxenburg (Austri).

Zgjedhja në situata reale kërkon kryerjen e një sërë operacionesh, disa prej të cilave kryhen në mënyrë më efikase nga një person dhe të tjerët nga një makinë. Kombinimi efektiv i avantazheve të tyre me kompensimin e njëkohshëm të mangësive është mishëruar në sistemet e automatizuara të mbështetjes së vendimeve.

Një person merr vendime më mirë se një makinë në kushte pasigurie, por për të marrë vendimin e duhur, ai gjithashtu ka nevojë për informacion adekuat (të plotë dhe të besueshëm) që karakterizon fushën e temës. Megjithatë, dihet se një person nuk përballet mirë me sasi të mëdha informacioni "të papërpunuar" të papërpunuar. Prandaj, roli i makinës në mbështetjen e vendimeve mund të jetë të kryejë përgatitjen paraprake të informacionit në lidhje me objektin e kontrollit dhe faktorët e pakontrollueshëm (mjedisin), të ndihmojë në shikimin e pasojave të marrjes së vendimeve të caktuara dhe gjithashtu të paraqesë të gjithë këtë informacion në një pamje vizuale. dhe mënyrë e përshtatshme për marrjen e vendimeve.

Kështu, sistemet e automatizuara të mbështetjes së vendimeve kompensojnë dobësitë e një personi, duke e çliruar atë nga përpunimi paraprak rutinë i informacionit dhe i sigurojnë atij një mjedis të rehatshëm informacioni në të cilin ai mund të tregojë më mirë pikat e tij të forta. Këto sisteme nuk janë të përqendruara në automatizimin e funksioneve të vendimmarrësit (dhe, si rezultat, në tjetërsimin e këtyre funksioneve prej tij, dhe rrjedhimisht përgjegjësinë për vendimet e marra, gjë që shpesh është përgjithësisht e papranueshme), por në ofrimin e ndihmës për të gjetur një zgjidhje e mirë.

Dhe shenja. Detyra të tilla zgjidhen mjaft shpesh, për shembull, kur kaloni ose drejtoni një rrugë në semafor. Njohja e ngjyrës së një semafori të ndezur dhe njohja e rregullave të rrugës ju lejon të merrni vendimin e duhur nëse do të kaloni ose jo rrugën në këtë moment.

Krijimi i sistemeve artificiale njohja e modelit mbetet një problem i vështirë teorik dhe teknik. Nevoja për një njohje të tillë lind në një sërë fushash - nga çështjet ushtarake dhe sistemet e sigurisë deri te dixhitalizimi i të gjitha llojeve të sinjaleve analoge.

Tradicionalisht, detyrat e njohjes së imazhit përfshihen në fushën e detyrave të inteligjencës artificiale.

Udhëzime në njohjen e modeleve

Ka dy drejtime kryesore:

  • Studimi i aftësive të njohjes që zotërojnë qeniet e gjalla, shpjegimi dhe modelimi i tyre;
  • Zhvillimi i teorisë dhe metodave për ndërtimin e pajisjeve të dizajnuara për të zgjidhur probleme individuale për qëllime të aplikuara.

Deklarata zyrtare e problemit

Njohja e modelit është caktimi i të dhënave fillestare në një klasë të caktuar duke theksuar veçoritë thelbësore që karakterizojnë këto të dhëna nga masa totale e të dhënave jo thelbësore.

Kur vendosin probleme të njohjes, ata përpiqen të përdorin gjuhën matematikore, duke u përpjekur, në ndryshim nga teoria e rrjeteve nervore artificiale, ku baza është të merret një rezultat me eksperiment, të zëvendësojnë eksperimentin me arsyetim logjik dhe prova matematikore.

Deklarata klasike e problemit të njohjes së modelit: Jepet një grup objektesh. Ata duhet të klasifikohen. Një grup përfaqësohet nga nënbashkësi të quajtura klasa. Janë dhënë: informacion rreth klasave, një përshkrim i të gjithë grupit dhe një përshkrim i informacionit rreth një objekti që i përket një klase të caktuar nuk dihet. Kërkohet, sipas informacionit të disponueshëm për klasat dhe përshkrimit të objektit, të përcaktohet se cilës klasë i përket ky objekt.

Më shpesh, imazhet njëngjyrëshe konsiderohen në problemet e njohjes së modelit, gjë që bën të mundur që një imazh të konsiderohet si funksion në një aeroplan. Nëse marrim parasysh një pikë të vendosur në një plan, ku funksioni shpreh karakteristikën e tij në secilën pikë të figurës - shkëlqimin, transparencën, densitetin optik, atëherë një funksion i tillë është një regjistrim formal i imazhit.

Seti i të gjitha funksioneve të mundshme në aeroplan është një model i grupit të të gjitha imazheve. Prezantimi i konceptit ngjashmëritë midis imazheve, mund të vendosni detyrën e njohjes. Forma specifike e një mjedisi të tillë varet fuqimisht nga fazat pasuese të njohjes në përputhje me një ose një qasje tjetër.

Disa metoda të njohjes së imazheve grafike

Për njohjen optike të imazhit, mund të aplikoni metodën e përsëritjes mbi pamjen e një objekti në kënde të ndryshme, shkallë, zhvendosje, etj. Për shkronjat, duhet të përsërisni mbi fontin, vetitë e fontit, etj.

Qasja e dytë është gjetja e konturit të objektit dhe ekzaminimi i vetive të tij (lidhja, prania e qosheve, etj.)

Një qasje tjetër është përdorimi i rrjeteve nervore artificiale. Kjo metodë kërkon ose një numër të madh shembujsh të detyrës së njohjes (me përgjigje të sakta), ose një strukturë të veçantë të rrjetit nervor që merr parasysh specifikat e kësaj detyre.

Perceptroni si një metodë e njohjes së modelit

F. Rosenblatt, duke prezantuar konceptin e një modeli truri, detyra e të cilit është të tregojë se si mund të lindin fenomene psikologjike në një sistem fizik, struktura dhe vetitë funksionale të të cilit janë të njohura, përshkroi eksperimentet më të thjeshta të diskriminimit. Këto eksperimente janë tërësisht të lidhura me metodat e njohjes së modelit, por ndryshojnë në atë që algoritmi i zgjidhjes nuk është determinist.

Eksperimenti më i thjeshtë, mbi bazën e të cilit është e mundur të merren informacione të rëndësishme psikologjike për një sistem të caktuar, zbret në faktin se modeli paraqitet me dy stimuj të ndryshëm dhe kërkohet t'u përgjigjet atyre në mënyra të ndryshme. Qëllimi i një eksperimenti të tillë mund të jetë të studiojë mundësinë e diskriminimit të tyre spontan nga sistemi në mungesë të ndërhyrjes nga eksperimentuesi, ose, anasjelltas, të studiojë diskriminimin e detyruar, në të cilin eksperimentuesi kërkon të mësojë sistemin të kryejë klasifikimi i kërkuar.

Në një eksperiment mësimor, perceptroni zakonisht paraqitet me një sekuencë të caktuar imazhesh, e cila përfshin përfaqësues të secilës prej klasave që duhen dalluar. Sipas disa rregullave të modifikimit të kujtesës, zgjedhja e saktë e reagimit përforcohet. Më pas stimuli i kontrollit i paraqitet perceptronit dhe përcaktohet probabiliteti i marrjes së përgjigjes së saktë për stimujt e kësaj klase. Në varësi të faktit nëse stimuli i zgjedhur i kontrollit përputhet ose nuk përputhet me një nga imazhet që janë përdorur në sekuencën e stërvitjes, merren rezultate të ndryshme:

  1. Nëse stimuli i kontrollit nuk përkon me ndonjë nga stimujt e të mësuarit, atëherë eksperimenti shoqërohet jo vetëm me diskriminim i pastër, por përfshin edhe elemente përgjithësime.
  2. Nëse stimuli i kontrollit ngacmon një grup të caktuar elementesh shqisore që janë krejtësisht të ndryshëm nga ata elementë që janë aktivizuar nën ndikimin e stimujve të paraqitur më parë të së njëjtës klasë, atëherë eksperimenti është një hetim. përgjithësim i pastër.

Perceptronet nuk kanë aftësinë për përgjithësim të pastër, por ato funksionojnë mjaft të kënaqshme në eksperimentet e diskriminimit, veçanërisht nëse stimuli i kontrollit përkon mjaft ngushtë me një nga modelet për të cilat perceptroni ka grumbulluar tashmë një përvojë.

Shembuj të problemeve të njohjes së modelit

  • Njohja e barkodit
  • Njohja e targave
  • Njohja e imazhit
  • Njohja e zonave lokale të kores së tokës në të cilat ndodhen depozitat minerale

Shiko gjithashtu

Shënime

Letërsia

  • Gorelik A. L., Skripkin V. A. Metodat e njohjes. - Ed. 4. - M .: Shkolla e Lartë, 1984, 2004. - 262 f.
  • Vapnik V. N., Chervonenkis A. Ya. Teoria e njohjes së modelit. - M .: Nauka, 1974. - 416 f.
  • Vasiliev V.I. Sistemet e njohjes. Drejtoria. - botimi i 2-të. - K.: Naukova Dumka, 1983. - 424 f.
  • George Stockman, Linda Shapiro. Vizioni kompjuterik = Vizioni kompjuterik. - M .: Binom. Laboratori i Dijes, 2006. - 752 f. - ISBN 5-947-74384-1
  • Forsyth David A., Pons Jean. Vizioni kompjuterik. Qasja Moderne = Vizioni Kompjuterik: Një Qasje Moderne. - M .: Williams, 2004. - 928 f. - ISBN 0-13-085198-1
  • Cheng Sh.-K. Parimet e projektimit të sistemeve të informacionit vizual. - M .: Mir, 1994. - 408 f.

Lidhjet

  • Yuri Lifshits. Lënda "Problemet moderne të Informatikës Teorike" - leksione mbi metodat statistikore të njohjes së modeleve, njohjen e fytyrës, klasifikimin e tekstit
  • Journal of Pattern Recognition Research (Journal of Pattern Recognition Research)

Fondacioni Wikimedia. 2010 .

  • Gjuha e njohur
  • Raspops

Shihni se çfarë është "Teoria e Njohjes së Modeleve" në fjalorë të tjerë:

    teoria e njohjes së modeleve- një drejtim shkencor i bazuar në të dhëna nga psikologjia dhe fiziologjia, teoria e probabilitetit dhe e lidhur me zhvillimin e parimeve dhe ndërtimin e sistemeve (përfshirë ato të bazuara në kompjuter) të krijuara për të përcaktuar nëse një objekt i caktuar i përket një prej ... ... Fjalor Enciklopedik i Psikologjisë dhe Pedagogjisë

    Njohja e modelit- një drejtim shkencor që lidhet me zhvillimin e parimeve dhe ndërtimin e sistemeve të krijuara për të përcaktuar nëse një objekt i caktuar i përket një prej klasave të parazgjedhura të objekteve. Nën objektet në R. o. kuptoj gjera te ndryshme... Enciklopedia e Madhe Sovjetike

    NJOHJA E MOTJEVE- seksioni i matematikës. kibernetika, e cila zhvillon parimet dhe metodat e klasifikimit, si dhe identifikimin e objekteve, fenomeneve, proceseve, sinjaleve, situatave të të gjitha atyre objekteve që mund të përshkruhen nga një grup i kufizuar karakteristikash ose vetive të caktuara, ... ... Enciklopedia Matematikore

    Njohja e modelit

    Njohja e modelit (kibernetikë)- Njohja automatike e fytyrës nga një program i veçantë. Teoria e njohjes së imazheve është një seksion i kibernetikës që zhvillon bazat teorike dhe metodat për klasifikimin dhe identifikimin e objekteve, fenomeneve, proceseve, sinjaleve, situatave, etj. objekteve, ... Wikipedia

    TEORIA E INFORMACIONIT- një seksion i matematikës së aplikuar dhe kibernetikës që lidhet me matematikën. përshkrimi dhe vlerësimi i cilësisë së transmetimit, ruajtjes, marrjes dhe klasifikimit të informacionit. Termi I. t., i cili u ngrit në vitet '50. Shekulli i 20-të, ende (deri në vitin 1978) nuk ka një ... ... Enciklopedia Matematikore

    Të mësuarit pa mësues- (eng. Mësimi pa mbikëqyrje, vetë-mësimi, mësimi spontan) është një nga metodat e mësimit të makinës, në zgjidhjen e së cilës sistemi nën provë mëson spontanisht të kryejë detyrën, pa ndërhyrje të jashtme ... ... Wikipedia

    Rrjeti nervor artificial- Ky term ka kuptime të tjera, shih rrjetin nervor (kuptimet). Diagrami i një rrjeti të thjeshtë nervor. Neuronet hyrëse janë shënuar me jeshile, neuronet e fshehura me blu, neuronet e daljes me të verdhë ... Wikipedia

Sistemet e gjalla, duke përfshirë njerëzit, janë përballur vazhdimisht me detyrën e njohjes së modeleve që nga fillimi i tyre. Në veçanti, informacioni që vjen nga organet shqisore përpunohet nga truri, i cili nga ana tjetër rendit informacionin, siguron vendimmarrjen dhe më pas, duke përdorur impulse elektrokimike, transmeton sinjalin e nevojshëm më tej, për shembull, në organet e lëvizjes, të cilat. zbatojnë veprimet e nevojshme. Pastaj ka një ndryshim në mjedis, dhe dukuritë e mësipërme përsëriten. Dhe nëse shikoni, atëherë çdo fazë shoqërohet me njohje.

Me zhvillimin e teknologjisë kompjuterike, u bë e mundur zgjidhja e një numri problemesh që lindin në procesin e jetës, për të lehtësuar, përshpejtuar, përmirësuar cilësinë e rezultatit. Për shembull, funksionimi i sistemeve të ndryshme të mbështetjes së jetës, ndërveprimi njeri-kompjuter, shfaqja e sistemeve robotike, etj. Megjithatë, vërejmë se aktualisht nuk është e mundur të sigurohet një rezultat i kënaqshëm në disa detyra (njohja e objekteve të ngjashme me lëvizje të shpejtë , tekst i shkruar me dorë).

Qëllimi i punës: të studiojë historinë e sistemeve të njohjes së modeleve.

Tregoni ndryshimet cilësore që kanë ndodhur në fushën e njohjes së modeleve, si teorike ashtu edhe teknike, duke treguar arsyet;

Diskutoni metodat dhe parimet e përdorura në informatikë;

Jepni shembuj të perspektivave që priten në të ardhmen e afërt.

1. Çfarë është njohja e modelit?

Hulumtimi i parë me teknologjinë kompjuterike në thelb ndoqi skemën klasike të modelimit matematik - modeli matematikor, algoritmi dhe llogaritja. Këto ishin detyrat e modelimit të proceseve që ndodhin gjatë shpërthimeve të bombave atomike, llogaritja e trajektoreve balistike, aplikime ekonomike dhe të tjera. Megjithatë, përveç ideve klasike të kësaj serie, kishte edhe metoda të bazuara në një natyrë krejtësisht të ndryshme dhe siç tregonte praktika e zgjidhjes së disa problemeve, ato shpesh jepnin rezultate më të mira se zgjidhjet e bazuara në modele matematikore tepër të ndërlikuara. Ideja e tyre ishte të braktisnin dëshirën për të krijuar një model matematikor shterues të objektit në studim (për më tepër, shpesh ishte praktikisht e pamundur të ndërtoheshin modele adekuate), dhe në vend të kësaj të kënaqeshin me përgjigjen vetëm për pyetjet specifike me interes për ne, dhe këto përgjigje duhet të kërkohen nga konsideratat e zakonshme për një klasë të gjerë problemesh. Kërkimet e këtij lloji përfshinin njohjen e imazheve vizuale, parashikimin e rendimenteve, nivelet e lumenjve, problemin e dallimit ndërmjet naftëmbajtësve dhe akuiferëve duke përdorur të dhëna gjeofizike indirekte, etj. Kërkohej një përgjigje specifike në këto detyra në një formë mjaft të thjeshtë, si p.sh. për shembull, nëse një objekt i përket njërës prej klasave të para-fiksuara. Dhe të dhënat fillestare të këtyre detyrave, si rregull, jepeshin në formën e informacionit fragmentar për objektet në studim, për shembull, në formën e një grupi objektesh të para-klasifikuara. Nga pikëpamja matematikore, kjo do të thotë se njohja e modelit (dhe kjo klasë problemesh u emërua në vendin tonë) është një përgjithësim i gjerë i idesë së ekstrapolimit të funksionit.

Rëndësia e një formulimi të tillë për shkencat teknike është pa dyshim dhe kjo në vetvete justifikon studime të shumta në këtë fushë. Megjithatë, problemi i njohjes së modeleve ka gjithashtu një aspekt më të gjerë për shkencën natyrore (megjithatë, do të ishte e çuditshme nëse diçka kaq e rëndësishme për sistemet artificiale kibernetike nuk do të ishte e rëndësishme për ato natyrore). Konteksti i kësaj shkence përfshinte në mënyrë organike pyetjet e parashtruara nga filozofët e lashtë për natyrën e njohurive tona, aftësinë tonë për të njohur imazhe, modele, situata të botës përreth. Në fakt, praktikisht nuk ka dyshim se mekanizmat për njohjen e imazheve më të thjeshta, të tilla si imazhet e një grabitqari ose ushqimi të rrezikshëm që po afrohej, u formuan shumë më herët sesa u shfaq gjuha elementare dhe aparati logjik formal. Dhe nuk ka dyshim se mekanizma të tillë janë zhvilluar mjaftueshëm edhe në kafshët më të larta, të cilat, në aktivitetin e tyre jetësor, gjithashtu kanë nevojë urgjente për aftësinë për të dalluar një sistem mjaft kompleks të shenjave të natyrës. Kështu, në natyrë, ne shohim se fenomeni i të menduarit dhe i vetëdijes bazohet qartë në aftësinë për të njohur modele dhe përparimi i mëtejshëm i shkencës së inteligjencës lidhet drejtpërdrejt me thellësinë e të kuptuarit të ligjeve themelore të njohjes. Duke kuptuar faktin se pyetjet e mësipërme shkojnë shumë përtej përkufizimit standard të njohjes së modelit (termi mësim i mbikëqyrur është më i zakonshëm në literaturën në gjuhën angleze), është gjithashtu e nevojshme të kuptohet se ato kanë lidhje të thella me këtë relativisht të ngushtë (por ende larg nga shterimi) drejtim.

Edhe tani, njohja e modelit ka hyrë fort në jetën e përditshme dhe është një nga njohuritë më vitale të një inxhinieri modern. Në mjekësi, njohja e modelit i ndihmon mjekët të bëjnë diagnoza më të sakta; në fabrika, përdoret për të parashikuar defekte në grupe mallrash. Sistemet biometrike të identifikimit personal si thelbi i tyre algoritmik bazohen gjithashtu në rezultatet e kësaj disipline. Zhvillimi i mëtejshëm i inteligjencës artificiale, veçanërisht dizajni i kompjuterëve të gjeneratës së pestë të aftë për komunikim më të drejtpërdrejtë me një person në gjuhët natyrore për njerëzit dhe përmes të folurit, është i paimagjinueshëm pa njohje. Këtu, robotika, sistemet e kontrollit artificial që përmbajnë sisteme njohjeje si nënsisteme jetike, janë lehtësisht të arritshme.

Kjo është arsyeja pse shumë vëmendje iu kushtua zhvillimit të njohjes së modeleve që në fillim nga specialistë të profileve të ndryshme - kibernetikë, neurofiziologë, psikologë, matematikanë, ekonomistë, etj. Kryesisht për këtë arsye, vetë njohja moderne e modeleve ushqehet me idetë e këtyre disiplinave. Pa pretenduar se është e plotë (dhe është e pamundur ta pretendosh atë në një ese të shkurtër), ne do të përshkruajmë historinë e njohjes së modelit, idetë kryesore.

Përkufizimet

Para se të vazhdojmë me metodat kryesore të njohjes së modelit, ne japim disa përkufizime të nevojshme.

Njohja e imazheve (objekteve, sinjaleve, situatave, fenomeneve ose proceseve) është detyra e identifikimit të një objekti ose përcaktimit të ndonjë prej vetive të tij nga imazhi i tij (njohja optike) ose regjistrimi audio (njohja akustike) dhe karakteristika të tjera.

Një nga ato themelore është koncepti i një grupi që nuk ka një formulim specifik. Në një kompjuter, një grup përfaqësohet nga një grup elementësh që nuk përsëriten të të njëjtit lloj. Fjala "jo-përsëritëse" do të thotë që një element në grup ose është aty ose nuk është aty. Kompleti universal përfshin të gjithë elementët e mundshëm për problemin që zgjidhet, grupi bosh nuk përmban asnjë.

Një imazh është një grupim klasifikimi në sistemin e klasifikimit që bashkon (veçon) një grup të caktuar objektesh sipas ndonjë atributi. Imazhet kanë një veti karakteristike, e cila manifestohet në faktin se njohja me një numër të kufizuar fenomenesh nga i njëjti grup bën të mundur njohjen e një numri të madh arbitrarisht të përfaqësuesve të tij. Imazhet kanë veti karakteristike objektive në kuptimin që njerëz të ndryshëm që mësojnë nga materiale të ndryshme vëzhguese, në pjesën më të madhe, klasifikojnë të njëjtat objekte në të njëjtën mënyrë dhe në mënyrë të pavarur nga njëri-tjetri. Në formulimin klasik të problemit të njohjes, grupi universal ndahet në pjesë-imazhe. Çdo hartë e çdo objekti me organet perceptuese të sistemit njohës, pavarësisht nga pozicioni i tij në lidhje me këto organe, zakonisht quhet imazh i objektit, dhe grupet e imazheve të tilla, të bashkuara nga disa veti të përbashkëta, janë imazhe.

Metoda e caktimit të një elementi në çdo imazh quhet rregull vendimi. Një koncept tjetër i rëndësishëm është metrika, një mënyrë për të përcaktuar distancën midis elementeve të një grupi universal. Sa më e vogël të jetë kjo distancë, aq më të ngjashme janë objektet (simbolet, tingujt, etj.) që njohim. Në mënyrë tipike, elementët specifikohen si një grup numrash, dhe metrika specifikohet si një funksion. Efikasiteti i programit varet nga zgjedhja e paraqitjes së imazheve dhe zbatimi i metrikës, një algoritëm njohjeje me metrika të ndryshme do të bëjë gabime me frekuenca të ndryshme.

Mësimi zakonisht quhet procesi i zhvillimit në një sistem të një reagimi të veçantë ndaj grupeve të sinjaleve të jashtme identike duke ndikuar vazhdimisht në sistemin e korrigjimit të jashtëm. Një rregullim i tillë i jashtëm në trajnim zakonisht quhet "inkurajim" dhe "ndëshkim". Mekanizmi për gjenerimin e këtij rregullimi përcakton pothuajse plotësisht algoritmin e të mësuarit. Vetë-mësimi ndryshon nga të mësuarit në atë që këtu nuk raportohet informacion shtesë në lidhje me besnikërinë e reagimit ndaj sistemit.

Përshtatja është një proces i ndryshimit të parametrave dhe strukturës së sistemit, dhe ndoshta edhe veprimeve të kontrollit, bazuar në informacionin aktual për të arritur një gjendje të caktuar të sistemit me pasiguri fillestare dhe ndryshim të kushteve të funksionimit.

Të mësuarit është një proces si rezultat i të cilit sistemi gradualisht fiton aftësinë për t'iu përgjigjur me reagimet e nevojshme grupeve të caktuara të ndikimeve të jashtme, dhe përshtatja është rregullimi i parametrave dhe strukturës së sistemit për të arritur cilësinë e kërkuar të kontrollit. në kushtet e ndryshimeve të vazhdueshme të kushteve të jashtme.

Shembuj të detyrave të njohjes së modeleve: - Njohja e shkronjave;

Pasqyrë e metodave ekzistuese të njohjes së modelit

L.P. Popova , DHE RRETH. Datiev

Aftësia për të "njohur" konsiderohet si pronë kryesore e qenieve njerëzore, si, në të vërtetë, e organizmave të tjerë të gjallë. Njohja e modelit është një seksion i kibernetikës që zhvillon parime dhe metoda për klasifikimin dhe identifikimin e objekteve, fenomeneve, proceseve, sinjaleve, situatave - të gjitha ato objekte që mund të përshkruhen nga një grup i kufizuar i disa veçorive ose vetive që karakterizojnë një objekt.

Një imazh është një përshkrim i një objekti. Imazhet kanë një veti karakteristike, e cila manifestohet në faktin se njohja me një numër të kufizuar fenomenesh nga i njëjti grup bën të mundur njohjen e një numri të madh arbitrarisht të përfaqësuesve të tij.

Ekzistojnë dy drejtime kryesore në teorinë e njohjes së modelit:

    studimi i fuqive të njohjes që zotërojnë qeniet njerëzore dhe organizmat e tjerë të gjallë;

    zhvillimi i teorisë dhe metodave për ndërtimin e pajisjeve të dizajnuara për të zgjidhur problemet individuale të njohjes së modeleve në fusha të caktuara aplikimi.

Më tej, artikulli përshkruan problemet, parimet dhe metodat për zbatimin e sistemeve të njohjes së modeleve që lidhen me zhvillimin e drejtimit të dytë. Pjesa e dytë e artikullit diskuton metodat e rrjetit nervor të njohjes së modelit, të cilat mund t'i atribuohen drejtimit të parë të teorisë së njohjes së modelit.

Problemet e ndërtimit të sistemeve të njohjes së imazhit

Detyrat që dalin në ndërtimin e sistemeve automatike të njohjes së modeleve zakonisht mund të klasifikohen në disa fusha kryesore. E para prej tyre lidhet me paraqitjen e të dhënave fillestare të marra si rezultat i matjeve për objektin që do të njihet. problem ndjeshmërie. Çdo vlerë e matur është një "karakteristikë" e një imazhi ose një objekti. Supozoni, për shembull, që imazhet janë karaktere alfanumerike. Në këtë rast, një retinë matës, e ngjashme me atë të paraqitur në Fig. 1(a), mund të përdoret me sukses në sensor Nëse retina përbëhet nga n-elemente, atëherë rezultatet e matjes mund të përfaqësohen si një vektor matjeje ose një vektor imazhi ,

ku çdo element xi merr, për shembull, vlerën 1 nëse imazhi i simbolit kalon nëpër qelizën i-të të retinës, dhe vlerën 0 ndryshe.

Konsideroni Fig. 2 (b). Në këtë rast, imazhet janë funksione të vazhdueshme (të llojit të sinjaleve zanore) të ndryshores t. Nëse vlerat e funksionit maten në pikat diskrete t1,t2, ..., tn, atëherë vektori i imazhit mund të formohet duke marrë x1= f(t1),x2=f(t2),... , xn = f(tn).

Figura 1. Matja e retinës

Problemi i dytë i njohjes së modelit lidhet me zgjedhjen e veçorive ose vetive karakteristike nga të dhënat fillestare të marra dhe reduktimin e dimensionit të vektorëve të modelit. Ky problem shpesh përkufizohet si problem parapërpunimi dhe përzgjedhja e veçorive.

Karakteristikat e një klase imazhesh janë veti karakteristike të përbashkëta për të gjitha imazhet e një klase të caktuar. Tiparet që karakterizojnë dallimet ndërmjet klasave individuale mund të interpretohen si tipare ndërklasore. Veçoritë brenda klasës që janë të përbashkëta për të gjitha klasat në shqyrtim nuk përmbajnë informacion të dobishëm nga pikëpamja e njohjes dhe mund të mos merren parasysh. Zgjedhja e veçorive konsiderohet si një nga detyrat e rëndësishme që lidhet me ndërtimin e sistemeve të njohjes. Nëse rezultatet e matjes bëjnë të mundur marrjen e një grupi të plotë karakteristikash dalluese për të gjitha klasat, njohja dhe klasifikimi aktual i modeleve nuk do të shkaktojë ndonjë vështirësi të veçantë. Njohja automatike më pas do të reduktohej në një proces të thjeshtë përputhjeje ose procedura të tilla si kërkimi i tabelave. Megjithatë, në shumicën e problemeve praktike të njohjes, përcaktimi i një grupi të plotë karakteristikash dalluese është jashtëzakonisht i vështirë, në mos i pamundur. Nga të dhënat origjinale, zakonisht është e mundur të nxirren disa nga veçoritë dalluese dhe t'i përdorin ato për të thjeshtuar procesin e njohjes automatike të modelit. Në veçanti, dimensioni i vektorëve të matjes mund të reduktohet duke përdorur transformime që minimizojnë humbjen e informacionit.

Problemi i tretë që lidhet me ndërtimin e sistemeve të njohjes së modeleve është gjetja e procedurave optimale të vendimit të nevojshme për identifikimin dhe klasifikimin. Pasi të dhënat e mbledhura rreth modeleve që do të njihen përfaqësohen me pika ose vektorë matës në hapësirën e modeleve, lëreni makinën të kuptojë se cilës klasë modelesh korrespondojnë këto të dhëna. Lëreni makinën të projektohet për të bërë dallimin midis klasave M, të shënuara me w1, w2, ... ..., wm. Në këtë rast, hapësira e imazhit mund të konsiderohet se përbëhet nga rajone M, secila prej të cilave përmban pika që korrespondojnë me imazhet nga e njëjta klasë. Në këtë rast, problemi i njohjes mund të konsiderohet si ndërtimi i kufijve të rajoneve të vendimit që ndajnë klasat M bazuar në vektorët e regjistruar të matjes. Le të përcaktohen këto kufij, për shembull, nga funksionet e vendimit d1(х),d2(x),..., dm(х). Këto funksione, të quajtura edhe funksione diskriminuese, janë funksione skalare dhe me një vlerë të imazhit të x. Nëse di (x) > dj (x), atëherë imazhi i x i përket klasës w1. Me fjalë të tjera, nëse funksioni i vendimit i-të di(x) ka vlera më e lartë, atëherë një ilustrim kuptimplotë i një skeme të tillë klasifikimi automatik bazuar në zbatimin e procesit të vendimmarrjes është paraqitur në Fig. 2 (në skemën "GR" - gjeneratori i funksioneve vendimtare).

Figura 2. Skema e klasifikimit automatik.

Funksionet e vendimmarrjes mund të merren në disa mënyra. Në ato raste kur disponohet një informacion i plotë a priori për modelet e njohura, funksionet e vendimit mund të përcaktohen pikërisht në bazë të këtij informacioni. Nëse disponohet vetëm informacion cilësor për modelet, mund të bëhen supozime të arsyeshme për formën e funksioneve të vendimit. B rasti i fundit, kufijtë e rajoneve të vendimmarrjes mund të devijojnë ndjeshëm nga ato të vërteta, dhe për këtë arsye është e nevojshme të krijohet një sistem i aftë për të arritur një rezultat të kënaqshëm nëpërmjet një sërë rregullimesh të njëpasnjëshme.

Objektet (imazhet) që do të njihen dhe klasifikohen duke përdorur një sistem automatik të njohjes së modelit duhet të kenë një sërë karakteristikash të matshme. Kur për një grup të tërë imazhesh rezultatet e matjeve përkatëse janë të ngjashme, konsiderohet se këto objekte i përkasin të njëjtës klasë. Qëllimi i sistemit të njohjes së modelit është të përcaktojë, në bazë të informacionit të mbledhur, një klasë objektesh me karakteristika të ngjashme me ato të matura për objektet e dallueshme. Korrektësia e njohjes varet nga sasia e informacionit dallues që përmban karakteristikat e matura dhe efikasiteti i përdorimit të këtij informacioni.

      Metodat bazë për zbatimin e sistemeve të njohjes së modeleve

Njohja e modelit është detyra e ndërtimit dhe zbatimit të operacioneve formale mbi paraqitjet numerike ose simbolike të objekteve të botës reale ose ideale, rezultatet, zgjidhjet e të cilave pasqyrojnë marrëdhëniet ekuivalente midis këtyre objekteve. Marrëdhëniet ekuivalente shprehin përkatësinë e objekteve të vlerësuara në disa klasa, të konsideruara si njësi semantike të pavarura.

Gjatë ndërtimit të algoritmeve të njohjes, klasat e ekuivalencës mund të vendosen nga një studiues i cili përdor idetë e tij kuptimplota ose përdor informacion shtesë të jashtëm për ngjashmërinë dhe ndryshimin e objekteve në kontekstin e problemit që zgjidhet. Pastaj flitet për "të dalluar me mësuesin". Përndryshe, d.m.th. kur një sistem i automatizuar zgjidh një problem klasifikimi pa përfshirë informacionin e jashtëm të trajnimit, flitet për klasifikim automatik ose "njohje të pambikëqyrur". Shumica e algoritmeve të njohjes së modeleve kërkojnë përfshirjen e fuqisë llogaritëse shumë të rëndësishme, e cila mund të sigurohet vetëm nga teknologjia kompjuterike me performancë të lartë.

Autorë të ndryshëm (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, Temnikov F.E., Afonin V.A., R., Dmitriev. Gonzalez, P. Winston, K. Fu, Ya.Z. Tsypkin dhe të tjerë) japin një tipologji të ndryshme të metodave të njohjes së modeleve. Disa autorë bëjnë dallimin ndërmjet metodave parametrike, joparametrike dhe heuristike, ndërsa të tjerë veçojnë grupe metodash të bazuara në shkollat ​​historike dhe prirjet në këtë fushë.

Në të njëjtën kohë, tipologjitë e njohura nuk marrin parasysh një karakteristikë shumë domethënëse, e cila pasqyron specifikat e mënyrës së përfaqësimit të njohurive për fushën e lëndës duke përdorur çdo algoritëm formal të njohjes së modelit. D.A. Pospelov identifikon dy mënyra kryesore të përfaqësimit të njohurive:

    Paraqitja intensive - në formën e një diagrami të marrëdhënieve midis atributeve (veçorive).

    Paraqitja e zgjeruar - me ndihmën e fakteve specifike (objekte, shembuj).

Duhet theksuar se ekzistenca e këtyre dy grupeve të metodave të njohjes: ato që veprojnë me veçori dhe ato që veprojnë me objekte, është thellësisht e natyrshme. Nga ky këndvështrim, asnjë nga këto metoda, të marra veçmas nga tjetra, nuk bën të mundur formimin e një pasqyrimi adekuat të fushës së lëndës. Midis këtyre metodave ekziston një lidhje komplementariteti në kuptimin e N. Bohr-it, prandaj, sistemet premtuese të njohjes duhet të sigurojnë zbatimin e të dyja këtyre metodave dhe jo të ndonjërës prej tyre.

Kështu, klasifikimi i metodave të njohjes së propozuar nga D.A. Pospelov bazohet në ligjet themelore që qëndrojnë në themel të mënyrës njerëzore të njohjes në përgjithësi, gjë që e vendos atë në një pozicion shumë të veçantë (të privilegjuar) krahasuar me klasifikimet e tjera, të cilat, në këtë sfond, duken më e lehtë dhe artificiale.

Metodat intensive

Një tipar dallues i metodave intensive është se ato përdorin karakteristika të ndryshme të veçorive dhe marrëdhëniet e tyre si elemente të operacioneve në ndërtimin dhe aplikimin e algoritmeve të njohjes së modeleve. Elementë të tillë mund të jenë vlera individuale ose intervale të vlerave të veçorive, vlerat mesatare dhe variancat, matricat e marrëdhënieve të veçorive, etj., mbi të cilat kryhen veprimet, të shprehura në formë analitike ose konstruktive. Në të njëjtën kohë, objektet në këto metoda nuk konsiderohen si njësi informacioni integrale, por veprojnë si tregues për vlerësimin e ndërveprimit dhe sjelljes së atributeve të tyre.

Grupi i metodave intensive të njohjes së modelit është i gjerë dhe ndarja e tij në nënklasa është disi arbitrare:

– metodat e bazuara në vlerësimet e densitetit të shpërndarjes së vlerave të veçorive

– metodat e bazuara në supozimet për klasën e funksioneve të vendimit

– metodat logjike

– metodat gjuhësore (strukturore).

Metodat e bazuara në vlerësimet e densitetit të shpërndarjes së vlerave të veçorive. Këto metoda të njohjes së modelit janë huazuar nga teoria klasike e vendimeve statistikore, në të cilën objektet e studimit konsiderohen si realizime të një ndryshoreje të rastësishme shumëdimensionale të shpërndarë në hapësirën e veçorive sipas disa ligjeve. Ato bazohen në një skemë vendimmarrëse Bayesian që apelon në probabilitete a priori të objekteve që i përkasin një klase të veçantë të njohur dhe densitet të shpërndarjes së kushtëzuar të vlerave të vektorit të veçorive. Këto metoda reduktohen në përcaktimin e raportit të gjasave në zona të ndryshme të hapësirës së veçorive shumëdimensionale.

Grupi i metodave të bazuara në vlerësimin e densitetit të shpërndarjes së vlerave të veçorive lidhet drejtpërdrejt me metodat e analizës diskriminuese. Qasja Bayesiane ndaj vendimmarrjes është një nga më të zhvilluarat në statistikat moderne, të ashtuquajturat metoda parametrike, për të cilat shprehja analitike e ligjit të shpërndarjes (në këtë rast, ligji normal) konsiderohet të jetë e njohur, dhe vetëm një numër i vogël i parametrave (vektorët mesatarë dhe matricat e kovariancës) duhet të vlerësohen.

Ky grup përfshin gjithashtu një metodë për llogaritjen e raportit të gjasave për veçoritë e pavarura. Kjo metodë, me përjashtim të supozimit të pavarësisë së tipareve (i cili pothuajse nuk është kurrë i vërtetë në realitet), nuk nënkupton njohuri pamje funksionale ligji i shpërndarjes. Mund t'i atribuohet metodave joparametrike.

Metoda të tjera joparametrike, të përdorura kur forma e lakores së densitetit të shpërndarjes është e panjohur dhe nuk mund të bëhen fare supozime për natyrën e saj, zënë një pozicion të veçantë. Kjo perfshin metodë e famshme histogramet shumëdimensionale, metoda “k-fqinjët më të afërt”, metoda e distancës Euklidiane, metoda e funksioneve potenciale etj., përgjithësimi i të cilave është metoda e quajtur “vlerësimet e Parzenit”. Këto metoda funksionojnë zyrtarisht mbi objektet si struktura integrale, por në varësi të llojit të detyrës së njohjes, ato mund të veprojnë si në aspektin intensional ashtu edhe në atë zgjerues.

Metodat joparametrike analizojnë numrin relativ të objekteve që bien në vëllimet e dhëna shumëdimensionale dhe përdorin funksione të ndryshme të distancës midis objekteve të mostrës së trajnimit dhe objekteve të njohura. Për veçoritë sasiore, kur numri i tyre është shumë më i vogël se madhësia e kampionit, operacionet me objekte luajnë një rol të ndërmjetëm në vlerësimin e densitetit lokal të shpërndarjes së probabiliteteve të kushtëzuara, dhe objektet nuk mbajnë ngarkesën semantike të njësive të pavarura të informacionit. Në të njëjtën kohë, kur numri i veçorive është proporcional ose më shumë numër të objekteve në studim, dhe veçoritë janë të natyrës cilësore ose dikotomike, atëherë nuk mund të flitet për ndonjë vlerësim lokal të densiteteve të shpërndarjes së probabilitetit. Në këtë rast, objektet në këto metoda joparametrike konsiderohen si njësi të pavarura informacioni (faktet empirike holistike) dhe këto metoda marrin kuptimin e vlerësimeve të ngjashmërisë dhe ndryshimit të objekteve në studim.

Kështu, të njëjtat operacione teknologjike të metodave joparametrike, në varësi të kushteve të problemit, kanë kuptim ose vlerësime lokale të densitetit të shpërndarjes së probabilitetit të vlerave të veçorive, ose vlerësime të ngjashmërisë dhe ndryshimit të objekteve.

Në kontekstin e përfaqësimit intensiv të njohurive, këtu merret parasysh ana e parë e metodave joparametrike, si vlerësime të densitetit të shpërndarjes së probabilitetit. Shumë autorë vërejnë se metodat joparametrike si vlerësimet e Parzen funksionojnë mirë në praktikë. Vështirësitë kryesore në aplikimin e këtyre metodave janë nevoja për të kujtuar të gjithë kampionin e trajnimit për të llogaritur vlerësimet e densitetit lokal të shpërndarjes së probabilitetit dhe ndjeshmërinë e lartë ndaj mospërfaqësimit të kampionit të trajnimit.

Metodat e bazuara në supozimet për klasën e funksioneve të vendimit. Në këtë grup metodash, forma e përgjithshme e funksionit të vendimmarrjes konsiderohet e njohur dhe jepet cilësia e tij funksionale. Bazuar në këtë funksional, kërkohet përafrimi më i mirë i funksionit të vendimit për sekuencën e trajnimit. Më të zakonshmet janë paraqitjet e funksioneve të vendimit në formën e polinomeve jolineare lineare dhe të përgjithësuara. Cilësia funksionale e rregullit të vendimit zakonisht shoqërohet me gabimin e klasifikimit.

Avantazhi kryesor i metodave të bazuara në supozimet për klasën e funksioneve të vendimit është qartësia e formulimit matematikor të problemit të njohjes si problem i gjetjes së një ekstremi. Zgjidhja e këtij problemi shpesh arrihet duke përdorur disa lloj algoritmesh gradient. Shumëllojshmëria e metodave të këtij grupi shpjegohet me gamën e gjerë të funksioneve të cilësisë së rregullave të vendimmarrjes të përdorura dhe algoritmeve të kërkimit ekstrem. Një përgjithësim i algoritmeve të konsideruara, të cilat përfshijnë, në veçanti, algoritmin e Njutonit, algoritmet e tipit perceptron, etj., është metoda e përafrimit stokastik. Ndryshe nga metodat e njohjes parametrike, suksesi i këtij grupi metodash nuk varet aq shumë nga mospërputhja konceptet teorike për ligjet e shpërndarjes së objekteve në hapësirën e atributeve me realitet empirik. Të gjitha operacionet i nënshtrohen një qëllimi kryesor- gjetja e ekstremit të cilësisë funksionale të rregullit të vendimit. Në të njëjtën kohë, rezultatet e metodave parametrike dhe të konsideruara mund të jenë të ngjashme. Siç u tregua më lart, metodat parametrike për rastin e shpërndarjeve normale të objekteve në klasa të ndryshme me matrica të barabarta të kovariancës çojnë në funksione të vendimit linear. Vëmë re gjithashtu se algoritmet për zgjedhjen e veçorive informative në modelet lineare të diagnostikimit mund të interpretohen si variante të veçanta të algoritmeve të gradientit për kërkimin e një ekstremi.

Janë studiuar mjaft mirë mundësitë e algoritmeve të gradientit për gjetjen e një ekstremumi, veçanërisht në grupin e rregullave të vendimmarrjes lineare. Konvergjenca e këtyre algoritmeve është vërtetuar vetëm për rastin kur klasat e dallueshme të objekteve shfaqen në hapësirën e veçorive nga struktura kompakte gjeometrike. Sidoqoftë, dëshira për të arritur cilësi të mjaftueshme të rregullit të vendimit shpesh mund të plotësohet me ndihmën e algoritmeve që nuk kanë një provë rigoroze matematikore të konvergjencës së zgjidhjes me ekstremin global.

Algoritme të tilla përfshijnë një grup të madh procedurash programimi heuristik që përfaqësojnë drejtimin e modelimit evolucionar. Modelimi evolucionar është një metodë bionike e huazuar nga natyra. Ai bazohet në përdorimin e mekanizmave të njohur të evolucionit për të zëvendësuar procesin e modelimit kuptimplotë të një objekti kompleks me modelimin fenomenologjik të evolucionit të tij.

Një përfaqësues i njohur i modelimit evolucionar në njohjen e modelit është metoda e kontabilitetit në grup të argumenteve (MGUA). GMDH bazohet në parimin e vetë-organizimit, dhe algoritmet GMDH riprodhojnë skemën e përzgjedhjes masive. Në algoritmet GMDH, anëtarët e një polinomi të përgjithësuar sintetizohen dhe zgjidhen në një mënyrë të veçantë, e cila shpesh quhet polinomi Kolmogorov-Gabor. Kjo sintezë dhe përzgjedhje kryhet me kompleksitet në rritje dhe është e pamundur të parashikohet paraprakisht se çfarë forme përfundimtare do të ketë polinomi i përgjithësuar. Së pari, zakonisht konsiderohen kombinime të thjeshta çifte të veçorive fillestare, nga të cilat përbëhen ekuacionet e funksioneve vendimtare, si rregull, jo më të larta se rendi i dytë. Çdo ekuacion analizohet si një funksion i pavarur vendimi, dhe vlerat e parametrave të ekuacioneve të përbëra gjenden në një mënyrë ose në një tjetër nga kampioni i trajnimit. Më pas, nga grupi që rezulton i funksioneve të vendimit, zgjidhet një pjesë e më të mirëve në një farë kuptimi. Cilësia e funksioneve individuale të vendimit kontrollohet në një kampion kontrolli (test), i cili nganjëherë quhet parimi i shtimit të jashtëm. Funksionet e zgjedhura të vendimit të pjesshëm konsiderohen më poshtë si variabla të ndërmjetëm që shërbejnë si argumente fillestare për një sintezë të ngjashme të funksioneve të reja të vendimit, etj. Procesi i një sinteze të tillë hierarkike vazhdon derisa të arrihet ekstremi i kriterit të cilësisë së funksionit të vendimit, i cili në praktikë manifestohet në përkeqësimin e kësaj cilësie kur përpiqet të rrisë më tej renditjen e anëtarëve të polinomit në lidhje me tiparet origjinale.

Parimi i vetëorganizimit që qëndron në themel të GMDH quhet vetëorganizim heuristik, pasi i gjithë procesi bazohet në futjen e shtesave të jashtme të zgjedhura në mënyrë heuristike. Rezultati i vendimit mund të varet ndjeshëm nga këto heuristika. Modeli diagnostikues që rezulton varet nga mënyra se si objektet ndahen në mostra trajnimi dhe testimi, si përcaktohet kriteri i cilësisë së njohjes, sa variabla janë anashkaluar në rreshtin tjetër të përzgjedhjes, etj.

Këto veçori të algoritmeve GMDH janë gjithashtu karakteristike për qasjet e tjera të modelimit evolucionar. Por ne vërejmë këtu një aspekt tjetër të metodave në shqyrtim. Ky është thelbi i përmbajtjes së tyre. Duke përdorur metoda të bazuara në supozimet për klasën e funksioneve të vendimit (evolucionare dhe gradient), mund të ndërtohen modele diagnostikuese kompleksiteti i lartë dhe merrni rezultate praktikisht të pranueshme. Në të njëjtën kohë, arritja e qëllimeve praktike në këtë rast nuk shoqërohet me nxjerrjen e njohurive të reja për natyrën e objekteve të dallueshme. Mundësia e nxjerrjes së kësaj njohurie, veçanërisht njohurive në lidhje me mekanizmat e ndërveprimit të atributeve (veçorive), kufizohet thelbësisht këtu nga struktura e caktuar e një ndërveprimi të tillë, e fiksuar në formën e zgjedhur të funksioneve vendimtare. Prandaj, maksimumi që mund të thuhet pas ndërtimit të një modeli të veçantë diagnostikues është renditja e kombinimeve të veçorive dhe vetë veçorive që përfshihen në modelin që rezulton. Por kuptimi i kombinimeve që pasqyrojnë natyrën dhe strukturën e shpërndarjeve të objekteve në studim shpesh mbetet i pazbuluar në kuadrin e kësaj qasjeje.

Metodat Boolean. Metodat logjike të njohjes së modelit bazohen në aparatin e algjebrës logjike dhe lejojnë të operojnë me informacionin që përmbahet jo vetëm në veçori individuale, por edhe në kombinime të vlerave të veçorive. Në këto metoda, vlerat e çdo atributi konsiderohen si ngjarje elementare.

Në formën më të përgjithshme, metodat logjike mund të karakterizohen si një lloj kërkimi i modeleve logjike në kampionin e trajnimit dhe formimi i një sistemi të caktuar rregullash vendimesh logjike (për shembull, në formën e lidhjeve të ngjarjeve elementare), secila prej që ka peshën e vet. Grupi i metodave logjike është i larmishëm dhe përfshin metoda me kompleksitet dhe thellësi të ndryshme analize. Për veçoritë dikotomike (boolean), të ashtuquajturit klasifikues të ngjashëm me pemën, metoda e testimit në fund të fundit, algoritmi Kora dhe të tjera janë të njohura. Metodat më komplekse bazohen në formalizimin metodat induktive D.S. Mill. Formalizimi kryhet duke ndërtuar një teori thuajse-aksiomatike dhe bazohet në logjikën e shumëvlerësuar të shumëzgjedhur me kuantifikues mbi tupa me gjatësi të ndryshueshme.

Algoritmi Kora, si metodat e tjera logjike të njohjes së modelit, është mjaft i mundimshëm, pasi një numërim i plotë është i nevojshëm kur zgjidhni lidhjet. Prandaj, gjatë aplikimit të metodave logjike, vendosen kërkesa të larta për organizimin efikas të procesit llogaritës dhe këto metoda funksionojnë mirë me dimensione relativisht të vogla të hapësirës së veçorive dhe vetëm në kompjuterë të fuqishëm.

Metodat gjuhësore (sintaksore ose strukturore). Metodat gjuhësore të njohjes së modeleve bazohen në përdorimin e gramatikave speciale që gjenerojnë gjuhë, me ndihmën e të cilave mund të përshkruhen një sërë vetive të objekteve të njohura. Gramatika i referohet rregullave për ndërtimin e objekteve nga këta elementë jo të prejardhur.

Nëse përshkrimi i imazheve bëhet me ndihmën e elementeve jo-derivative (nën-imazhet) dhe marrëdhëniet e tyre, atëherë përdoret një qasje gjuhësore ose sintaksore për të ndërtuar sisteme automatike të njohjes duke përdorur parimin e përbashkësisë së vetive. Një imazh mund të përshkruhet duke përdorur një strukturë hierarkike të nënimazheve të ngjashme me strukturë sintaksore gjuhe. Kjo rrethanë bën të mundur zbatimin e teorisë së gjuhëve formale në zgjidhjen e problemeve të njohjes së modeleve. Supozohet se gramatika e imazheve përmban grupe të fundme elementë të quajtur variabla, elementë jo të prejardhur dhe rregulla zëvendësimi. Natyra e rregullave të zëvendësimit përcakton llojin e gramatikës. Ndër gramatikat më të studiuara janë gramatikat e rregullta, pa kontekst dhe gramatikat e përbërësve të drejtpërdrejtë. Pikat kryesore të kësaj qasjeje janë zgjedhja e elementeve jo-derivative të imazhit, bashkimi i këtyre elementeve dhe marrëdhëniet që i lidhin ato në gramatikën e imazheve dhe, së fundi, zbatimi i proceseve të analizës dhe njohjes në ato përkatëse. gjuhe. Kjo qasje është veçanërisht e dobishme kur punoni me imazhe që ose nuk mund të përshkruhen me matje numerike, ose janë aq komplekse saqë veçoritë e tyre lokale nuk mund të identifikohen dhe duhet t'i referohemi vetive globale të objekteve.

Për shembull, E.A. Butakov, V.I. Ostrovsky, I.L. Fadeev propozon strukturën e mëposhtme të sistemit për përpunimin e imazhit (Fig. 3), duke përdorur një qasje gjuhësore, ku secili prej blloqeve funksionale është një kompleks (modul) softuer (mikroprogram) që zbaton funksionet përkatëse.

Figura 3 Skema strukturore pajisje njohjeje

Përpjekjet për të aplikuar metodat e gjuhësisë matematikore në problemin e analizës së imazhit çojnë në nevojën për të zgjidhur një sërë problemesh që lidhen me hartimin e një strukture imazhi dydimensionale në zinxhirët njëdimensionale të një gjuhe formale.

Metodat Zgjeruese

Në metodat e këtij grupi, në ndryshim nga drejtimi intensiv, çdo objekti të studiuar i jepet një vlerë e pavarur diagnostike në një masë më të madhe ose më të vogël. Në thelbin e tyre, këto metoda janë afër qasjes klinike, e cila i konsideron njerëzit jo si një zinxhir objektesh të renditura sipas një ose një treguesi tjetër, por si sisteme integrale, secila prej të cilave është individuale dhe ka një vlerë të veçantë diagnostikuese. Një qëndrim i tillë i kujdesshëm ndaj objekteve të studimit nuk lejon që dikush të përjashtojë ose të humbasë informacionin për secilin objekt individual, i cili ndodh kur aplikoni metodat e drejtimit intensiv, duke përdorur objekte vetëm për të zbuluar dhe rregulluar modelet e sjelljes së atributeve të tyre.

Operacionet kryesore në njohjen e modelit duke përdorur metodat e diskutuara janë operacionet e përcaktimit të ngjashmërisë dhe ndryshimit të objekteve. Objektet në grupin e specifikuar të metodave luajnë rolin e precedentëve diagnostikues. Në të njëjtën kohë, në varësi të kushteve të një detyre të caktuar, roli i një precedenti individual mund të ndryshojë brenda kufijve më të gjerë: nga pjesëmarrja kryesore dhe përcaktuese deri te pjesëmarrja shumë indirekte në procesin e njohjes. Nga ana tjetër, kushtet e problemit mund të kërkojnë pjesëmarrjen e një numri të ndryshëm precedentësh diagnostikues për një zgjidhje të suksesshme: nga një në secilën klasë të njohur deri në madhësinë e plotë të kampionit, si dhe mënyra të ndryshme për të llogaritur masat e ngjashmërisë dhe ndryshimit të objektet. Këto kërkesa shpjegojnë ndarjen e mëtejshme të metodave zgjeruese në nënklasa:

    metoda e krahasimit të prototipit;

    k-metoda e fqinjit më të afërt;

    ekipet e rregullave të vendimmarrjes.

Metoda e krahasimit të prototipit. Kjo është metoda më e thjeshtë e njohjes zgjatuese. Përdoret, për shembull, kur klasat e njohura shfaqen në hapësirën e veçorive në grupime kompakte gjeometrike. Në këtë rast, qendra e grupimit gjeometrik të klasës (ose objekti më afër qendrës) zakonisht zgjidhet si pikë prototip.

Për të klasifikuar një objekt të panjohur, gjendet prototipi më i afërt me të dhe objekti i përket së njëjtës klasë si ky prototip. Natyrisht, në këtë metodë nuk formohen imazhe të përgjithshme të klasës.

Lloje të ndryshme distancash mund të përdoren si masë e afërsisë. Shpesh për tipare dikotomike përdoret distanca Hamming, e cila në këtë rast është e barabartë me katrorin e distancës Euklidiane. Në këtë rast, rregulli i vendimit për klasifikimin e objekteve është i barabartë me një funksion vendimi linear.

Ky fakt duhet theksuar veçanërisht. Ai tregon qartë lidhjen midis prototipit dhe paraqitjes treguese të informacionit rreth strukturës së të dhënave. Duke përdorur paraqitjen e mësipërme, për shembull, çdo shkallë matëse tradicionale, e cila është një funksion linear i vlerave të veçorive dikotomike, mund të konsiderohet si një prototip hipotetik diagnostik. Nga ana tjetër, nëse analiza e strukturës hapësinore të klasave të njohura na lejon të konkludojmë se ato janë gjeometrikisht kompakte, atëherë mjafton që secila prej këtyre klasave të zëvendësohet me një prototip, i cili në fakt është i barabartë me një model diagnostik linear.

Në praktikë, sigurisht, situata është shpesh e ndryshme nga shembulli i idealizuar i përshkruar. Një studiues që synon të aplikojë një metodë njohjeje të bazuar në krahasimin me prototipet e klasave diagnostikuese përballet me probleme të vështira. Kjo është, para së gjithash, zgjedhja e një mase afërsie (metrike), e cila mund të ndryshojë ndjeshëm konfigurimin hapësinor të shpërndarjes së objekteve. Dhe, së dyti, një problem i pavarur është analiza e strukturave shumëdimensionale të të dhënave eksperimentale. Të dyja këto probleme janë veçanërisht të mprehta për studiuesin në kushtet e dimensionit të lartë të hapësirës së veçorive, e cila është tipike për problemet reale.

Metoda e k-fqinjëve më të afërt. Metoda e k-fqinjës më të afërt për zgjidhjen e problemeve të analizës diskriminuese u propozua për herë të parë në vitin 1952. Është si më poshtë.

Gjatë klasifikimit të një objekti të panjohur, gjendet një numër i caktuar (k) i objekteve të tjera gjeometrikisht më të afërta me të në hapësirën e veçorive (fqinjët më të afërt) me përkatësi tashmë të njohur në klasa të njohura. Vendimi për t'i caktuar një objekt të panjohur një klase të caktuar diagnostikuese merret duke analizuar informacionin rreth këtij anëtarësimi të njohur të fqinjëve të tij më të afërt, për shembull, duke përdorur një numërim të thjeshtë votash.

Fillimisht, metoda k- fqinji më i afërt u konsiderua si një metodë joparametrike për vlerësimin e raportit të gjasave. Për këtë metodë, përftohen vlerësime teorike të efektivitetit të saj në krahasim me klasifikuesin optimal Bayesian. Është vërtetuar se probabilitetet e gabimit asimptotik për metodën k-fqinjit më të afërt tejkalojnë gabimet e rregullit Bayes jo më shumë se dy herë.

Siç u përmend më lart, në problemet reale shpesh është e nevojshme të operohet me objektet që përshkruhen sasi e madhe veçori cilësore (dikotomike). Në të njëjtën kohë, dimensioni i hapësirës së veçorive është në përpjesëtim me ose e tejkalon vëllimin e kampionit në studim. Në kushte të tilla, është e përshtatshme të interpretohet çdo objekt i mostrës së trajnimit si një klasifikues i veçantë linear. Atëherë kjo apo ajo klasë diagnostike përfaqësohet jo nga një prototip, por nga një grup klasifikuesish linearë. Ndërveprimi i kombinuar i klasifikuesve linearë rezulton në një sipërfaqe lineare pjesë-pjesë që ndan klasat e njohura në hapësirën e veçorive. Lloji i sipërfaqes ndarëse, i përbërë nga copa hiperplanesh, mund të jetë i larmishëm dhe varet nga pozicioni relativ koleksionet e klasifikuara.

Mund të përdoret gjithashtu një interpretim tjetër i mekanizmave të klasifikimit të fqinjit më të afërt k. Ai bazohet në idenë e ekzistencës së disa variablave latente, abstrakte ose të lidhura me ndonjë transformim me hapësirën origjinale të veçorive. Nëse distancat në çift ndërmjet objekteve në hapësirën e variablave latente janë të njëjta si në hapësirën e veçorive fillestare dhe numri i këtyre variablave është shumë më i vogël se numri i objekteve, atëherë mund të merret parasysh interpretimi i metodës k-fqinjët më të afërt. nga pikëpamja e krahasimit të vlerësimeve joparametrike të densiteteve të shpërndarjes së probabilitetit të kushtëzuar. Koncepti i variablave latente i paraqitur këtu është i afërt në natyrë me konceptin e dimensionalitetit të vërtetë dhe paraqitjeve të tjera të përdorura në metoda të ndryshme të reduktimit të dimensionalitetit.

Kur përdor metodën k-fqinjët më të afërt për njohjen e modelit, studiuesi duhet të zgjidhë problemin e vështirë të zgjedhjes së një metrike për të përcaktuar afërsinë e objekteve të diagnostikuar. Ky problem në kushtet e dimensionit të lartë të hapësirës së veçorive rëndohet jashtëzakonisht shumë për shkak të kompleksitetit të mjaftueshëm të kësaj metode, e cila bëhet e rëndësishme edhe për kompjuterët me performancë të lartë. Prandaj, këtu, ashtu si në metodën e krahasimit të prototipit, është e nevojshme të zgjidhet problemi krijues i analizimit të strukturës shumëdimensionale të të dhënave eksperimentale në mënyrë që të minimizohet numri i objekteve që përfaqësojnë klasat diagnostike.

Algoritme për llogaritjen e notave (votim). Parimi i funksionimit të algoritmeve të vlerësimit (ABO) është llogaritja e përparësisë (pikat e ngjashmërisë) që karakterizojnë "afërsinë" e objekteve të njohura dhe të referencës sipas sistemit të ansambleve të veçorive, i cili është një sistem nëngrupesh të një grupi të caktuar. të veçorive.

Ndryshe nga të gjitha metodat e konsideruara më parë, algoritmet për llogaritjen e vlerësimeve funksionojnë me përshkrimet e objekteve në një mënyrë thelbësisht të re. Për këto algoritme, objektet ekzistojnë njëkohësisht në nënhapësira shumë të ndryshme të hapësirës së veçorive. Klasa ABO sjell idenë e përdorimit të veçorive në përfundimin e saj logjik: meqenëse nuk dihet gjithmonë se cilat kombinime të veçorive janë më informuese, në ABO shkalla e ngjashmërisë së objekteve llogaritet duke krahasuar të gjitha kombinimet e mundshme ose të caktuara të veçorive. të përfshira në përshkrimet e objekteve.

Rregullat e ekipeve të vendimit. Rregulli i vendimit përdor një skemë njohjeje me dy nivele. Në nivelin e parë, funksionojnë algoritmet e njohjes private, rezultatet e të cilave kombinohen në nivelin e dytë në bllokun e sintezës. Metodat më të zakonshme të një kombinimi të tillë bazohen në ndarjen e fushave të kompetencës së një algoritmi të veçantë. Mënyra më e thjeshtë për të gjetur fushat e kompetencës është ndarja a priori e hapësirës së veçorive bazuar në konsideratat profesionale të një shkence të caktuar (për shembull, shtresimi i kampionit sipas ndonjë veçorie). Më pas, për secilën nga zonat e zgjedhura, ndërtohet algoritmi i tij i njohjes. Një metodë tjetër bazohet në përdorimin e analizave formale për të përcaktuar zonat lokale të hapësirës së veçorive si lagje të objekteve të dallueshme për të cilat është vërtetuar suksesi i çdo algoritmi të veçantë njohjeje.

Qasja më e përgjithshme për ndërtimin e një blloku sintezë i konsideron treguesit rezultues të algoritmeve të pjesshme si karakteristika fillestare për ndërtimin e një rregulli të ri të përgjithësuar të vendimit. Në këtë rast, mund të përdoren të gjitha metodat e mësipërme të drejtimeve intensive dhe zgjeruese në njohjen e modelit. Efektive për zgjidhjen e problemit të krijimit të një grupi rregullash vendimi janë algoritmet logjike të tipit "Kora" dhe algoritmet për llogaritjen e vlerësimeve (ABO), të cilat janë baza e të ashtuquajturës qasje algjebrike, e cila ofron kërkime dhe një përshkrim konstruktiv të algoritmet e njohjes, brenda të cilave përshtaten të gjitha llojet ekzistuese të algoritmeve.

Metodat e rrjetit nervor

Metodat e rrjetit nervor janë metoda të bazuara në përdorimin e llojeve të ndryshme të rrjeteve nervore (NN). Fushat kryesore të aplikimit të NN-ve të ndryshme për njohjen e modeleve dhe imazheve:

    aplikacion për nxjerrjen e karakteristikave ose veçorive kryesore të imazheve të dhëna,

    klasifikimi i vetë imazheve ose karakteristikave të nxjerra tashmë prej tyre (në rastin e parë, nxjerrja e karakteristikave kryesore ndodh në mënyrë implicite brenda rrjetit),

    zgjidhjen e problemeve të optimizimit.

Rrjetet neurale me shumë shtresa. Arkitektura e një rrjeti nervor shumështresor (MNN) përbëhet nga shtresa të lidhura në mënyrë sekuenciale, ku neuroni i secilës shtresë është i lidhur me të gjithë neuronet e shtresës së mëparshme me hyrjet e tij, dhe daljet e shtresës tjetër.

Aplikimi më i thjeshtë i një NN me një shtresë (i quajtur memorie auto-shoqëruese) është trajnimi i rrjetit për të rindërtuar imazhet e furnizimit. Duke ushqyer një imazh provë në hyrje dhe duke llogaritur cilësinë e imazhit të rindërtuar, mund të vlerësohet se sa mirë rrjeti e njohu imazhin hyrës. Vetitë pozitive Kjo metodë qëndron në faktin se rrjeti mund të rivendosë imazhe të shtrembëruara dhe të zhurmshme, por nuk është e përshtatshme për qëllime më serioze.

MNN përdoret gjithashtu për klasifikimin e drejtpërdrejtë të imazheve - hyrja është ose vetë imazhi në një formë, ose një grup karakteristikash kryesore të nxjerra më parë të imazhit, në dalje, neuroni me aktivitet maksimal tregon se i përket klasës së njohur (Fig. 4). Nëse ky aktivitet është nën një prag të caktuar, atëherë konsiderohet se imazhi i paraqitur nuk i përket asnjërës prej klasave të njohura. Procesi mësimor vendos korrespondencën e imazheve hyrëse me përkatësinë në një klasë të caktuar. Ky quhet mësim i mbikëqyrur. Kjo qasje është e mirë për detyrat e kontrollit të aksesit për një grup të vogël njerëzish. Kjo qasje ofron një krahasim të drejtpërdrejtë të vetë imazheve nga rrjeti, por me një rritje të numrit të klasave, koha e trajnimit dhe funksionimit të rrjetit rritet në mënyrë eksponenciale. Prandaj, për detyra të tilla si kërkimi person i ngjashëm në një bazë të dhënash të madhe, kërkon nxjerrjen e një grupi kompakt karakteristikash kryesore nga të cilat mund të kërkoni.

Një qasje klasifikimi duke përdorur karakteristikat e frekuencës së të gjithë imazhit është përshkruar në. U përdor një NS me një shtresë të bazuar në neurone me shumë vlera.

B tregon përdorimin e NN për klasifikimin e imazhit, kur hyrja e rrjetit merr rezultatet e dekompozimit të imazhit me metodën e komponentëve kryesorë.

Në MNS klasike, lidhjet nervore ndërshtresore janë plotësisht të lidhura, dhe imazhi përfaqësohet si një vektor njëdimensional, megjithëse është dydimensional. Arkitektura e rrjetit nervor konvolucionist synon të kapërcejë këto mangësi. Ai përdori fushat e receptorëve lokalë (duke siguruar lidhjen lokale dy-dimensionale të neuroneve), peshat e përgjithshme (duke siguruar zbulimin e disa veçorive kudo në imazh) dhe organizimin hierarkik me nënmostrim hapësinor (nën-kampionimi hapësinor). NN konvolutional (CNN) siguron rezistencë të pjesshme ndaj ndryshimeve të shkallës, zhvendosjeve, rrotullimeve, shtrembërimeve.

MNS përdoren gjithashtu për të zbuluar objekte të një lloji të caktuar. Përveç faktit që çdo MNS e trajnuar mund të përcaktojë në një farë mase përkatësinë e imazheve në klasat "e veta", ai mund të trajnohet posaçërisht për të zbuluar në mënyrë të besueshme klasa të caktuara. Në këtë rast, klasat e daljes do të jenë klasa që i përkasin dhe nuk i përkasin llojit të dhënë të imazhit. Një detektor i rrjetit nervor u përdor për të zbuluar imazhin e fytyrës në imazhin hyrës. Imazhi u skanua me një dritare prej 20x20 pikselësh, e cila futej në hyrjen e rrjetit, e cila vendos nëse zona e dhënë i përket klasës së fytyrave. Trajnimi është bërë duke përdorur shembuj pozitivë (imazhe të ndryshme fytyrash) dhe shembuj negativë (imazhe që nuk janë fytyra). Për të përmirësuar besueshmërinë e zbulimit, ne përdorëm një ekip NN të trajnuar me të ndryshëm peshat fillestare, si rezultat i të cilave Asambleja Kombëtare bëri gabime në mënyra të ndryshme dhe vendimi përfundimtar u mor me votim të të gjithë ekipit.

Figura 5. Komponentët kryesorë (eigenfaces) dhe zbërthimi i imazhit në komponentët kryesorë

NN përdoret gjithashtu për të nxjerrë karakteristikat kryesore të imazhit, të cilat më pas përdoren për klasifikimin e mëvonshëm. Në , është paraqitur një metodë për zbatimin e rrjetit nervor të metodës së analizës së komponentit kryesor. Thelbi i metodës së analizës së komponentit kryesor është të përftojë koeficientët maksimalisht të zbërthyer që karakterizojnë modelet e hyrjes. Këta koeficientë quhen komponentë kryesorë dhe përdoren për kompresimin statistikor të imazhit, në të cilin një numër i vogël koeficientësh përdoren për të përfaqësuar të gjithë imazhin. Një NN me një shtresë të fshehur që përmban N neurone (i cili është shumë më i vogël se dimensioni i imazhit), i trajnuar me metodën e përhapjes së gabimit për të rivendosur imazhin e hyrjes në dalje, gjeneron koeficientët e N komponentëve të parë kryesorë në daljen e neuronet e fshehura, të cilat përdoren për krahasim. Në mënyrë tipike, përdoren 10 deri në 200 komponentë kryesorë. Ndërsa numri i komponentëve rritet, përfaqësimi i tij zvogëlohet shumë dhe nuk ka kuptim të përdoren komponentë me numër të madh. Kur përdoren funksionet e aktivizimit jolinear të elementeve nervore, është i mundur një zbërthim jolinear në komponentët kryesorë. Jolineariteti ju lejon të pasqyroni më saktë ndryshimet në të dhënat hyrëse. Duke aplikuar analizën e komponentit kryesor në zbërthimin e imazheve të fytyrës, marrim përbërësit kryesorë, të quajtur fytyra të duhura, të cilat gjithashtu kanë një veti të dobishme - ka komponentë që kryesisht pasqyrojnë karakteristika të tilla thelbësore të fytyrës si gjinia, raca, emocionet. Kur restaurohen, komponentët duken si një fytyrë, me të parën që reflekton më së shumti formë e përgjithshme fytyrat, kjo e fundit - dallime të ndryshme të vogla midis fytyrave (Fig. 5). Kjo metodë është mirë e zbatueshme për kërkimin e imazheve të ngjashme të fytyrës në baza të të dhënave të mëdha. Gjithashtu tregohet mundësia e zvogëlimit të mëtejshëm të dimensionit të komponentëve kryesorë me ndihmën e NS. Duke vlerësuar cilësinë e rindërtimit të imazhit të hyrjes, mund të përcaktohet me shumë saktësi nëse ai i përket klasës së fytyrave.

Rrjetet nervore të rendit të lartë. Rrjetet nervore të rendit të lartë (HNN) ndryshojnë nga MNN në atë që kanë vetëm një shtresë, por hyrjet e neuroneve marrin gjithashtu terma të rendit të lartë, të cilët janë produkt i dy ose më shumë komponentëve të vektorit të hyrjes. Rrjete të tilla mund të formojnë gjithashtu sipërfaqe komplekse ndarëse.

Rrjetet neurale Hopfield. Hopfield NN (HSH) është me një shtresë dhe plotësisht i lidhur (nuk ka lidhje të neuroneve me veten e tyre), daljet e tij janë të lidhura me hyrje. Ndryshe nga MNS, NSH është relaksues, d.m.th. duke u vendosur në gjendjen fillestare, ai funksionon derisa të arrijë një gjendje të qëndrueshme, e cila do të jetë vlera e tij dalëse. Për të kërkuar një minimum global në lidhje me problemet e optimizimit, përdoren modifikime stokastike të NSH.

Përdorimi i NSH si një memorie shoqëruese ju lejon të rivendosni me saktësi imazhet me të cilat është trajnuar rrjeti kur një imazh i deformuar futet në hyrje. Në këtë rast, rrjeti do të "kujtojë" imazhin më të afërt (në kuptimin e minimumit lokal të energjisë) dhe kështu do ta njohë atë. Një funksionim i tillë mund të konsiderohet gjithashtu si një aplikim sekuencial i memories auto-asociative të përshkruar më sipër. Ndryshe nga memoria auto-shoqëruese, NSH do të rivendosë imazhin me saktësi të përsosur. Për të shmangur minimumin e ndërhyrjeve dhe për të rritur kapacitetin e rrjetit, përdoren metoda të ndryshme.

Rrjetet nervore vetë-organizuese të Kohonen. Rrjetet nervore vetë-organizuese të Kohonen (SNNCs) ofrojnë renditje topologjike të hapësirës së imazhit të hyrjes. Ato lejojnë hartëzimin topologjikisht të vazhdueshëm të hapësirës hyrëse n-dimensionale në daljen m-dimensionale, m<

Kognitron. Kognitroni në arkitekturën e tij është i ngjashëm me strukturën e korteksit vizual, ai ka një organizim hierarkik shumështresor, në të cilin neuronet midis shtresave janë të lidhur vetëm në nivel lokal. Trajnuar me mësim konkurrues (pa mësues). Çdo shtresë e trurit zbaton nivele të ndryshme të përgjithësimit; shtresa e hyrjes është e ndjeshme ndaj modeleve të thjeshta, si linjat, dhe orientimit të tyre në zona të caktuara të zonës vizuale, ndërsa përgjigja e shtresave të tjera është më komplekse, abstrakte dhe e pavarur nga pozicioni i modelit. Funksione të ngjashme zbatohen në kognitron duke modeluar organizimin e korteksit vizual.

Neocognitron është një zhvillim i mëtejshëm i idesë së kognitronit dhe pasqyron më saktë strukturën e sistemit vizual, ju lejon të njihni imazhet pavarësisht nga transformimet, rrotullimet, shtrembërimet dhe ndryshimet e shkallës së tyre.

Cognitron është një mjet i fuqishëm për njohjen e imazheve, megjithatë kërkon kosto të larta llogaritëse, të cilat aktualisht janë të paarritshme.

Metodat e konsideruara të rrjetit nervor ofrojnë njohje të shpejtë dhe të besueshme të imazhit, por kur përdoren këto metoda, lindin probleme në njohjen e objekteve tredimensionale. Megjithatë, kjo qasje ka shumë përparësi.

      konkluzioni

Aktualisht, ekziston një numër mjaft i madh i sistemeve automatike të njohjes së modeleve për probleme të ndryshme të aplikuara.

Njohja e modelit me metoda formale si drejtim themelor shkencor është i pashtershëm.

Metodat matematikore të përpunimit të imazhit kanë një gamë të gjerë aplikimesh: shkencë, teknologji, mjekësi, sferë sociale. Në të ardhmen, roli i njohjes së modeleve në jetën e njeriut do të rritet edhe më shumë.

Metodat e rrjetit nervor ofrojnë njohje të shpejtë dhe të besueshme të imazhit. Kjo qasje ka shumë përparësi dhe është një nga më premtueset.

Letërsia

    D.V. Brilyuk, V.V. Starovoitov. Metodat e rrjetit nervor për njohjen e imazhit // /

    Kuzin L.T. Bazat e Kibernetikës: Bazat e Modeleve Kibernetike. T.2. - M.: Energjia, 1979. - 584 f.

    Peregudov F.I., Tarasenko F.P. Hyrje në analizën e sistemit: Libër mësuesi. - M .: Shkolla e Lartë, 1997. - 389s.

    Temnikov F.E., Afonin V.A., Dmitriev V.I. Bazat teorike të teknologjisë së informacionit. - M.: Energjia, 1979. - 511s.

    Tu J., Gonzalez R. Principles of Pattern Recognition. / Per. nga anglishtja. - M.: Mir, 1978. - 410s.

    Winston P. Inteligjenca artificiale. / Per. nga anglishtja. - M.: Mir, 1980. - Vitet 520.

    Fu K. Metodat strukturore në njohjen e modeleve: Përkthyer nga anglishtja. - M.: Mir, 1977. - 320 shek.

    Tsypkin Ya.Z. Bazat e Teorisë së Informacionit të Identifikimit. - M.: Nauka, 1984. - Vitet 520.

    Pospelov G.S. Inteligjenca artificiale është baza e teknologjisë së re të informacionit. - M.: Nauka, 1988. - Vitet 280.

    Yu. Lifshits, Metodat statistikore të njohjes së modelit ///modern/07modernnote.pdf

    Bohr N. Fizika atomike dhe njohuritë njerëzore. / Përkthim nga anglishtja. - M.: Mir, 1961. - 151s.

    Butakov E.A., Ostrovsky V.I., Fadeev I.L. Përpunimi i imazhit në kompjuter.1987.-236s.

    Duda R., Hart P. Njohja e modelit dhe analiza e skenës. / Përkthim nga anglishtja. - M.: Mir, 1978. - Vitet 510.

    Duka V.A. Psikodiagnostika kompjuterike. - Shën Petersburg: Vëllazëria, 1994. - 365 f.

    Aizenberg I. N., Aizenberg N. N. dhe Krivosheev G. A. Neuronet binare me shumë vlera dhe universale: Algoritmet e të mësuarit, aplikacionet për përpunimin dhe njohjen e imazhit. Shënime leksioni në inteligjencën artificiale - Mësimi i makinerisë dhe nxjerrja e të dhënave në njohjen e modeleve, 1999, f. 21-35.

    Ranganath S. dhe Arun K. Njohja e fytyrës duke përdorur veçoritë e transformimit dhe rrjetet nervore. Njohja e modelit 1997, vëll. 30, fq. 1615-1622.

    Golovko V.A. Neurointeligjenca: Teoria dhe Zbatimet. Libri 1. Organizimi dhe trajnimi i rrjeteve neurale me direkte dhe reagime - Brest: BPI, 1999, - 260s.

    Vetter T. dhe Poggio T. Klasat e objekteve lineare dhe sinteza e imazhit nga një shembull i vetëm imazhi. IEEE Transactions on Pattern Analysis and Machine Intelligence 1997, Vol. 19, fq. 733-742.

    Golovko V.A. Neurointeligjenca: Teoria dhe Zbatimet. Libri 2. Vetëorganizimi, toleranca ndaj gabimeve dhe përdorimi i rrjeteve nervore - Brest: BPI, 1999, - 228s.

    Lawrence S., Giles C. L., Tsoi A. C. dhe Back A. D. Njohja e Fytyrës: Një Qasje Konvolutional Neural Network. IEEE Transactions on Neural Networks, Çështje Speciale për Rrjetet Neurale dhe Njohja e Modeleve, pp. 1-24.

    Wasserman F. Teknologjia neurokompjuterike: Teoria dhe praktika, 1992 - 184 f.

    Rowley H. A., Baluja S. dhe Kanade T. Zbulimi i fytyrës i bazuar në rrjetin nervor. IEEE Transactions on Pattern Analysis and Machine Intelligence 1998, Vol. 20, fq. 23-37.

    Valentin D., Abdi H., O "Toole A. J. dhe Cottrell G. W. Modelet lidhëse të përpunimit të fytyrës: një sondazh. IN: Pattern Recognition 1994, Vol. 27, f. 1209-1230.

    Dokumenti

    Ata përbëjnë algoritme njohjeimazhe. Metodatnjohjeimazhe Siç u përmend më lart ... realiteti nuk është ekziston"ekosistemeve në përgjithësi" dhe ekzistojnë vetëm disa ... përfundime nga kjo e detajuar rishikimmetodatnjohje kemi prezantuar në...

  1. Pasqyrë e metodave për identifikimin e njerëzve bazuar në imazhet e fytyrës, duke marrë parasysh veçoritë e njohjes vizuale

    Rishikimi

    ... njohje nga një person i objekteve me kontrast të ulët, përfshirë. persona. sjellë rishikim i zakonshëm metodat ... ekziston linjë e tërë metodat ... mënyrë, si rezultat i studimit, një platformë për zhvillimin e metodënjohje ...

  2. Imeni Glazkova Valentina Vladimirovna KËRKIM DHE ZHVILLIM I METODAVE PËR NDËRTIMIN E MJETEVE SOFTUERORE PËR KLASIFIKIM TË DOKUMENTEVE TË HYPERTEKSTIT SHUMË TEMAVE Specialiteti 05

    Abstrakt i disertacionit

    dokumentet e hipertekstit. Kapitulli përmban rishikimekzistuesemetodat zgjidhja e problemit në shqyrtim, përshkrimi ... duke prerë klasat më pak të rëndësishme // Matematikore metodatnjohjeimazhe: Konferenca e 13-të Gjith-Ruse. Rajoni i Leningradit...

  3. Slide 0 Pasqyrë e detyrave të bioinformatikës në lidhje me analizën dhe përpunimin e teksteve gjenetike

    Ligjërata

    Sekuencat e ADN-së dhe proteinave. Rishikimi detyrat e bioinformatikës si detyra ... sinjalet kërkojnë përdorimin e modernes metodatnjohjeimazhe, qasje statistikore dhe ... me densitet të ulët gjen. Ekzistuese Programet e parashikimit të gjeneve nuk...

Etj objekte që karakterizohen nga një grup i kufizuar i vetive dhe veçorive të caktuara. Detyra të tilla zgjidhen mjaft shpesh, për shembull, kur kaloni ose drejtoni një rrugë në semafor. Njohja e ngjyrës së një semafori të ndezur dhe njohja e rregullave të rrugës ju lejon të merrni vendimin e duhur nëse do të kaloni apo jo rrugën.

Nevoja për një njohje të tillë lind në një sërë fushash - nga çështjet ushtarake dhe sistemet e sigurisë deri te dixhitalizimi i sinjaleve analoge.

Problemi i njohjes së imazhit ka marrë një rëndësi të jashtëzakonshme në kushtet e mbingarkesës së informacionit, kur një person nuk mund të përballojë një kuptim linear-sekuencial të mesazheve që vijnë tek ai, si rezultat i të cilit truri i tij kalon në mënyrën e njëkohshme të perceptimit dhe të menduarit. , për të cilat është karakteristikë një njohje e tillë.

Nuk është rastësi që problemi i njohjes së imazhit doli të jetë në fushën e kërkimit ndërdisiplinor - përfshirë në lidhje me punën për krijimin e inteligjencës artificiale dhe krijimin e sistemeve teknike njohja e modelit po tërheq gjithnjë e më shumë vëmendje.

YouTube enciklopedik

    1 / 4

    Hyrje në njohjen e modeleve

    R.V. Shamin. Leksioni nr. 6 Rrjetet Hopfield dhe Hamming në problemet e njohjes së modeleve

    [DDSH-2016]: Rrjetet nervore dhe vizioni kompjuterik modern

    Leksioni 9. Zbutja eksponenciale. Njohja e modelit: kth metoda e fqinjit më të afërt

    Titra

Udhëzime në njohjen e modeleve

Ka dy drejtime kryesore:

  • Studimi i aftësive të njohjes që zotërojnë qeniet e gjalla, shpjegimi dhe modelimi i tyre;
  • Zhvillimi i teorisë dhe metodave për ndërtimin e pajisjeve të dizajnuara për të zgjidhur probleme individuale për qëllime të aplikuara.

Deklarata zyrtare e problemit

Njohja e modelit është caktimi i të dhënave fillestare në një klasë të caktuar duke theksuar veçoritë thelbësore që karakterizojnë këto të dhëna nga masa totale e të dhënave jo thelbësore.

Kur vendosin probleme të njohjes, ata përpiqen të përdorin gjuhën matematikore, duke u përpjekur - në ndryshim nga teoria e rrjeteve nervore artificiale, ku baza është të merret një rezultat përmes eksperimentit - të zëvendësojnë eksperimentin me arsyetim logjik dhe prova matematikore.

Deklarata klasike e problemit të njohjes së modelit: Jepet një grup objektesh. Ata duhet të klasifikohen. Një grup përfaqësohet nga nënbashkësi të quajtura klasa. Janë dhënë: informacion rreth klasave, një përshkrim i të gjithë grupit dhe një përshkrim i informacionit rreth një objekti që i përket një klase të caktuar nuk dihet. Kërkohet, sipas informacionit të disponueshëm për klasat dhe përshkrimit të objektit, të përcaktohet se cilës klasë i përket ky objekt.

Më shpesh, imazhet njëngjyrëshe konsiderohen në problemet e njohjes së modelit, gjë që bën të mundur që një imazh të konsiderohet si funksion në një plan. Nëse marrim parasysh një pikë të vendosur në një rrafsh T (\displaystyle T), ku funksioni shpreh në secilën pikë të imazhit karakteristikën e tij - shkëlqimin, transparencën, densitetin optik, atëherë një funksion i tillë është një regjistrim formal i figurës.

Kompleti i të gjitha funksioneve të mundshme f (x , y) (\displaystyle f(x, y)) në sipërfaqe T (\displaystyle T)- ekziston një model i grupit të të gjitha imazheve X (\displaystyle X). Prezantimi i konceptit ngjashmëritë midis imazheve, mund të vendosni detyrën e njohjes. Forma specifike e një mjedisi të tillë varet fuqimisht nga fazat pasuese të njohjes në përputhje me një ose një qasje tjetër.

Disa metoda të njohjes së imazheve grafike

Për njohjen optike të imazhit, mund të aplikoni metodën e përsëritjes mbi pamjen e një objekti në kënde të ndryshme, shkallë, zhvendosje, etj. Për shkronjat, duhet të përsërisni mbi fontin, vetitë e fontit, etj.

Qasja e dytë është gjetja e konturit të objektit dhe ekzaminimi i vetive të tij (lidhja, prania e qosheve, etj.)

Një qasje tjetër është përdorimi i rrjeteve artificiale neurale . Kjo metodë kërkon ose një numër të madh shembujsh të detyrës së njohjes (me përgjigje të sakta), ose një strukturë të veçantë të rrjetit nervor që merr parasysh specifikat e kësaj detyre.

Perceptroni si një metodë e njohjes së modelit

F. Rosenblatt, duke prezantuar konceptin e një modeli truri, detyra e të cilit është të tregojë se si mund të lindin fenomene psikologjike në një sistem fizik, struktura dhe vetitë funksionale të të cilit janë të njohura, përshkroi eksperimentet më të thjeshta mbi diskriminimin. Këto eksperimente janë tërësisht të lidhura me metodat e njohjes së modelit, por ndryshojnë në atë që algoritmi i zgjidhjes nuk është determinist.

Eksperimenti më i thjeshtë, mbi bazën e të cilit është e mundur të merren informacione të rëndësishme psikologjike për një sistem të caktuar, zbret në faktin se modeli paraqitet me dy stimuj të ndryshëm dhe kërkohet t'u përgjigjet atyre në mënyra të ndryshme. Qëllimi i një eksperimenti të tillë mund të jetë të studiojë mundësinë e diskriminimit të tyre spontan nga sistemi në mungesë të ndërhyrjes nga eksperimentuesi, ose, anasjelltas, të studiojë diskriminimin e detyruar, në të cilin eksperimentuesi kërkon të mësojë sistemin të kryejë klasifikimi i kërkuar.

Në një eksperiment mësimor, perceptroni zakonisht paraqitet me një sekuencë të caktuar imazhesh, e cila përfshin përfaqësues të secilës prej klasave që duhen dalluar. Sipas disa rregullave të modifikimit të kujtesës, zgjedhja e saktë e reagimit përforcohet. Më pas stimuli i kontrollit i paraqitet perceptronit dhe përcaktohet probabiliteti i marrjes së përgjigjes së saktë për stimujt e kësaj klase. Në varësi të faktit nëse stimuli i zgjedhur i kontrollit përputhet ose nuk përputhet me një nga imazhet që janë përdorur në sekuencën e stërvitjes, merren rezultate të ndryshme:

  1. Nëse stimuli i kontrollit nuk përkon me ndonjë nga stimujt e të mësuarit, atëherë eksperimenti shoqërohet jo vetëm me diskriminim i pastër, por përfshin edhe elemente përgjithësime.
  2. Nëse stimuli i kontrollit ngacmon një grup të caktuar elementesh shqisore që janë krejtësisht të ndryshëm nga ata elementë që janë aktivizuar nën ndikimin e stimujve të paraqitur më parë të së njëjtës klasë, atëherë eksperimenti është një hetim. përgjithësim i pastër.

Perceptronet nuk kanë aftësinë për përgjithësim të pastër, por ato funksionojnë mjaft të kënaqshme në eksperimentet e diskriminimit, veçanërisht nëse stimuli i kontrollit përkon mjaft ngushtë me një nga modelet për të cilat perceptroni ka grumbulluar tashmë një përvojë.

Shembuj të problemeve të njohjes së modelit

  • Njohja e barkodit
  • Njohja e targave
  • Njohja e imazhit
  • Njohja e zonave lokale të kores së tokës në të cilat ndodhen depozitat


Artikulli i mëparshëm: Artikulli vijues:

© 2015 .
Rreth sajtit | Kontaktet
| Harta e faqes