Otthon » 1 Leírás » Mintafelismerési módszerek. Minta felismerés

Mintafelismerési módszerek. Minta felismerés

Modern robotok látórendszerekkel felszereltek, jól látnak, hogy együtt tudjanak dolgozni a való világgal. Következtetéseket tudnak levonni arról, hogy milyen típusú tárgyak vannak jelen, milyen kapcsolataik vannak egymás között, milyen csoportokat alkotnak.

A felismerési feladat lényege annak megállapítása, hogy a vizsgált objektumok rendelkeznek-e olyan rögzített véges tulajdonsághalmazzal, amely lehetővé teszi egy bizonyos osztályba való besorolásukat.

A mintafelismerés tudományának céljai:

Humán szakértő vagy komplex szakértői rendszer cseréje egyszerűbb rendszerrel (emberi tevékenységek automatizálása vagy összetett rendszerek egyszerűsítése);

Olyan tanulási rendszerek felépítése, amelyek világos szabályok megadása nélkül tudnak döntéseket hozni, nevezetesen olyan rendszerek, amelyek maguk is képesek szintetizálni a döntéshozatali szabályokat a helyes döntések bizonyos véges számú, a rendszernek „bemutatott” példája alapján.

Felismerési feladatok a következőképpen jellemezhető.

1.Ez információs feladatok, amely két fő szakaszból áll: a forrásadatok csökkentése a felismeréshez és a felismeréshez alkalmas formára.

2. Ezekben a feladatokban bevezetheti az objektumok analógiájának és hasonlóságának fogalmát, és megfogalmazhatja az objektumok közelségének fogalmát, amely egy objektum bizonyos osztályba sorolásának alapja.

3. Ezekben a feladatokban egy olyan példakészlettel operálhat, amelynek besorolása ismert, és amely formalizált leírások formájában bemutatható a felismerési algoritmusnak, hogy a tanulási folyamat során a feladathoz igazodjon.

4. Ezekre a problémákra nehéz formális elméleteket építeni és klasszikus matematikai módszereket alkalmazni.

5. Ezekben a problémákban lehetséges a „rossz” információ.

Felismerési feladatok típusai:

A bemutatott tárgy hozzárendelése az egyik osztályhoz (tanári tréning);

Automatikus osztályozás – objektumok (helyzetek) halmazának particionálása leírásuk szerint nem átfedő osztályok rendszerébe;

Információs jellemzők halmazának kiválasztása a bontás során;

A forrásadatok felismerhetőségre alkalmas formába hozása;

Dinamikus felismerés és dinamikus osztályozás;

Előrejelzési problémák.

Alapvető definíciók

Kép– ez egy objektum vagy jelenség strukturált leírása, amelyet olyan jellemzővektor reprezentál, amelynek minden eleme az adott objektumot jellemző tulajdonságok valamelyikének számértékét reprezentálja. Más szóval: egy kép minden olyan tárgy, amelyre bizonyos numerikus jellemzők halmaza mérhető. Példa egy képre: levél, kép, kardiogram stb.

Numerikus jel(vagy csak egy jel). egy adott numerikus jellemzővel rendelkező objektum illesztési módszerének képlete vagy egyéb leírása, amely egy adott mintafelismerési feladat keretein belül működik. Minden objektumhoz több különböző jellemző, azaz több numerikus jellemző definiálható.

Feature space Egy adott felismerési feladathoz definiált N-dimenziós tér, ahol N bármely objektum mért jellemzőinek rögzített száma. A felismerési feladat objektumának megfelelő jellemzőtérből származó vektor egy N-dimenziós vektor komponensekkel (x1, x2, ..., xN), amelyek az objektum jellemzőinek értékei.

OBJEKTUM->Njellemzők->M-dimenziós jellemzővektor

Osztály- nem formalizált (általában) elképzelés egy tetszőleges objektum osztályozásának lehetőségéről a felismerési feladat objektumai közül bizonyos csoport tárgyakat. Az azonos osztályba tartozó objektumok esetében feltételezzük a „hasonlóság” jelenlétét. Egy mintafelismerési feladathoz tetszőleges számú, 1-nél nagyobb osztály definiálható. Az osztályok számát S számmal jelöljük.

Általában a mintafelismerés problémája két részből áll: a felismerésből és a képzésből.

A mintafelismerés abból áll, hogy bizonyos követelmények alapján osztályozunk egy bizonyos objektumcsoportot. Az azonos képosztályba tartozó objektumok közös tulajdonságokkal rendelkeznek. Az osztályozást meghatározó követelmények eltérőek lehetnek, mivel a különböző helyzetek különböző típusú besorolást igényelnek.

Például az angol betűk felismerésekor 26 képosztály jön létre. Az angol betűk és a kínai karakterek megkülönböztetéséhez azonban a felismerés során csak két képosztályra van szükség.

A mintafelismerés legegyszerűbb módja a mintaillesztés. Ebben az esetben egy bizonyos képkészlet, minden képosztályból egy-egy, a gép memóriájában tárolódik. A bemeneti (felismert) képet (egy ismeretlen osztályról) összehasonlítja az egyes osztályok szabványával. Az osztályozás egy előre kiválasztott illesztési vagy hasonlósági kritériumon alapul. Más szóval, ha a bemeneti kép jobban egyezik az i-edik mintaosztály szabványával, mint bármely más szabvány, akkor a bemeneti kép az i-edik mintaosztályhoz tartozik.

Ennek a megközelítésnek, vagyis a szabvánnyal való összehasonlításnak az a hátránya, hogy esetenként nehéz minden képosztályból megfelelő szabványt kiválasztani és a szükséges illeszkedési kritériumot megállapítani.

Egy fejlettebb megközelítés az, hogy az osztályozás a bemeneti képeken végzett kiválasztott mérések bizonyos halmazán alapul. Ezekről a kiválasztott mértékekről, amelyeket „jellemzőknek” nevezünk, feltételezzük, hogy invariánsok vagy érzéketlenek a gyakran előforduló eltérésekre és torzulásokra, és kevés a redundanciájuk.

A „jellemzők mérése” második megközelítésének speciális esete, amelyben a standardokat mért jellemzők formájában tárolják, és az osztályozóban speciális osztályozási kritériumot (összehasonlítást) alkalmaznak.

A jellemzőket a fejlesztők határozzák meg, és invariánsnak kell lenniük az objektumok tájolásától, méretétől és alakváltozataitól.

  • oktatóanyag

Régóta szerettem volna írni egy általános cikket, amely a képfelismerés alapjait tartalmazza, egyfajta útmutatót az alapvető módszerekről, megmondva, mikor kell használni, milyen problémákat oldanak meg, mit lehet tenni este térden állva, és mi az jobb nem gondolni anélkül, hogy 20 évesen nem lenne egy csapat ember.

Régóta írok néhány cikket az optikai felismerésről, ezért havonta párszor írnak nekem különféle emberek kérdésekkel ebben a témában. Néha az az érzésed, hogy velük élsz különböző világok. Egyrészt megérti, hogy az illető nagy valószínűséggel szakember egy kapcsolódó témában, de nagyon keveset tud az optikai felismerési módszerekről. A legbosszantóbb pedig az, hogy egy közeli tudásterületről próbál alkalmazni egy módszert, ami logikus, de képfelismerésben nem teljesen működik, de ezt nem érti, és nagyon megsértődik, ha elkezdesz neki mondani valamit. az alapoktól kezdve. És ha figyelembe vesszük, hogy az alapoktól való elmesélés sok időt vesz igénybe, ami gyakran nem elérhető, még szomorúbb lesz.

Ez a cikk azt a célt szolgálja, hogy az a személy, aki soha nem dolgozott képfelismerő módszerekkel, 10-15 percen belül kialakítson egy bizonyos, a témának megfelelő alapképet a fejében a világról, és megértse, milyen irányba kell ásni. Az itt leírt technikák közül sok alkalmazható radar- és hangfeldolgozásra.
Néhány alapelvvel kezdem, amelyeket mindig elmondunk egy potenciális vásárlónak, vagy annak, aki el akarja kezdeni az optikai felismerést:

  • Egy probléma megoldása során mindig a legegyszerűbbtől induljon el. Sokkal egyszerűbb címkét feltenni az emberre narancssárga színű mint követni egy személyt, zuhatagban kiemelve. Sokkal egyszerűbb nagyobb felbontású kamerát venni, mint szuperfelbontású algoritmust kidolgozni.
  • A probléma szigorú megfogalmazása az optikai felismerési módszerekben nagyságrendekkel fontosabb, mint a rendszerprogramozási problémáknál: egy extra szó a munka 50%-át hozzáadhatja a műszaki előírásokhoz.
  • A feladatokban nincs elismerés univerzális megoldások. Nem készíthetsz olyan algoritmust, amely egyszerűen „felismer minden feliratot”. Egy tábla az utcán és egy szöveglap alapvetően különböző tárgyak. Valószínűleg lehetséges egy általános algoritmus létrehozása (íme egy jó példa a Google-tól), de ez sok munkát igényel egy nagy csapattól, és több tucat különböző szubrutinból áll.
  • Az OpenCV egy olyan biblia, amely számos módszert tartalmaz, és szinte minden probléma 50%-át képes megoldani, de az OpenCV csak egy kis része annak, amit valójában meg lehet tenni. Egy tanulmányban a következő következtetéseket írták le: "A probléma OpenCV módszerekkel nem oldható meg, ezért megoldhatatlan." Próbálja ezt elkerülni, ne legyen lusta, és minden alkalommal józanul értékelje az aktuális feladatot a semmiből, OpenCV-sablonok használata nélkül.
Nagyon nehéz univerzális tanácsot adni, vagy megmondani, hogyan lehet létrehozni valamiféle struktúrát, amely köré tetszőleges számítógépes látási problémákra lehet megoldást építeni. Ennek a cikknek az a célja, hogy felvázolja, mi használható. Megpróbálom megtörni meglévő módszereket három csoportba. Az első csoport az előzetes szűrés és kép-előkészítés. A második csoport a szűrési eredmények logikai feldolgozása. A harmadik csoport a logikai feldolgozáson alapuló döntéshozatali algoritmusok. A csoportok közötti határok nagyon önkényesek. Egy probléma megoldásához nem mindig szükséges minden csoport módszerét alkalmazni, néha elég kettő, néha pedig egy is.

Az itt megadott módszerek listája nem teljes. Javaslom, hogy adják hozzá a megjegyzésekhez kritikus módszerek, amit nem én írtam és mindegyikhez 2-3 kísérőszót tulajdonítottam.

1. rész. Szűrés

Ebbe a csoportba azokat a módszereket helyeztem el, amelyek lehetővé teszik a képeken az érdeklődési körök kiválasztását azok elemzése nélkül. Legtöbb Ezen módszerek közül a kép minden pontjára valamilyen egyetlen transzformációt alkalmaznak. Szűrési szinten képelemzés nem történik, de a szűrt pontok speciális jellemzőkkel rendelkező területeknek tekinthetők.
Binarizálás küszöbérték szerint, hisztogramterület kiválasztása
A legegyszerűbb transzformáció a kép küszöbérték szerinti binarizálása. RGB és szürkeárnyalatos képek esetén a küszöbérték a színérték. Vannak ideális problémák, amelyekben egy ilyen átalakítás elegendő. Tegyük fel, hogy automatikusan ki szeretné jelölni az objektumokat egy fehér papírlapon:




A binarizálás küszöbértékének megválasztása nagymértékben meghatározza magát a binarizálás folyamatát. IN ebben az esetben, a képet az átlagos színnel binarizáltuk. A binarizálást általában olyan algoritmussal hajtják végre, amely adaptív módon választ ki egy küszöböt. Ilyen algoritmus lehet az elvárás vagy a mód kiválasztása. Vagy kiválaszthatja a hisztogram legnagyobb csúcsát.

A binarizálás nagyon érdekes eredményeket adhat a hisztogramokkal való munka során, beleértve azt a helyzetet is, amikor egy képet nem RGB-ben, hanem HSV-ben tekintünk. Például szegmentáld a kívánt színeket. Ezen az elven megépíthet címkedetektort és emberi bőrdetektort is.
Klasszikus szűrés: Fourier, aluláteresztő szűrő, felüláteresztő szűrő
A klasszikus radarszűrő és jelfeldolgozási módszerek számos mintafelismerési feladathoz sikeresen alkalmazhatók. Hagyományos módszer radarban, amelyet szinte soha nem használnak a képeken tiszta forma, a Fourier transzformáció (pontosabban az FFT). A képtömörítés azon kevés kivételek egyike, amelyekben az egydimenziós Fourier-transzformációt használják. A képelemzéshez általában nem elegendő az egydimenziós transzformáció, sokkal erőforrásigényesebb kétdimenziós transzformációt kell alkalmazni.

Valójában kevesen számítják ki, általában sokkal gyorsabb és egyszerűbb az érdeklődési terület konvolúciója egy kész szűrővel, magas (HPF) vagy alacsony (LPF) frekvenciára hangolva. Ez a módszer természetesen nem teszi lehetővé a spektrumelemzést, de be konkrét feladat A videófeldolgozás általában nem elemzést, hanem eredményeket igényel.


A legtöbbet egyszerű példák szűrők, amelyek kiemelik az alacsony frekvenciákat (Gauss-szűrő) és a magas frekvenciákat (Gabor-szűrő).
Minden képponthoz kiválasztunk egy ablakot, és megszorozzuk egy azonos méretű szűrővel. Egy ilyen konvolúció eredménye egy új pontérték. Aluláteresztő szűrők és felüláteresztő szűrők alkalmazásakor a következő típusú képeket kapjuk:



Hullámok
De mi van akkor, ha valamilyen tetszőleges karakterisztikus függvényt használunk a jel konvolúciójához? Ezután "Wavelet transzformáció" lesz a neve. A waveleteknek ez a definíciója nem helyes, de hagyományosan sok csapatban a wavelet-analízis egy tetszőleges minta keresése egy képen konvolúció segítségével ennek a mintának a modelljével. Van egy sor klasszikus függvény, amelyet a wavelet elemzésben használnak. Ide tartozik a Haar wavelet, a Morlet wavelet, a mexican hat wavelet stb. A Haar primitívek, amelyekről több korábbi cikkem is volt (,), a kétdimenziós tér ilyen függvényeihez kapcsolódnak.


A fentiekben 4 példa található a klasszikus waveletekre. 3 dimenziós Haar wavelet, 2 dimenziós Meyer wavelet, Mexican Hat wavelet, Daubechies wavelet. Jó példa A hullámok kiterjesztett értelmezésével felmerül a probléma, hogy megtaláljuk a tükröződést a szemben, amelynél a hullám maga a tükröződés:

A klasszikus waveleteket általában képtömörítésre vagy képosztályozásra használják (lásd alább).
Korreláció
A waveletek ilyen szabad értelmezése után a magam részéről érdemes megemlíteni az alapjául szolgáló tényleges összefüggést. Ez egy nélkülözhetetlen eszköz a képek szűréséhez. Klasszikus alkalmazás- video stream korreláció az eltolódások vagy optikai áramlások megtalálásához. A legegyszerűbb eltolásérzékelő bizonyos értelemben különbségkorrelátor is. Ahol a képek nem korreláltak, ott mozgás volt.

Szűrési funkciók
A szűrők egy érdekes osztálya a függvényszűrés. Ezek tisztán matematikai szűrők, amelyek lehetővé teszik az egyszerű felismerést matematikai függvény a képen (egyenes, parabola, kör). Egy felhalmozó kép készül, amelyben az eredeti kép minden pontjára rajzolódik az azt generáló függvénykészlet. A legklasszikusabb transzformáció a Hough transzformáció vonalakhoz. Ebben a transzformációban minden (x;y) ponthoz megrajzoljuk az y=ax+b egyenes azon (a;b) pontjait, amelyekre igaz az egyenlőség. Gyönyörű képeket kapsz:


(az első plusz annak jár, aki először talál fogást a képen és ezen a definíción és elmagyarázza, a második plusz annak jár, aki elsőként mondja ki az itt láthatót)
A Hough-transzformáció lehetővé teszi bármely paraméterezhető függvény megtalálását. Például körök. Létezik egy módosított transzformáció, amely lehetővé teszi bármilyen alakzat keresését. A matematikusok rettenetesen szeretik ezt az átalakulást. De a képek feldolgozása során sajnos nem mindig működik. Nagyon lassú sebesség, nagyon nagy érzékenység a binarizálás minőségére. Ideális helyzetekben is inkább beértem más módszerekkel.
Az egyenes vonalak Hough-transzformációjának analógja a Radon-transzformáció. Az FFT-n keresztül számítják ki, ami teljesítménynövekedést ad olyan helyzetben, amikor sok pont van. Ezenkívül nem binarizált képre is alkalmazható.
Kontúrszűrés
A szűrők külön osztálya a szegély- és kontúrszűrés. A körvonalak nagyon hasznosak, ha egy képpel való munka helyett a képen lévő objektumokkal akarunk dolgozni. Ha egy tárgy meglehetősen összetett, de jól megkülönböztethető, akkor gyakran az egyetlen mód a vele való munka a körvonalainak kiemelése. Létezik egy egész sorozat algoritmusok, a probléma megoldása szűrő áramkörök:

Leggyakrabban a Canny-t használják, ami jól működik, és amelynek implementációja OpenCV-ben van (a Sobel is ott van, de rosszabbul keresi a kontúrokat).



Egyéb szűrők
Fentebb olyan szűrők találhatók, amelyek módosításai a problémák 80-90%-ának megoldásában segítenek. De rajtuk kívül vannak ritkább szűrők, amelyeket helyi feladatokban használnak. Több tucat ilyen szűrő létezik, nem sorolom fel mindet. Érdekesek az iteratív szűrők (például egy aktív megjelenési modell), valamint a ridgelet és curvlet transzformációk, amelyek a klasszikus wavelet szűrés és analízis fúziója a radon transzformációs mezőben. A beamlet transzformáció gyönyörűen működik a wavelet transzformáció és a logikai elemzés határán, lehetővé téve a kontúrok kiemelését:

De ezek az átalakítások nagyon specifikusak és ritka feladatokra vannak szabva.

2. rész A szűrési eredmények logikai feldolgozása

A szűrés feldolgozásra alkalmas adathalmazt biztosít. De gyakran nem lehet egyszerűen átvenni és felhasználni ezeket az adatokat feldolgozás nélkül. Ebben a részben több is lesz klasszikus módszerek, amely lehetővé teszi, hogy a képről az objektumok tulajdonságaira vagy magukra az objektumokra lépjen.
Morfológia
A szűrésről a logikára való átmenet véleményem szerint a matematikai morfológia módszerei (, ,). Lényegében ezek a bináris képek növelésének és erodálásának legegyszerűbb műveletei. Ezek a módszerek lehetővé teszik a zaj eltávolítását egy bináris képből a meglévő elemek növelésével vagy csökkentésével. Léteznek matematikai morfológián alapuló kontúralgoritmusok, de általában valamilyen hibrid vagy kombinációs algoritmusokat használnak.
Kontúrelemzés
A határok megszerzésére szolgáló algoritmusokról a szűrésről szóló részben már volt szó. A kapott határvonalak egyszerűen kontúrokká alakulnak. A Canny algoritmus esetében ez automatikusan megtörténik, más algoritmusok esetében további binarizálásra van szükség. Egy bináris algoritmushoz kontúrt kaphat, például a bogár algoritmus segítségével.
A körvonal egy objektum egyedi jellemzője. Ez gyakran lehetővé teszi egy objektum körvonala alapján történő azonosítását. Van egy erős matematikai berendezés, amely lehetővé teszi ezt. Az eszközt kontúrelemzésnek nevezik (,).

Őszintén szólva soha nem tudtam kontúrelemzést alkalmazni valódi problémákat. Túl ideális körülményekre van szükség. Vagy nincs határ, vagy túl sok a zaj. De ha valamit ideális körülmények között kell felismernie, akkor a kontúrelemzés nagyszerű lehetőség. Nagyon gyorsan működik, gyönyörű matematika és tiszta logika.
Különleges pontok
A szinguláris pontok egy objektum egyedi jellemzői, amelyek lehetővé teszik az objektum önmagával vagy hasonló objektumosztályokkal való összehasonlítását. Több tucat módszer létezik az ilyen pontok azonosítására. Néhány módszer kiemeli szinguláris pontok a szomszédos képkockákban, némelyik hosszabb idő elteltével és a világítás megváltozásakor lehetővé teszi speciális pontok megtalálását, amelyek akkor is megmaradnak, ha az objektumot elforgatják. Kezdjük azokkal a módszerekkel, amelyek lehetővé teszik, hogy speciális pontokat találjunk, amelyek nem olyan stabilak, de gyorsan kiszámíthatók, majd egyre bonyolultabbá válik:
Első osztályú. Speciális pontok, amelyek másodpercek alatt stabilak. Az ilyen pontokat arra használjuk, hogy egy objektumot a szomszédos videokockák között irányítsanak, vagy a szomszédos kamerák képeit kombinálják. Ilyen pontok közé tartoznak a kép helyi maximumai, a kép sarkai (a legjobb detektor talán a Charis detektor), pontok, ahol a maximális diszperzió érhető el, bizonyos gradiensek stb.
Második osztály. Speciális pontok, amelyek stabilak a fényváltozások és a tárgy kis mozgása esetén. Az ilyen pontok elsősorban az objektumtípusok betanítására és későbbi osztályozására szolgálnak. Például a gyalogos osztályozó vagy az arcosztályozó egy pontosan ilyen pontokra épített rendszer terméke. A korábban említett hullámok némelyike ​​ilyen pontok alapja lehet. Például: Haar primitívek, kiemelések keresése, egyéb specifikus funkciók keresése. Ezek közé a pontok közé tartoznak azok, amelyeket az iránygradiensek hisztogramja (HOG) módszere talált.
Harmadik osztály. Stabil pontok. Csak két teljes stabilitást biztosító módszerről tudok és azok módosításairól. Ezek a SURF és a SIFT. Lehetővé teszik speciális pontok megtalálását még a kép elforgatásakor is. Az ilyen pontok kiszámítása más módszerekhez képest hosszabb időt vesz igénybe, de elegendő korlátozott ideig. Sajnos ezek a módszerek szabadalmaztattak. Bár Oroszországban lehetetlen az algoritmusokat szabadalmaztatni, ezért használja a hazai piacra.

3. rész. Képzés

A történet harmadik részét azoknak a módszereknek szentelik, amelyek nem működnek közvetlenül a képpel, de lehetővé teszik a döntések meghozatalát. Alapvetően az különféle módszerek gépi tanulásés a döntéshozatal. Nemrég Yandyx kurzust írt erről a témáról a Habron, ez nagyon jó választás. Itt van a szöveges változatban. A téma komoly tanulmányozásához nagyon ajánlom megtekintésüket. Itt megpróbálok felvázolni több fő módszert, amelyet kifejezetten a mintafelismerésben használnak.
A helyzetek 80%-ában a felismerési feladatban a tanulás lényege a következő:
Van egy tesztminta, amely több objektumosztályt tartalmaz. Legyen ez egy személy jelenléte/hiánya a fotón. Minden képhez tartozik egy sor olyan funkció, amelyet valamilyen funkció kiemelt, legyen az Haar, HOG, SURF vagy valamilyen wavelet. A tanuló algoritmusnak fel kell építenie egy modellt, hogy tudjon elemezni egy új képet, és eldöntse, melyik objektum van a képen.
Hogyan történik ez? A tesztképek mindegyike egy pont a jellemzőtérben. Koordinátái a képen látható egyes jellemzők súlya. Legyenek a jeleink: „Szem jelenléte”, „Orr jelenléte”, „Két kéz jelenléte”, „Fül jelenléte”, stb... Mindezeket a jeleket kiemeljük meglévő detektoraink segítségével, amelyekre képzett. az emberhez hasonló testrészek Egy ilyen térben tartózkodó személy számára a helyes pont az lenne. A majomnak, pont a lónak. Az osztályozó betanítása egy példaminta segítségével történik. De nem minden fényképen látszottak kezek, másoknak nem volt szeme, a harmadikon pedig a majomnak emberi orra volt egy osztályozó hiba miatt. Egy képzett emberi osztályozó automatikusan felosztja a jellemzőteret oly módon, hogy azt mondja: ha az első jellemző a 0,5 tartományba esik Az osztályozó célja lényegében az, hogy a jellemzőtérben olyan területeket rajzoljon meg, amelyek az osztályozási objektumokra jellemzőek. Így fog kinézni a válasz szekvenciális közelítése az egyik osztályozó (AdaBoost) esetén a kétdimenziós térben:


Nagyon sok osztályozó létezik. Mindegyik jobban működik egy adott feladatban. Egy adott feladathoz osztályozó kiválasztása nagyrészt művészet. Íme néhány gyönyörű kép a témában.
Egyszerű tok, egydimenziós elválasztás
Nézzünk egy példát az osztályozás legegyszerűbb esetére, amikor a jellemzőtér egydimenziós, és 2 osztályt kell elkülönítenünk. A helyzet gyakrabban fordul elő, mint gondolná: például amikor két jelet kell megkülönböztetnie, vagy egy mintát kell összehasonlítania egy mintával. Nézzünk egy képzési mintát. Ez olyan képet hoz létre, ahol az X-tengely a hasonlóság mértéke, az Y-tengely pedig az ilyen mértékkel rendelkező események száma. Ha a kívánt objektum hasonló önmagához, akkor bal oldali Gauss-t kapunk. Ha nem úgy néz ki, az a megfelelő. Az X=0,4 érték elválasztja a mintákat úgy, hogy egy rossz döntés minimálisra csökkenti a rossz döntés valószínűségét. Az ilyen elválasztó keresése az osztályozás feladata.


Egy kis megjegyzés. Az a kritérium, amely minimalizálja a hibát, nem mindig lesz optimális. A következő grafikon egy valós íriszfelismerő rendszer grafikonja. Egy ilyen rendszer esetében a kritériumot úgy választják meg, hogy minimálisra csökkentsék annak a valószínűségét, hogy illetéktelen személy hamisan belépjen a létesítménybe. Ezt a valószínűséget „I. típusú hibának”, „téves riasztás valószínűségének”, „téves pozitívnak” nevezik. Az angol nyelvű irodalomban „False Access Rate”.
) Az AdaBusta az egyik leggyakoribb osztályozó. Például a Haar-kaszkád épül rá. Általában akkor használják, ha bináris osztályozásra van szükség, de semmi sem akadályozza meg a nagyobb számú osztály képzését.
SVM ( , , , ) Az egyik legerősebb osztályozó, amely számos megvalósítással rendelkezik. Alapvetően azokon a tanulási feladatokon, amelyekkel találkoztam, az Adabustához hasonlóan működött. Meglehetősen gyorsnak számít, de az edzése nehezebb, mint az Adabustáé, és a megfelelő mag kiválasztását igényli.

Vannak neurális hálózatok és regresszió is. De ahhoz, hogy röviden osztályozzuk őket, és megmutassuk, miben különböznek egymástól, ennél sokkal hosszabb cikkre van szükségünk.
________________________________________________
Remélem, tudtam gyors áttekintést adni az alkalmazott módszerekről anélkül, hogy a matematikában és a leírásban merülnék el. Talán ez segít valakinek. Bár persze a cikk hiányos és egy szó sem esik a sztereó képekkel való munkáról, sem a Kalman-szűrős LSM-ről, sem az adaptív Bayes megközelítésről.
Ha tetszik a cikk, megpróbálok egy második részt is készíteni, néhány példával a meglévő ImageRecognition problémák megoldására.

És végül

Mit kell olvasni?
1) Valaha nagyon tetszett B. Yane „Digitális képfeldolgozás” című könyve, amely egyszerűen és világosan van megírva, ugyanakkor szinte minden matematika adott. Jó a meglévő módszerek megismerésére.
2) A műfaj klasszikusa R. Gonzalez, R. Woods „Digital Image Processing”. Valamiért nehezebb volt számomra, mint az első. Sokkal kevesebb matematika, de több módszer és kép.
3) „Képfeldolgozás és -elemzés számítógépes látásproblémákban” - a fizika és technológia egyik tanszékén oktatott kurzus alapján íródott. Rengeteg módszer és ezek részletes leírása létezik. De véleményem szerint a könyvnek van két nagy hátránya: a könyv erősen a hozzá tartozó szoftvercsomagra fókuszál, túl gyakran egy egyszerű módszer leírása válik matematikai dzsungellé, ahonnan nehéz kijutni; levezetni a módszer szerkezeti diagramját. De a szerzők létrehoztak egy kényelmes webhelyet, ahol szinte az összes tartalom megjelenik - wiki.technicalvision.ru Címkék hozzáadása

A meglévő mintafelismerő módszerek áttekintése

L.P. Popova , I.O. Datiev

A „felismerés” képességét az emberi lények, valamint más élő szervezetek fő tulajdonságának tekintik. A mintafelismerés a kibernetika azon ága, amely osztályozási elveket és módszereket fejleszt, valamint tárgyak, jelenségek, folyamatok, jelek, helyzetek azonosítását - mindazokat az objektumokat, amelyek az objektumot jellemző jelek vagy tulajdonságok véges halmazával írhatók le. .

A kép egy tárgy leírása. A képeknek van egy jellegzetes tulajdonsága, ami abban nyilvánul meg, hogy ugyanabból a halmazból véges számú jelenség megismerése lehetővé teszi annak tetszőleges számú képviselőjének felismerését.

A mintafelismerés elméletében két fő irányt lehet megkülönböztetni:

    az emberi lények és más élő szervezetek felismerési képességeinek tanulmányozása;

    elmélet és módszerek fejlesztése olyan eszközök megalkotására, amelyek bizonyos alkalmazási területeken egyedi mintafelismerési problémákat oldanak meg.

Továbbá a cikk ismerteti a második irány fejlesztésével kapcsolatos képfelismerő rendszerek megvalósításának problémáit, elveit és módszereit. A cikk második része a mintafelismerés neurális hálózatos módszereit tárgyalja, amelyek a mintafelismerés elméletének első irányához köthetők.

Képfelismerő rendszerek felépítésének problémái

Az automatikus mintafelismerő rendszerek építésénél felmerülő problémák általában több fő területre sorolhatók. Ezek közül az első a felismerendő tárgy mérési eredményeként kapott kiindulási adatok bemutatásához kapcsolódik érzékenységi probléma. Minden egyes mért érték egy képre vagy tárgyra jellemző. Tegyük fel például, hogy a képek alfanumerikus karakterek. Ebben az esetben az 1(a) ábrán láthatóhoz hasonló mérőretina az érzékelőben használt Ha a retina n-elemből áll, akkor a mérési eredményeket mérési vektorként vagy képvektorként is ábrázolhatjuk. ,

ahol minden xi elem például 1 értéket vesz fel, ha egy szimbólum képe áthalad az i-edik retinasejten, és a 0 értéket egyébként.

Nézzük az ábrát. 2(b). Ebben az esetben a képek a t változó folyamatos függvényei (például hangjelzések). Ha a függvényértékek mérését t1,t2, ..., tn diszkrét pontokban végezzük, akkor a képvektor úgy alakítható ki, hogy x1= f(t1),x2=f(t2),... , xn = f(tn).

1. ábra Retina mérése

A mintafelismerés második problémája a jellemző tulajdonságok vagy tulajdonságok elkülönítésével a kapott forrásadatoktól és a mintavektorok dimenziójának csökkentésével kapcsolatos. Ezt a problémát gyakran problémaként határozzák meg előfeldolgozás és funkcióválasztás.

Egy képosztály jellemzői egy adott osztály összes képére jellemző jellemző tulajdonságok. Az egyes osztályok közötti különbségeket jellemző tulajdonságok osztályközi jellemzőkként értelmezhetők. Az osztályon belüli jellemzők, amelyek minden vizsgált osztályra jellemzőek, nem hordoznak hasznos információkat a felismerés szempontjából, és előfordulhat, hogy nem veszik figyelembe. A jellemzők kiválasztását a felismerő rendszerek felépítésével kapcsolatos egyik fontos feladatnak tekintik. Ha a mérési eredmények lehetővé teszik, hogy minden osztályra a megkülönböztető jellemzők teljes készletét megkapjuk, a képek tényleges felismerése és osztályozása nem okoz különösebb nehézséget. Az automatikus felismerés ezután egy egyszerű egyeztetési folyamatra vagy eljárásokra, például táblázatszkennelésre redukálódik. A legtöbb gyakorlati felismerési probléma esetében azonban a megkülönböztető jellemzők teljes halmazának meghatározása rendkívül nehéznek, ha nem lehetetlennek bizonyul. Általában lehetséges néhány megkülönböztető jellemzőt az eredeti adatokból kinyerni, és felhasználni az automatikus mintafelismerés folyamatának egyszerűsítésére. Különösen a mérési vektorok dimenziója csökkenthető olyan transzformációk segítségével, amelyek minimalizálják az információvesztést.

A mintafelismerő rendszerek felépítésével kapcsolatos harmadik probléma az azonosításhoz és osztályozáshoz szükséges optimális döntési eljárások megtalálása. Miután a felismerendő képekről összegyűjtött adatokat pontokkal vagy mérési vektorokkal ábrázoltuk a képtérben, hagyjuk a gépet kitalálni, hogy ezek az adatok melyik képosztályhoz tartoznak. Legyen a gép megtervezve úgy, hogy megkülönböztesse az M osztályokat, amelyek jelölése w1, w2, ... ..., wm. Ebben az esetben a képteret M régióból állónak tekinthetjük, amelyek mindegyike egy osztály képeinek megfelelő pontokat tartalmaz. Ebben az esetben a felismerési feladatnak tekinthető az M osztályt elválasztó döntési területek határainak megszerkesztése a regisztrált mérési vektorok alapján. Határozzuk meg ezeket a határokat például a d1(x), d2(x),..., dm(x) döntési függvényekkel. Ezek a függvények, más néven diszkrimináns függvények, az x képének skaláris és egyértékű függvényei. Ha di (x) > dj (x), akkor az x kép a w1 osztályba tartozik. Más szóval, ha az i-edik döntési függvény di(x) a legnagyobb értékű, akkor egy ilyen, a döntéshozatali folyamat megvalósításán alapuló automatikus osztályozási séma értelmes szemléltetése az 1. ábrán látható. 2 (a diagramon a „GR” a döntési függvények generátora).

2. ábra: Automatikus osztályozási séma.

Döntő funkciókat többféle módon lehet elérni. Azokban az esetekben, amikor a felismert képekről teljes a priori információ áll rendelkezésre, a döntési funkciók pontosan ezek alapján határozhatók meg. Ha a képekről csak kvalitatív információ áll rendelkezésre, akkor ésszerű feltételezések tehetők a döntő függvények formájára vonatkozóan. Ez utóbbi esetben a megoldási területek határai jelentősen eltérhetnek a valódiaktól, ezért olyan rendszert kell létrehozni, amely képes kielégítő eredményt elérni egymás utáni korrekciók sorozatával.

Az automatikus mintafelismerő rendszerrel felismerendő és osztályozandó objektumoknak (képeknek) mérhető jellemzőkkel kell rendelkezniük. Ha egy teljes képcsoport esetében a megfelelő mérések eredményei hasonlónak bizonyulnak, akkor ezeket az objektumokat ugyanabba az osztályba tartozónak tekintjük. A mintafelismerő rendszer célja, hogy az összegyűjtött információk alapján meghatározza az objektumok egy osztályát, amelyek jellemzői hasonlóak a felismert tárgyakon mértekhez. A felismerés helyessége a mért jellemzőkben található diszkriminatív információ mennyiségétől és ezen információk felhasználásának hatékonyságától függ.

      A mintafelismerő rendszerek megvalósításának alapvető módszerei

A mintafelismerés a valós vagy ideális világban lévő objektumok numerikus vagy szimbolikus reprezentációira formális műveletek megalkotásának és alkalmazásának problémáját jelenti, amelyek eredményei tükrözik ezen objektumok közötti ekvivalencia-viszonyokat. Az ekvivalenciarelációk kifejezik a kiértékelt objektumok bármely osztályhoz való tartozását, független szemantikai egységnek tekintve.

A felismerési algoritmusok konstruálásakor az ekvivalencia osztályokat az a kutató adhatja meg, aki saját értelmes ötleteit használja, vagy külső kiegészítő információkat használ fel az objektumok hasonlóságairól és különbségeiről a megoldandó probléma kontextusában. Aztán a „tanárral való elismerésről” beszélnek. Ellenkező esetben, pl. Amikor egy automatizált rendszer külső képzési információ felhasználása nélkül old meg egy osztályozási problémát, akkor automatikus osztályozásról vagy „felügyelet nélküli felismerésről” beszélünk. A legtöbb mintafelismerő algoritmus igen jelentős számítási teljesítményt igényel, amit csak a nagy teljesítményű számítástechnika tud biztosítani.

Különféle szerzők (Yu.L. Barabash, V. I. Vasziljev, A. L. Gorelik, V. A. Skripkin, R. Duda, P. Hart, L. T. Kuzin, F. I. Peregudov, F. P. Tarasenko, Temnikov F. E., Afonin V. A., Dmitriev V. I. Gonzalez, P. Winston, K. Fu, Ya.Z. stb.) a módszerek eltérő típusát adják meg. Egyes szerzők különbséget tesznek parametrikus, nem-parametrikus és heurisztikus módszerek között, mások módszercsoportokat azonosítanak a történetileg kialakult iskolák és irányzatok alapján ezen a területen.

Ugyanakkor az ismert tipológiák nem vesznek figyelembe egy nagyon jelentős jellemzőt, amely egy tárgyterülettel kapcsolatos ismeretek bármilyen formális mintafelismerő algoritmussal történő megjelenítési módjának sajátosságait tükrözi. D.A. Pospelov a tudás bemutatásának két fő módját azonosítja:

    Intenzionális ábrázolás - attribútumok (jellemzők) közötti kapcsolatok diagramja formájában.

    Kiterjedt ábrázolás - konkrét tények (objektumok, példák) felhasználásával.

Megjegyzendő, hogy a felismerési módszereknek pontosan ez a két csoportja: a jelekkel és a tárgyakkal operálók létezése mélyen természetes. Ebből a szempontból e módszerek egyike sem teszi lehetővé, hogy a másiktól elkülönítve megfelelően tükrözzük a témakört. E módszerek között N. Bohr-i értelemben komplementaritás áll fenn, ezért az ígéretes felismerési rendszereknek mindkét módszer megvalósítását kell biztosítaniuk, nem csak az egyiket.

Így a felismerési módszerek D. A. Pospelov által javasolt osztályozása az emberi megismerési mód alapjául szolgáló alapvető mintákon alapul, ami teljesen különleges (kiváltságos) helyzetbe hozza azt a többi osztályozáshoz képest, amelyek ennél a háttérnél könnyebbnek tűnnek. mesterséges.

Intenzív módszerek

Az intenzionális módszerek sajátossága, hogy a mintafelismerő algoritmusok konstruálásakor és alkalmazásakor a jellemzők különböző jellemzőit és azok kapcsolatait műveletelemként használják fel. Ilyen elemek lehetnek egyedi értékek vagy jellemzőértékek intervallumai, átlagos értékek és eltérések, jellemző kapcsolati mátrixok stb., amelyeken műveleteket hajtanak végre, analitikus vagy konstruktív formában kifejezve. Ugyanakkor az objektumokat ezekben a módszerekben nem tekintjük integrált információs egységeknek, hanem indikátorként szolgálnak az attribútumok interakciójának és viselkedésének értékeléséhez.

A mintafelismerés intenzionális módszereinek csoportja kiterjedt, alosztályokra való felosztása bizonyos mértékig feltételes:

– a jellemzőértékek eloszlási sűrűségének becslésén alapuló módszerek

– a döntési függvények osztályára vonatkozó feltevéseken alapuló módszerek

– logikai módszerek

– nyelvi (strukturális) módszerek.

A jellemzőértékek eloszlási sűrűségének becslésén alapuló módszerek. Ezeket a mintázatfelismerési módszereket a statisztikai döntések klasszikus elméletéből kölcsönözték, amelyben a vizsgált objektumokat egy többdimenziós valószínűségi változó realizálásának tekintik, amely valamilyen törvény szerint a jellemzőtérben eloszlik. Egy Bayes-féle döntéshozatali sémán alapulnak, amely egy bizonyos elismert osztályhoz tartozó objektumok a priori valószínűségére és a jellemzővektorértékek feltételes eloszlási sűrűségére hivatkozik. Ezek a módszerek a valószínűségi arány meghatározásához vezetnek a többdimenziós jellemzőtér különböző területein.

A jellemzőértékek eloszlási sűrűségének becslésén alapuló módszerek egy csoportja közvetlenül kapcsolódik a diszkriminanciaanalízis módszereihez. A döntéshozatal Bayes-féle megközelítése a modern statisztika egyik legfejlettebb úgynevezett parametrikus módszere, amelynél az eloszlási törvény (jelen esetben a normáltörvény) analitikus kifejezése ismertnek tekinthető, és csak kis számú paraméter ( átlagértékek vektorait és kovarianciamátrixait) meg kell becsülni.

Ebbe a csoportba tartozik a független jellemzőkre vonatkozó valószínűségi arány kiszámításának módszere is. Ez a módszer – a jellemzők függetlenségének feltételezését kivéve (amely a valóságban szinte soha nem teljesül) – nem feltételezi az eloszlási törvény funkcionális formájának ismeretét. A nemparaméteres módszerek közé sorolható.

Más nem paraméteres módszerek, amelyeket akkor használnak, ha az eloszlási sűrűséggörbe alakja ismeretlen, és egyáltalán nem lehet feltételezni annak természetéről, különleges helyet foglalnak el. Ide tartozik a jól ismert többdimenziós hisztogram módszer, a „k-legközelebbi szomszédok” módszere, az euklideszi távolság módszer, a potenciálfüggvények módszere stb., melyek általánosítása a „Parzen-becslések” nevű módszer. Ezek a módszerek formálisan integrált struktúraként működnek az objektumokkal, de a felismerési feladat típusától függően intenzionális és extenzív formában is működhetnek.

A nemparaméteres módszerek az adott többdimenziós térfogatokba eső objektumok relatív számát elemzik, és különböző függvényeket használnak a tanítókészletben lévő objektumok és a felismert objektumok közötti távolság függvényében. A kvantitatív jellemzők esetében, amikor számuk jóval kisebb, mint a minta mérete, az objektumokkal végzett műveletek köztes szerepet játszanak a feltételes valószínűségek lokális eloszlási sűrűségének becslésében, és az objektumok nem viselik a független információs egységek szemantikai terhelését. Ugyanakkor, ha a jellemzők száma arányos vagy nagyobb, mint a vizsgált objektumok száma, és a jellemzők kvalitatív vagy dichotóm jellegűek, akkor nem lehet beszélni a valószínűségi eloszlási sűrűségek lokális becsléseiről. Ebben az esetben az objektumok a megadott nemparametrikus módszerekben független információs egységeknek (integrált empirikus tényeknek) tekintendők, és ezek a módszerek a vizsgált objektumok hasonlóságának és különbségének értékelését nyerik el.

Így a nem-paraméteres módszerek ugyanazon technológiai műveletei a probléma körülményeitől függően vagy a jellemzőértékek valószínűségi eloszlássűrűségének lokális becslését, vagy az objektumok hasonlóságának és különbségének becslését teszik lehetővé.

A tudás intenzionális reprezentációjával összefüggésben itt a nemparaméteres módszerek első oldalát, mint a valószínűségi eloszlássűrűség becsléseit vesszük figyelembe. Sok szerző megjegyzi, hogy a gyakorlatban a nem paraméteres módszerek, például a Parzen becslések jól működnek. E módszerek használatának fő nehézségei az, hogy meg kell emlékezni a teljes képzési mintára a helyi valószínűségi eloszlási sűrűség becsléseinek kiszámításához, valamint a betanítási minta nem reprezentatív jellegére való nagy érzékenység.

A döntési függvények osztályára vonatkozó feltevéseken alapuló módszerek. Ebben a módszercsoportban a döntési függvény általános formáját ismertnek tekintjük, és annak minőségi funkcióját határozzuk meg. Ennek a függvénynek a alapján a döntési függvény legjobb közelítését keresik a tanítási szekvenciában. A leggyakoribbak a döntési függvények lineáris és általánosított nemlineáris polinomok formájában történő megjelenítése. A döntési szabály minőségi funkciója általában osztályozási hibához kapcsolódik.

A döntési függvények osztályára vonatkozó feltevéseken alapuló módszerek fő előnye a felismerési probléma, mint szélsőségkeresési probléma matematikai megfogalmazásának egyértelműsége. A probléma megoldását gyakran valamilyen gradiens algoritmussal érik el. Az ebbe a csoportba tartozó módszerek sokféleségét a döntési szabály minőségi funkcionálisok és az alkalmazott szélsőséges keresési algoritmusok széles köre magyarázza. A vizsgált algoritmusok általánosítása, amelyek közé tartozik különösen a Newton-algoritmus, a perceptron típusú algoritmusok stb., a sztochasztikus közelítés módszere. A parametrikus felismerési módszerekkel ellentétben ennek a módszercsoportnak a sikere nem annyira az objektumok jellemzőtérbeli eloszlásának törvényeire vonatkozó elméleti elképzelések és az empirikus valóság közötti eltérésen múlik. Minden művelet egy fő célnak van alárendelve - a döntési szabály minőségi funkcionális extrémumának megtalálása. Ugyanakkor a parametrikus és a figyelembe vett módszerek eredményei hasonlóak lehetnek. Amint fentebb látható, a különböző osztályokba tartozó objektumok normál eloszlásának esetére azonos kovarianciamátrixú parametrikus módszerek lineáris döntési függvényekhez vezetnek. Vegye figyelembe azt is, hogy a lineáris diagnosztikai modellekben az informatív jellemzők kiválasztására szolgáló algoritmusok a szélsőségek keresésére szolgáló gradiens algoritmusok speciális változataiként értelmezhetők.

A gradiens szélsőséges keresési algoritmusok képességeit, különösen a lineáris döntési szabályok csoportjában, meglehetősen alaposan tanulmányozták. Ezen algoritmusok konvergenciája csak abban az esetben igazolódott, amikor a felismert objektumosztályokat a jellemzőtérben kompakt geometriai struktúrák jelenítik meg. A döntési szabály megfelelő minőségének elérésére irányuló vágy azonban gyakran kielégíthető olyan algoritmusok segítségével, amelyek nem rendelkeznek szigorú matematikai bizonyítékkal a megoldás globális szélsőséghez való konvergenciájára.

Az ilyen algoritmusok a heurisztikus programozási eljárások nagy csoportját foglalják magukban, amelyek az evolúciós modellezés irányát képviselik. Az evolúciós modellezés a természettől kölcsönzött bionikus módszer. Az ismert evolúciós mechanizmusok használatán alapul annak érdekében, hogy egy összetett objektum értelmes modellezésének folyamatát felváltsa az evolúció fenomenológiai modellezésével.

Az evolúciós modellezés jól ismert képviselője a mintafelismerésben az argumentumok csoportos elszámolásának módszere (MGUA). A GMDH alapja az önszerveződés elve, a GMDH algoritmusok pedig a tömegszelekció sémáját reprodukálják. A GMDH algoritmusokban egy általánosított polinom tagjait szintetizálják és speciális módon választják ki, amelyet gyakran Kolmogorov-Gabor polinomnak neveznek. Ezt a szintézist és szelekciót egyre bonyolultabban hajtják végre, és nem lehet előre megjósolni, hogy az általánosított polinom milyen végső formát ölt. Először általában a kezdeti jellemzők egyszerű páronkénti kombinációit veszik figyelembe, amelyekből döntési függvények egyenleteit állítják össze, általában nem magasabbak másodrendűnél. Minden egyenletet független döntési függvényként elemeznek, és az összeállított egyenletek paramétereinek értékeit így vagy úgy megtalálják a betanítási minta segítségével. Ezután az így kapott döntési függvénykészletből kiválasztjuk a legjobbakat. Az egyes döntési függvények minőségét kontroll (validációs) mintán ellenőrzik, amit néha külső összeadás elvének is neveznek. A kiválasztott részleges döntési függvényeket a továbbiakban köztes változóknak tekintjük, amelyek kiindulási érveként szolgálnak az új döntési függvények hasonló szintéziséhez stb. Az ilyen hierarchikus szintézis folyamata addig tart, amíg el nem éri a döntési függvény minőségi kritériumának szélsőértékét, ami a gyakorlatban Ennek a minőségnek a romlásában nyilvánul meg, amikor megpróbáljuk tovább növelni a polinomiális tagok sorrendjét az eredeti jellemzőkhöz képest.

A GMDH alapjául szolgáló önszerveződés elvét heurisztikus önszerveződésnek nevezzük, mivel az egész folyamat heurisztikusan kiválasztott külső kiegészítések bevezetésén alapul. A döntés eredménye jelentősen függhet ezektől a heurisztikáktól. Az eredményül kapott diagnosztikai modell attól függ, hogy az objektumokat hogyan osztják fel tanító és tesztelő mintákra, hogyan határozzák meg a felismerési minőségi kritériumot, hány változót adnak át a következő kiválasztási sorba stb.

A GMDH algoritmusok jelzett jellemzői az evolúciós modellezés más megközelítéseire is jellemzőek. De hadd jegyezzünk meg itt még egy szempontot a vizsgált módszerek közül. Ez az értelmes lényegük. A döntési függvények osztályára (evolúciós és gradiens) vonatkozó feltételezéseken alapuló módszerek segítségével nagy komplexitású diagnosztikai modelleket lehet felépíteni, és gyakorlatilag elfogadható eredményeket kapni. Ugyanakkor a gyakorlati célok elérése ebben az esetben nem jár együtt a felismert tárgyak természetére vonatkozó új ismeretek kinyerésével. Ezen ismeretek, különösen az attribútumok (jellemzők) kölcsönhatási mechanizmusaira vonatkozó ismeretek kinyerésének lehetőségét itt alapvetően korlátozza az ilyen interakció adott, a döntési funkciók kiválasztott formájában rögzített struktúrája. Ezért a legtöbb, amit egy adott diagnosztikai modell felépítése után elmondhatunk, az az, hogy felsoroljuk a jellemzők kombinációit és magukat az eredményül kapott modellben szereplő jellemzőket. A vizsgált objektumok eloszlásának természetét és szerkezetét tükröző kombinációk jelentése azonban gyakran nem tisztázott e megközelítés keretein belül.

Boole-módszerek. A mintázatfelismerés logikai módszerei a logikai algebra apparátusán alapulnak, és lehetővé teszik, hogy ne csak az egyes jellemzőkben, hanem a jellemzőértékek kombinációiban is szereplő információkkal dolgozzunk. Ezekben a módszerekben bármely attribútum értéke elemi eseménynek számít.

A legáltalánosabb formában a logikai módszerek egyfajta keresésként jellemezhetők a logikai minták betanító mintáján és egy bizonyos logikai döntési szabályrendszer kialakításán keresztül (például elemi események konjunkciói formájában), minden egyes amelynek megvan a maga súlya. A logikai módszerek csoportja változatos, és különböző összetettségű és mélységű elemzési módszereket foglal magában. A dichotóm (Boole-féle) jellemzők esetében népszerűek az úgynevezett faszerű osztályozók, a zsákutcás vizsgálati módszer, a „Bark” algoritmus és mások. A bonyolultabb módszerek D.S. Mill induktív módszereinek formalizálásán alapulnak. A formalizálást egy kvázi-axiomatikus elmélet felépítésével hajtják végre, és sokféleképpen rendezett sokértékű logikán alapul, változó hosszúságú sorok kvantorjaival.

A „Kora” algoritmus a mintafelismerés többi logikai módszeréhez hasonlóan meglehetősen munkaigényes, mivel a kötőszavak kiválasztásakor teljes keresésre van szükség. Ezért a logikai módszerek alkalmazásakor magas követelményeket támasztanak a számítási folyamat hatékony megszervezésével szemben, és ezek a módszerek viszonylag kis jellemzőtérrel és csak nagy teljesítményű számítógépeken működnek jól.

Nyelvi (szintaktikai vagy szerkezeti) módszerek. A mintafelismerés nyelvi módszerei olyan speciális nyelvtanok használatán alapulnak, amelyek nyelveket generálnak, amelyek segítségével a felismert objektumok tulajdonságainak halmaza leírható. A nyelvtan az objektumok ezekből a nem származtatott elemekből való felépítésének szabályaira utal.

Ha a képek leírása nem származékos elemek (alképek) és azok kapcsolatainak felhasználásával történik, akkor a tulajdonságok általánosságának elvét alkalmazó nyelvi vagy szintaktikai megközelítést alkalmazzák az automatikus felismerő rendszerek felépítéséhez. Egy kép leírható a részképek hierarchikus struktúrájával, hasonlóan a nyelv szintaktikai struktúrájához. Ez a körülmény lehetővé teszi a formális nyelvek elméletének alkalmazását képfelismerési problémák megoldása során. Feltételezzük, hogy egy képnyelvtan véges elemhalmazokat tartalmaz, amelyeket változóknak, nem származékos elemeknek és helyettesítési szabályoknak neveznek. A helyettesítési szabályok természete határozza meg a nyelvtan típusát. A legtöbbet tanulmányozott nyelvtanok között megemlíthetjük a reguláris, kontextus nélküli és a közvetlen komponensű nyelvtanokat. Ennek a megközelítésnek a kulcspontjai a kép nem származékos elemeinek kiválasztása, ezeknek az elemeknek és az őket összekötő kapcsolatoknak a képnyelvtanokká való kombinációja, végül pedig az elemzési és felismerési folyamatok megfelelő nyelven történő megvalósítása. Ez a megközelítés különösen akkor hasznos, ha olyan képekkel dolgozunk, amelyek vagy nem írhatók le numerikus mérésekkel, vagy olyan összetettek, hogy helyi jellemzőik nem azonosíthatók, és az objektumok globális tulajdonságaihoz kell fordulni.

Például E.A. Butakov, V.I. Osztrovszkij, I.L. Fadeev a következő rendszerstruktúrát javasolja a képfeldolgozáshoz (3. ábra), nyelvi megközelítést alkalmazva, ahol a funkcionális blokkok mindegyike egy szoftver (mikroprogram) komplexum (modul), amely megvalósítja a megfelelő funkciókat.

3. ábra A felismerő eszköz blokkvázlata

A matematikai nyelvészet módszereinek a képelemzés problémájára történő alkalmazására tett kísérletek számos olyan probléma megoldásához vezetnek, amelyek egy kép kétdimenziós szerkezetének egy formális nyelv egydimenziós láncaira való leképezésével kapcsolatosak.

Kiterjesztési módszerek

Ennek a csoportnak a módszereiben az intenzionális iránytól eltérően minden vizsgált objektum kisebb-nagyobb mértékben önálló diagnosztikai jelentőséget kap. Ezek a módszerek lényegükben közel állnak a klinikai megközelítéshez, amely az embert nem objektumok láncolatának tekinti, amelyeket egyik vagy másik indikátor rangsorol, hanem integrált rendszerként, amelyek mindegyike egyedi és különleges diagnosztikai értékkel bír. A kutatás tárgyaihoz való ilyen körültekintő hozzáállás nem teszi lehetővé az egyes objektumok információinak kizárását vagy elvesztését, ami akkor történik, ha olyan intenzív iránymódszereket használnak, amelyek az objektumokat csak tulajdonságaik viselkedési mintáinak észlelésére és rögzítésére használják.

A tárgyalt módszerekkel végzett mintafelismerés fő műveletei az objektumok hasonlóságának és különbségének meghatározására szolgáló műveletek. A meghatározott módszercsoportba tartozó objektumok diagnosztikai precedensek szerepét töltik be. Sőt, egy-egy konkrét feladat körülményeitől függően az egyéni precedens szerepe a legtágabb határokon belül változhat: a fő és meghatározó szereptől az elismerési folyamatban való nagyon közvetett részvételig. A probléma körülményei viszont a sikeres megoldáshoz eltérő számú diagnosztikai precedens részvételét követelhetik meg: minden elismert osztályban egytől a teljes mintaméretig, valamint különböző módszereket az objektumok közötti hasonlóság és különbség mértékének kiszámításához. . Ezek a követelmények megmagyarázzák a kiterjesztési módszerek további alosztályokra való felosztását:

    a prototípussal való összehasonlítás módszere;

    k-legközelebbi szomszédok módszere;

    döntési szabályok együttesei.

A prototípussal való összehasonlítás módja. Ez a legegyszerűbb kiterjesztési felismerési módszer. Ez például akkor használatos, amikor a felismert osztályok kompakt geometriai csoportosítással jelennek meg a jellemzőtérben. Ebben az esetben általában az osztály geometriai csoportosításának középpontját (vagy a középponthoz legközelebb eső objektumot) választják ki prototípuspontként.

Egy ismeretlen objektum osztályozásához meg kell találni a legközelebbi prototípust, és az objektum ugyanabba az osztályba tartozik, mint ez a prototípus. Nyilvánvaló, hogy ezzel a módszerrel nem generálnak általánosított osztályképeket.

Különféle távolságok használhatók a közelség mérésére. A dichotóm jellemzők esetében gyakran a Hamming-távolságot használják, amely ebben az esetben egyenlő az euklideszi távolság négyzetével. Ebben az esetben az objektumok osztályozásának döntési szabálya egyenértékű a lineáris döntési függvénnyel.

Ezt a tényt különösen meg kell jegyezni. Világosan szemlélteti a kapcsolatot a prototípus és az adatok szerkezetére vonatkozó információ attribútum-reprezentációja között. A fenti ábrázolás segítségével például bármilyen hagyományos mérési skála, amely a dichotóm jellemzők értékeinek lineáris függvénye, tekinthető hipotetikus diagnosztikai prototípusnak. Ha viszont a felismert osztályok térszerkezetének elemzése lehetővé teszi, hogy következtetést vonjunk le geometriai tömörségükre, akkor elegendő ezen osztályok mindegyikét egy prototípussal helyettesíteni, amely valójában egy lineáris diagnosztikai modellnek felel meg.

A gyakorlatban persze sokszor eltér a helyzet a leírt idealizált példától. Nehéz problémákkal néz szembe az a kutató, aki prototípus diagnosztikai osztályokkal való összehasonlításon alapuló felismerési módszert kíván alkalmazni. Ez mindenekelőtt a közelségi mérték (metrika) megválasztása, amely jelentősen megváltoztathatja az objektumok eloszlásának térbeli konfigurációját. Másodsorban pedig független probléma a kísérleti adatok többdimenziós struktúráinak elemzése. Mindkét probléma különösen akut a kutató számára a jellemzőtér nagy dimenziós körülményei között, ami a valós problémákra jellemző.

A k-legközelebbi szomszédok módszere. A k-legközelebbi szomszédok módszerét a diszkriminanciaelemzési problémák megoldására először 1952-ben javasolták. Ez a következő.

Egy ismeretlen objektum osztályozása során a felismert osztályokhoz már ismert tagsággal rendelkező egyéb objektumok (legközelebbi szomszédok) jellemzőinek terében egy adott számú (k) számot találunk hozzá geometriailag legközelebb. A döntés egy ismeretlen objektum egy adott diagnosztikai osztályhoz való hozzárendeléséről a legközelebbi szomszédok ismert hovatartozására vonatkozó információk elemzésével történik, például egy egyszerű szavazatszámlálás segítségével.

Kezdetben a k-legközelebbi szomszédok módszerét nem paraméteres módszernek tekintették a valószínűségi arány becslésére. Ehhez a módszerhez elméleti becsléseket kaptunk a hatékonyságáról az optimális Bayes-osztályozóval összehasonlítva. Bebizonyosodott, hogy a k-legközelebbi szomszédok módszerének aszimptotikus hibavalószínűsége legfeljebb kétszer haladja meg a Bayes-szabály hibáit.

Ahogy fentebb megjegyeztük, valós problémák esetén gyakran olyan objektumokkal kell dolgozni, amelyeket nagyszámú minőségi (dichotóm) jellemző ír le. Ebben az esetben a jellemzőtér mérete arányos vagy meghaladja a vizsgált minta térfogatát. Ilyen körülmények között célszerű a betanítási minta minden objektumát külön lineáris osztályozóként értelmezni. Ekkor ezt vagy azt a diagnosztikai osztályt nem egy prototípus, hanem lineáris osztályozók halmaza képviseli. A lineáris osztályozók kombinált kölcsönhatása végül egy darabonkénti lineáris felületet eredményez, amely elválasztja a felismert osztályokat a jellemzőtérben. A hipersík darabokból álló osztófelület típusa változhat, és az osztályozott aggregátumok egymáshoz viszonyított helyzetétől függ.

Az osztályozási mechanizmusok másik, a k-legközelebbi szomszédok szabályt használó értelmezése is használható. Néhány látens változó létezésén alapul, amelyek absztrakt vagy valamilyen transzformációval kapcsolódnak az eredeti jellemzőtérhez. Ha a látens változók terében az objektumok közötti páronkénti távolságok megegyeznek az eredeti jellemzők terével, és e változók száma lényegesen kevesebb, mint az objektumok száma, akkor a k-legközelebbi szomszédok módszer értelmezése a feltételes valószínűségi eloszlássűrűség nemparaméteres becsléseinek összehasonlítása szempontjából kell figyelembe venni. Az itt bemutatott látens változók nézete természeténél fogva közel áll a valódi dimenzionalitás nézetéhez és más, a különféle dimenziócsökkentési technikákban használt nézetekhez.

Amikor a k-legközelebbi szomszédok módszerét alkalmazzuk a mintafelismerésre, a kutatónak meg kell oldania a metrika kiválasztásának nehéz problémáját a diagnosztizált objektumok közelségének meghatározásához. Ez a probléma a jellemzőtér nagy dimenziójú körülményei között rendkívül súlyosbodik a módszer kellő összetettsége miatt, amely még a nagy teljesítményű számítógépek esetében is jelentőssé válik. Ezért itt is, csakúgy, mint a prototípussal való összehasonlításnál, meg kell oldani a kísérleti adatok többdimenziós szerkezetének elemzésének kreatív problémáját, hogy minimalizáljuk a diagnosztikai osztályokat reprezentáló objektumok számát.

Az értékelések kiszámításának algoritmusai (szavazás). Az értékelési számítási algoritmusok (ABO) működési elve, hogy a felismert és referenciaobjektumok „közelségét” jellemző prioritást (hasonlósági pontszámokat) a jellemzőegyüttesek rendszere szerint számítják ki, amely egy adott jellemzőhalmaz részhalmazainak rendszere. .

Az összes korábban tárgyalt módszertől eltérően a becslések kiszámítására szolgáló algoritmusok alapvetően új módon működnek az objektumleírásokkal. Ezeknél az algoritmusoknál az objektumok egyidejűleg léteznek a jellemzőtér nagyon különböző altereiben. Az ABO osztály a jellemzők használatának gondolatát a logikus következtetésre viszi: mivel nem mindig ismert, hogy a jellemzők melyik kombinációja a leginformatívabb, ezért az ABO-ban az objektumok hasonlóságának mértékét az összes lehetséges vagy konkrét kombináció összehasonlításával számítják ki. a tárgyak leírásában szereplő jellemzők.

Döntési szabályok együttesei. A döntési szabály kétszintű felismerési sémát használ. Az első szinten privát felismerő algoritmusok működnek, amelyek eredményeit a második szinten kombinálják a szintézis blokkban. Az ilyen egyesítés leggyakoribb módszerei egy adott algoritmus kompetenciaterületeinek azonosításán alapulnak. A kompetenciaterületek megtalálásának legegyszerűbb módja az attribútumok terének előzetes felosztása egy adott tudomány szakmai szempontjai alapján (például a minta rétegezése egy adott attribútum szerint). Ezután minden kiválasztott területhez saját felismerési algoritmus épül fel. Egy másik módszer a formális elemzésen alapul, hogy meghatározza a jellemzőtér helyi területeit olyan felismert objektumok szomszédságaként, amelyekre bármely felismerési algoritmus sikeressége bizonyított.

A szintézisblokk felépítésének legáltalánosabb megközelítése az egyes algoritmusok eredő indikátorait tekinti az új általánosított döntési szabály megalkotásának kezdeti jellemzőinek. Ebben az esetben a mintafelismerésben a fenti intenzációs és kiterjesztési irányok mindegyike használható. A döntési szabályok összeállításának problémájának megoldására hatékonyak a „Kora” típusú logikai algoritmusok és a becslések kiszámítására szolgáló algoritmusok (ABO), amelyek az ún. algebrai megközelítés alapját képezik, amely a probléma tanulmányozását és konstruktív leírását adja. felismerési algoritmusok, amelyek keretébe minden létező típusú algoritmus belefér.

Neurális hálózati módszerek

A neurális hálózati módszerek különféle típusú neurális hálózatok (NN) használatán alapuló módszerek. A különböző neurális hálózatok fő alkalmazási területei minta- és képfelismerésre:

    alkalmazás adott képek legfontosabb jellemzőinek vagy jellemzőinek kinyerésére,

    maguknak a képeknek vagy a belőlük már kinyert jellemzőknek osztályozása (az első esetben a kulcsjellemzők kinyerése implicit módon a hálózaton belül történik),

    optimalizálási problémák megoldása.

Többrétegű neurális hálózatok. A többrétegű neurális hálózat (MNN) architektúrája szekvenciálisan összefüggő rétegekből áll, ahol az egyes rétegek neuronjai a bemeneteivel az előző réteg összes neuronjához, a következő kimeneteihez kapcsolódnak.

Az egyrétegű neurális hálózat (úgynevezett auto-asszociatív memória) legegyszerűbb alkalmazása a hálózat betanítása a betáplált képek rekonstruálására. Egy tesztkép bemenetként való betáplálásával és a rekonstruált kép minőségének kiszámításával kiértékelheti, hogy a hálózat mennyire ismerte fel a bemeneti képet. A módszer pozitív tulajdonságai, hogy a hálózat képes visszaállítani a torz és zajos képeket, de komolyabb célokra nem alkalmas.

Az MNN-t a kép közvetlen osztályozására is használják - vagy magát a képet valamilyen formában, vagy a kép korábban kivont kulcsjellemzőinek halmazát adják be a kimeneten, a maximális aktivitású neuron jelzi a felismert osztályba való tartozást (ábra). 4). Ha ez a tevékenység egy bizonyos küszöb alatt van, akkor a beküldött kép nem tartozik az ismert osztályok egyikébe sem. A tanulási folyamat megállapítja, hogy a bemenetre szállított képek megfelelnek-e egy bizonyos osztályhoz való tartozásnak. Ezt hívják felügyelt tanulásnak. Ez a megközelítés jó kis embercsoport beléptetési feladataihoz. Ez a megközelítés biztosítja, hogy a hálózat közvetlenül összehasonlítsa magát a képeket, de az osztályok számának növekedésével a hálózat betanítási és működési ideje exponenciálisan növekszik. Ezért az olyan feladatokhoz, mint például egy hasonló személy megtalálása egy nagy adatbázisban, kulcsfontosságú jellemzők tömör halmazának kinyerésére van szükség a keresés alapjául.

A teljes kép frekvenciakarakterisztikáját használó osztályozási megközelítést a cikkben ismertetjük. Több értékű neuronokon alapuló egyrétegű neurális hálózatot használtak.

A neurális hálózat képosztályozási alkalmazása akkor jelenik meg, amikor a hálózati bemenet megkapja a képfelbontás eredményeit a főkomponens módszerrel.

A klasszikus MNN-ben a rétegközi neurális kapcsolatok teljesen összekapcsolódnak, és a kép egydimenziós vektorként jelenik meg, bár kétdimenziós. A konvolúciós neurális hálózati architektúra ezeket a hiányosságokat hivatott kiküszöbölni. Helyi receptormezőket (a neuronok lokális, kétdimenziós összeköttetését biztosító), megosztott súlyokat (bizonyos jellemzők detektálását a képen bárhol) és hierarchikus rendszerezést használt térbeli almintavétellel. A konvolúciós neurális hálózat (CNN) részleges ellenállást biztosít a léptékváltozásokkal, eltolódásokkal, elforgatással és torzításokkal szemben.

Az MNN-eket bizonyos típusú objektumok észlelésére is használják. Amellett, hogy bármely képzett MNN bizonyos mértékig meg tudja határozni, hogy a képek az „saját” osztályaihoz tartoznak-e, speciálisan kiképezhető bizonyos osztályok megbízható észlelésére. Ebben az esetben a kimeneti osztályok az adott képtípushoz tartozó és nem tartozó osztályok lesznek. Neurális hálózati detektort használtunk az arckép észlelésére a bemeneti képen. A képet egy 20x20 pixeles ablak szkennelte be, amelyet a hálózat bemenetére tápláltunk, amely eldönti, hogy egy adott terület az arcok osztályába tartozik-e. A képzést pozitív példák (különféle arcképek) és negatív példák (nem arcképek) felhasználásával végeztük. Az észlelés megbízhatóságának növelése érdekében a neurális hálók egy csapatát alkalmazták, amelyet különböző kezdeti súllyal képeztek ki, aminek következtében a neurális hálózatok különböző módon hibáztak, és a végső döntést a teljes csapat szavazásával hozták meg.

5. ábra Főbb komponensek (saját arcok) és a kép főkomponensekre bontása

Neurális hálózatot is használnak a kulcsfontosságú képjellemzők kinyerésére, amelyeket aztán a későbbi osztályozáshoz használnak fel. A -ban egy módszert mutatunk be a főkomponens-elemzési módszer neurális hálózati megvalósítására. A főkomponens-elemzési módszer lényege, hogy a bemeneti képeket jellemző maximálisan dekorált együtthatókat kapjunk. Ezeket az együtthatókat főkomponenseknek nevezzük, és statisztikai képtömörítésre használják, amelyben kis számú együtthatót használnak a teljes kép megjelenítésére. Egy N neuronból álló rejtett rétegű neurális hálózat (amely sokkal kisebb, mint a képdimenzió), amelyet a backpropagation módszerrel képeztek ki a bemenetként megadott kimeneti kép visszaállítására, generálja az első N főkomponens együtthatóit a rejtett neuronok kimenetén. , amelyeket összehasonlításra használunk. Általában 10-200 fő összetevőt használnak. Egy komponens számának növekedésével a reprezentativitása nagymértékben csökken, és nincs értelme nagyobb számú komponenst használni. A neurális elemek nemlineáris aktiválási függvényeinek alkalmazásakor lehetséges a nemlineáris bontás főkomponensekre. A nemlinearitás lehetővé teszi a bemeneti adatok változásainak pontosabb tükrözését. Az arcképek dekompozíciójára főkomponens-analízist alkalmazva főkomponenseket, úgynevezett sajátarcokat kapunk, amelyeknek van egy hasznos tulajdonsága is - vannak olyan komponensek, amelyek elsősorban az arc olyan lényeges tulajdonságait tükrözik, mint a nem, faj, érzelmek. A komponensek rekonstruálva arcszerű megjelenésűek, az előbbi az arc legáltalánosabb alakját, az utóbbi az arcok közötti kisebb eltéréseket tükrözi (5. ábra). Ez a módszer kiválóan alkalmas nagy adatbázisokban lévő arcok hasonló képeinek megkeresésére. Szintén látható a főkomponensek méretének további csökkentése NN használatával. A bemeneti kép rekonstrukciójának minőségének felmérésével nagyon pontosan meghatározhatja az arcok osztályába való tartozását.

Magasrendű neurális hálózatok. A magasrendű neurális hálózatok (HANN-ok) abban különböznek az MNN-ektől, hogy csak egy rétegük van, de az idegsejtek bemenetei is kapnak magasrendű kifejezéseket, amelyek a bemeneti vektor két vagy több komponensének szorzata. Az ilyen hálózatok összetett elválasztó felületeket is alkothatnak.

Hopfield neurális hálózatok. A Hopfield NN (HNS) egyrétegű és teljesen csatlakoztatott (magukon a neuronok között nincs kapcsolat), kimenetei a bemenetekre csatlakoznak. Az MNS-től eltérően az NSC relaxáció - azaz. a kezdeti állapotba állítva addig működik, amíg el nem éri a stabil állapotot, ami lesz a kimeneti értéke. Az optimalizálási problémákkal kapcsolatos globális minimum kereséséhez az NSC sztochasztikus módosításait használják.

Az NSH asszociatív memóriaként való használata lehetővé teszi azoknak a képeknek a pontos visszaállítását, amelyekre a hálózat betanítva van, ha torz kép kerül a bemenetre. Ebben az esetben a hálózat „emlékezni fog” a legközelebbi (a lokális minimális energia értelmében vett) képre, és így felismeri azt. Az ilyen működés az autoasszociatív memória fent leírt szekvenciális alkalmazásaként is ábrázolható. Az automatikus asszociatív memóriával ellentétben az NSC ideális esetben pontosan visszaállítja a képet. Az interferencia minimumok elkerülése és a hálózati kapacitás növelése érdekében különféle módszereket alkalmaznak.

Önszerveződő Kohonen neurális hálózatok. Az önszerveződő Kohonen neurális hálózatok (KONN-ok) biztosítják a bemeneti képtér topológiai rendezését. Lehetővé teszik egy n-dimenziós bemeneti tér topológiailag folyamatos leképezését egy m-dimenziós kimeneti térré, m<

Cognitron. A Cognitron felépítése hasonló a vizuális kéreg szerkezetéhez, hierarchikus többrétegű szervezete van, amelyben a rétegek közötti neuronok csak lokálisan kapcsolódnak egymáshoz. Versenyképes tanulással tanult (tanár nélkül). Az agy minden rétege különböző szintű általánosítást valósít meg; a bemeneti réteg érzékeny az egyszerű mintákra, például vonalakra, és azok tájolására a vizuális tartomány bizonyos területein, míg a többi réteg válasza összetettebb, absztraktabb és független a minta helyzetétől. Hasonló funkciókat valósítanak meg a kognitronban a látókéreg szerveződésének modellezésével.

A Neocognitron a kognitron gondolatának továbbfejlesztése, és pontosabban tükrözi a vizuális rendszer szerkezetét, lehetővé teszi a képek felismerését, függetlenül azok átalakulásától, elforgatásától, torzulásától és léptékváltozásától.

A Cognitron egy hatékony képfelismerő eszköz, de magas számítási költségeket igényel, amelyek jelenleg elérhetetlenek.

A vizsgált neurális hálózati módszerek gyors és megbízható képfelismerést biztosítanak, de ezek alkalmazásakor problémák merülnek fel a háromdimenziós objektumok felismerésében. Ennek a megközelítésnek azonban számos előnye van.

      Következtetés

Jelenleg meglehetősen nagyszámú automatikus mintafelismerő rendszer létezik különféle alkalmazott feladatokra.

A formális módszerekkel történő mintafelismerés mint alapvető tudományos irányzat kimeríthetetlen.

A képfeldolgozás matematikai módszerei széles körben alkalmazhatók: tudomány, technológia, orvostudomány, szociális szféra. A jövőben a mintafelismerés szerepe az emberi életben még inkább megnő.

A neurális hálózati módszerek gyors és megbízható képfelismerést biztosítanak. Ez a megközelítés számos előnnyel jár, és az egyik legígéretesebb.

Irodalom

    D.V. Brilyuk, V.V. Starovoitov. Neurális hálózati módszerek képfelismerésre // /

    Kuzin L.T. A kibernetika alapjai: A kibernetikai modellek alapjai. T.2. - M.: Energia, 1979. - 584 p.

    Peregudov F.I., Tarasenko F.P. Bevezetés a rendszerelemzésbe: Tankönyv. – M.: Felsőiskola, 1997. - 389 p.

    Temnyikov F.E., Afonin V.A., Dmitriev V.I. Az információs technológia elméleti alapjai. - M.: Energia, 1979. - 511 p.

    Tu J., Gonzalez R. A mintafelismerés elvei. /Ford. angolból - M.: Mir, 1978. - 410 p.

    Winston P. Mesterséges intelligencia. /Ford. angolból - M.: Mir, 1980. - 520 p.

    Fu K. Strukturális módszerek a mintafelismerésben: Angolból fordítva. - M.: Mir, 1977. - 320 p.

    Tsypkin Ya.Z. Az azonosítás információelméletének alapjai. - M.: Nauka, 1984. - 520 p.

    Pospelov G.S. A mesterséges intelligencia az új információs technológia alapja. - M.: Nauka, 1988. - 280 p.

    Yu Lifshits, A mintafelismerés statisztikai módszerei ///modern/07modernnote.pdf

    Bohr N. Atomfizika és emberi megismerés. /Angolból fordítva - M.: Mir, 1961. - 151 p.

    Butakov E.A., Osztrovszkij V.I., Fadeev I.L. Képfeldolgozás számítógépen.1987.-236p.

    Duda R., Hart P. Mintafelismerés és jelenetelemzés. /Angolból fordítva - M.: Mir, 1978. - 510 p.

    Duke V.A. Számítógépes pszichodiagnosztika. - Szentpétervár: Testvériség, 1994. - 365 p.

    Aizenberg I. N., Aizenberg N. N. és Krivosheev G. A. Többértékű és univerzális bináris neuronok: Tanulási algoritmusok, alkalmazások a képfeldolgozáshoz és -felismeréshez. Lecture Notes in Artificial Intelligence – Machine Learning and Data Mining in Pattern Recognition, 1999, pp. 21-35.

    Ranganath S. és Arun K. Arcfelismerés transzformációs funkciók és neurális hálózatok segítségével. Mintafelismerés 1997, 1. évf. 30, pp. 1615-1622.

    Golovko V.A. Neurointelligencia: elmélet és alkalmazások. 1. könyv Közvetlen és visszacsatoló kapcsolatokkal rendelkező neurális hálózatok szervezése és képzése - Brest: BPI, 1999, - 260 pp.

    Vetter T. és Poggio T. Lineáris objektumosztályok és képszintézis egyetlen példaképből. IEEE Transactions on Pattern Analysis and Machine Intelligence 1997, Vol. 19, pp. 733-742.

    Golovko V.A. Neurointelligencia: elmélet és alkalmazások. 2. könyv Neurális hálózatok önszerveződése, hibatűrése és alkalmazása - Brest: BPI, 1999, - 228 p.

    Lawrence S., Giles C. L., Tsoi A. C. és Back A. D. Arcfelismerés: konvolúciós neurális hálózat megközelítés. IEEE Transactions on Neural Networks, Special Issue on Neural Networks and Pattern Recognition, pp. 1-24.

    Wasserman F. Neuroszámítógép technológia: Elmélet és gyakorlat, 1992 – 184 p.

    Rowley, H. A., Baluja, S. és Kanade, T. Neural Network-Based Face Detection. IEEE Transactions on Pattern Analysis and Machine Intelligence 1998, Vol. 20, pp. 23-37.

    Valentin D., Abdi H., O"Toole A. J. és Cottrell G. W. Az arcfeldolgozás konnekcionista modelljei: felmérés. IN: Pattern Recognition 1994, 27. kötet, 1209-1230.

    Dokumentum

    Algoritmusokat alkotnak elismerésképeket. Módelismerésképeket Ahogy fentebb megjegyeztük... a valóság nem az létezik„az ökoszisztémák általában”, és létezik csak egyéni... következtetések ebből a részletes felülvizsgálatátmódelismerés bemutattuk...

  1. Az arcképek alapján az emberek azonosítására szolgáló módszerek áttekintése, figyelembe véve a vizuális felismerés jellemzőit

    Tekintse át

    ... elismerés egy személy által alacsony kontrasztú tárgyak, beleértve a személyek Adott felülvizsgálatát közös mód ... Létezik egy egész sorozat mód ... út, a kutatás eredményeként egy platform a fejlesztéshez módszerelismerés ...

  2. Glazkova Valentina Vladimirovna nevéhez fűződik SZOFTVER ESZKÖZÖK KÉPZÉSÉNEK KUTATÁSA ÉS MÓDSZEREK FEJLESZTÉSE TÖBB TÉMAKÖRRE VONATKOZÓ HIPERSZÖVEG DOKUMENTUMOK OSZTÁLYOZÁSÁHOZ. Szakterület 05

    A dolgozat kivonata

    Hiperszöveg dokumentumok. A fejezet előírja felülvizsgálatátlétezőmód a vizsgált probléma megoldásai, leírása... a legkevésbé releváns osztályok levágásával // Matematikai módelismerésképeket: 13. Összoroszországi Konferencia. Leningrádi terület...

  3. 0. dia Genetikai szövegek elemzésével és feldolgozásával kapcsolatos bioinformatikai feladatok áttekintése

    Előadás

    DNS és fehérje szekvenciák. Tekintse át bioinformatikai feladatok, mint feladatok... jelzések korszerű használatát igénylik módelismerésképeket, statisztikai megközelítések és... alacsony génsűrűséggel. Létező A gén-előrejelző programok nem...

3. fejezet: A mintafelismerési és döntéshozatali módszerek elemző áttekintése

Mintafelismerési elmélet és vezérlés automatizálás

Az adaptív mintafelismerés fő feladatai

A felismerés egy információs folyamat, amelyet valamilyen információátalakító (intelligens információs csatorna, felismerő rendszer) valósít meg, amelynek van bemenete és kimenete. A rendszer bemenete információ arról, hogy a bemutatott objektumok milyen jellemzőkkel rendelkeznek. A rendszerkimenet információkat jelenít meg arról, hogy a felismert objektumok mely osztályokhoz (általánosított képekhez) tartoznak.

Az automatizált mintafelismerő rendszer létrehozásakor és működtetésekor számos probléma megoldódik. Tekintsük át röviden és egyszerűen ezeket a feladatokat. Megjegyzendő, hogy a különböző szerzők ugyanazokat a megfogalmazásokat fogalmazzák meg ezekről a problémákról, és maga a halmaz nem esik egybe, mivel bizonyos mértékig függ attól a konkrét matematikai modelltől, amelyen ez vagy az a felismerési rendszer alapul. Ezenkívül bizonyos felismerési modellekben bizonyos problémákra nincs megoldás, és ennek megfelelően nem is merülnek fel.

A tárgykör formalizálásának feladata

Ez a feladat lényegében egy kódolási feladat. A rendszer összeállítja az általánosított osztályok listáját, amelyekhez az objektumok konkrét megvalósításai tartozhatnak, valamint azoknak a jellemzőknek a listáját, amelyekkel ezek az objektumok elvileg rendelkezhetnek.

A képzési minta kialakításának feladata

A tanítókészlet egy adatbázis, amely az objektumok konkrét implementációinak leírását tartalmazza a jellemzők nyelvén, kiegészítve ezen objektumok bizonyos felismerési osztályokhoz való tartozására vonatkozó információkkal.

Felismerési rendszer képzési feladat

A betanítási mintát a felismerési osztályok általános képeinek kialakítására használják azon információk általánosítása alapján, hogy az ehhez az osztályhoz és más osztályokhoz tartozó képzési minta objektumai milyen jellemzőkkel rendelkeznek.

A jellemzőtér méretének csökkentésének problémája

A felismerési rendszer betanítása (statisztika beszerzése a jellemzők osztályonkénti gyakorisági eloszlásáról) után lehetővé válik az egyes jellemzők értékének meghatározása a felismerési probléma megoldásához. Ezt követően a legkevésbé értékes tulajdonságok eltávolíthatók a jellemzőrendszerből. Ezután a felismerő rendszert újra betanítani kell, hiszen egyes jellemzők eltávolítása következtében megváltozik a fennmaradó jellemzők osztályonkénti megoszlásának statisztikája. Ez a folyamat megismételhető, pl. legyen iteratív.

Felismerési feladat

A felismert minta objektumai felismerésre kerülnek, amelyek különösen egy objektumból állhatnak. A felismert minta a betanítóhoz hasonlóan jön létre, de nem tartalmaz információt az objektumok osztályokhoz való tartozásáról, mivel a felismerési folyamat során pontosan ezt határozzák meg. Az egyes objektumok felismerésének eredménye az összes felismerési osztály eloszlása ​​vagy listája a felismert objektum hozzájuk való hasonlóságának mértéke szerinti csökkenő sorrendben.

Felismerési minőség-ellenőrzési probléma

A felismerés után megállapítható a megfelelősége. A képzési minta objektumainál ez azonnal megtehető, mivel számukra egyszerűen ismert, hogy melyik osztályba tartoznak. Más objektumok esetében ezek az információk később szerezhetők be. Mindenesetre meghatározható az összes felismerési osztály tényleges átlagos hibavalószínűsége, valamint a felismert objektum egy adott osztályhoz való hozzárendelése esetén a hiba valószínűsége.

A felismerési eredményeket a felismerés minőségéről rendelkezésre álló információk figyelembevételével kell értelmezni.

Alkalmazkodási probléma

Ha a minőség-ellenőrzési eljárás eredményeként megállapítást nyer, hogy az nem kielégítő, akkor a hibásan felismert objektumok leírása átmásolható a felismert mintából a képzési mintába, kiegészítve megfelelő minősítési információval, és felhasználható a döntési szabályok újraformázásához. , azaz figyelembe vették. Sőt, ha ezek az objektumok nem tartoznak a meglévő felismerési osztályokba, ami hibás felismerésük oka lehet, akkor ez a lista bővíthető. Ennek eredményeként a felismerő rendszer alkalmazkodik, és elkezdi megfelelően osztályozni ezeket az objektumokat.

Inverz felismerési probléma

A felismerési feladat az, hogy egy adott objektumra az ismert jellemzői alapján a rendszer megállapítsa valamely korábban ismeretlen osztályhoz való tartozását. Ezzel szemben az inverz felismerési problémában egy adott felismerési osztály esetében a rendszer megállapítja, hogy mely tulajdonságok jellemzőek a legjellemzőbbek az osztály objektumaira, és melyek nem (vagy a betanító minta mely objektumai tartoznak ebbe az osztályba).

A klaszter és a konstruktív elemzés problémái

A klaszterek olyan objektumok, osztályok vagy jellemzők csoportjai, amelyek az egyes klasztereken belül a lehető leghasonlóbbak, a különböző klaszterek között pedig a lehető legkülönbözőbbek.

A konstrukció (ebben a részben tárgyalt szövegkörnyezetben) ellentétes klaszterek rendszere. Így bizonyos értelemben a konstrukciók a klaszterek klaszteranalízisének eredményei.

A klaszteranalízis során az objektumok (osztályok, jellemzők) közötti hasonlóság és különbség mértékét mennyiségileg mérik, és ezt az információt használják fel az osztályozáshoz. A klaszteranalízis eredménye az objektumok klaszterekbe sorolása. Ez a besorolás szemantikai hálózatok formájában is ábrázolható.

Kognitív elemzési feladat

A kognitív elemzés során az osztályok vagy jellemzők közötti hasonlóságokról és különbségekről szóló információ önmagában érdekli a kutatót, nem pedig azért, hogy osztályozásra használja fel, mint a klaszter- és a konstruktív elemzésben.

Ha két felismerési osztályra ugyanaz a tulajdonság jellemző, akkor ez hozzájárul e két osztály hasonlóságához. Ha az egyik osztály számára ez a tulajdonság nem jellemző, akkor ez hozzájárul a különbséghez.

Ha két jellemző korrelál egymással, akkor bizonyos értelemben egy tulajdonságnak tekinthetők, ha pedig antikorrelálnak, akkor különbözőnek. Figyelembe véve ezt a körülményt, az eltérő tulajdonságok különböző osztályokban való jelenléte is bizonyos mértékben hozzájárul ezek hasonlóságához és különbségéhez.

A kognitív elemzés eredményeit kognitív diagramok formájában lehet bemutatni.

Mintafelismerési módszerek és jellemzőik

A mintafelismerő módszerek osztályozásának elvei

A mintafelismerés a valós vagy ideális világban lévő objektumok numerikus vagy szimbolikus reprezentációira formális műveletek megalkotásának és alkalmazásának problémáját jelenti, amelyek eredményei tükrözik ezen objektumok közötti ekvivalencia-viszonyokat. Az ekvivalenciarelációk kifejezik a kiértékelt objektumok bármely osztályhoz való tartozását, független szemantikai egységnek tekintve.

A felismerési algoritmusok konstruálásakor az ekvivalencia osztályokat az a kutató adhatja meg, aki saját értelmes ötleteit használja, vagy külső kiegészítő információkat használ fel az objektumok hasonlóságairól és különbségeiről a megoldandó probléma kontextusában. Aztán a „tanárral való elismerésről” beszélnek. Ellenkező esetben, pl. Amikor egy automatizált rendszer külső képzési információ felhasználása nélkül old meg egy osztályozási problémát, akkor automatikus osztályozásról vagy „felügyelet nélküli felismerésről” beszélünk. A legtöbb mintafelismerő algoritmus igen jelentős számítási teljesítményt igényel, amit csak a nagy teljesítményű számítástechnika tud biztosítani.

Különféle szerzők (Yu.L. Barabash, V. I. Vasziljev, A. L. Gorelik, V. A. Skripkin, R. Duda, P. Hart, L. T. Kuzin, F. I. Peregudov, F. P. Tarasenko, F. E. Temnikov, J. Tu, R. Gonzalez, P. Winston K. Fu, Ya.Z. Tsypkin stb.) a mintafelismerési módszerek eltérő tipológiáját adják meg. Egyes szerzők különbséget tesznek parametrikus, nem-parametrikus és heurisztikus módszerek között, mások módszercsoportokat azonosítanak a történetileg kialakult iskolák és irányzatok alapján ezen a területen. Például abban a munkában, amely a felismerési módszerek tudományos áttekintését adja, a mintafelismerési módszerek következő tipológiáját alkalmazzák:

  • elválasztási elven alapuló módszerek;
  • statisztikai módszerek;
  • „potenciális függvények” alapján felépített módszerek;
  • minősítések kiszámításának módszerei (szavazás);
  • propozíciószámításon alapuló módszerek, különösen a logikai algebra apparátusán.

Ez a besorolás a mintafelismerés formális módszereinek különbségén alapul, ezért figyelmen kívül hagyjuk a felismerés heurisztikus megközelítését, amely a szakértői rendszerekben teljes és megfelelő fejlesztést kapott. A heurisztikus megközelítés a kutató nehezen formalizálható tudásán és intuícióján alapul. Ebben az esetben a kutató maga határozza meg, hogy a rendszer milyen információkat és hogyan használja fel a kívánt felismerési hatás eléréséhez.

A felismerési módszerek hasonló tipológiája, változó részletességgel számos felismeréssel foglalkozó műben megtalálható. Ugyanakkor az ismert tipológiák nem vesznek figyelembe egy nagyon jelentős jellemzőt, amely egy tárgyterülettel kapcsolatos ismeretek bármilyen formális mintafelismerő algoritmussal történő megjelenítési módjának sajátosságait tükrözi.

D.A. Pospelov (1990) a tudás bemutatásának két fő módját azonosítja:

  • intenzionális, attribútumok (jellemzők) közötti kapcsolatok diagramja formájában.
  • extenzív, konkrét tények (objektumok, példák) segítségével.

Az intenzionális reprezentáció megragadja azokat a mintákat és összefüggéseket, amelyek megmagyarázzák az adatok szerkezetét. A diagnosztikai feladatokkal kapcsolatban az ilyen rögzítés az objektumok attribútumain (tulajdonságain) végzett műveletek meghatározásából áll, amelyek a kívánt diagnosztikai eredményhez vezetnek. Az intenzív reprezentációkat attribútumértékeken végzett műveletekkel valósítják meg, és nem tartalmaznak konkrét információs tényekkel (objektumokkal) végzett műveleteket.

A tudás extenzív reprezentációi viszont a tárgyterület konkrét objektumainak leírásához és rögzítéséhez kapcsolódnak, és olyan műveletekben valósulnak meg, amelyek elemei objektumok, mint integrált rendszerek.

Analógia vonható a tudás intenzionális és extenzív reprezentációi, valamint az emberi agy bal és jobb agyféltekéjének működésének hátterében álló mechanizmusok között. Ha a jobb agyféltekét a környező világ holisztikus prototípus-reprezentációja jellemzi, akkor a bal félteke olyan mintákkal operál, amelyek tükrözik e világ attribútumai közötti összefüggéseket.

A tudásábrázolás fent leírt két alapvető módja lehetővé teszi számunkra, hogy a mintafelismerési módszerek következő osztályozását javasoljuk:

  • jellemzőkkel végzett műveleteken alapuló intenzionális módszerek.
  • objektumokkal végzett műveleteken alapuló kiterjesztési módszerek.

Külön hangsúlyozni kell, hogy a felismerési módszereknek pontosan ennek a két (és csak két) csoportjának, a jelekkel és a tárgyakkal operálóknak a létezése mélyen természetes. Ebből a szempontból e módszerek egyike sem teszi lehetővé, hogy a másiktól elkülönítve megfelelően tükrözzük a témakört. A szerzők szerint e módszerek között N. Bohr szerint komplementaritás áll fenn, ezért az ígéretes felismerési rendszereknek mindkét módszer megvalósítását kell biztosítaniuk, nem pedig bármelyiket.

Így a felismerési módszerek D. A. Pospelov által javasolt osztályozása általában az emberi megismerési mód alapjául szolgáló alapvető mintákon alapul, ami teljesen különleges (kiváltságos) helyzetbe hozza azt a többi osztályozáshoz képest, amelyek e háttérben könnyedebbnek tűnnek. mesterséges.

Intenzív módszerek

Az intenzionális módszerek sajátossága, hogy a mintafelismerő algoritmusok konstruálásakor és alkalmazásakor a jellemzők különböző jellemzőit és azok kapcsolatait műveletelemként használják fel. Ilyen elemek lehetnek egyedi értékek vagy jellemzőértékek intervallumai, átlagos értékek és eltérések, jellemző kapcsolati mátrixok stb., amelyeken műveleteket hajtanak végre, analitikus vagy konstruktív formában kifejezve. Ugyanakkor az objektumokat ezekben a módszerekben nem tekintjük integrált információs egységeknek, hanem indikátorként szolgálnak az attribútumok interakciójának és viselkedésének értékeléséhez.

A mintafelismerés intenzionális módszereinek csoportja kiterjedt, alosztályokra bontása bizonyos mértékig feltételes.

A jellemzőértékek eloszlási sűrűségének becslésén alapuló módszerek

Ezeket a mintázatfelismerési módszereket a statisztikai döntések klasszikus elméletéből kölcsönözték, amelyben a vizsgált objektumokat egy többdimenziós valószínűségi változó realizálásának tekintik, amely valamilyen törvény szerint a jellemzőtérben eloszlik. Egy Bayes-féle döntéshozatali sémán alapulnak, amely egy bizonyos elismert osztályhoz tartozó objektumok a priori valószínűségére és a jellemzővektorértékek feltételes eloszlási sűrűségére hivatkozik. Ezek a módszerek a valószínűségi arány meghatározásához vezetnek a többdimenziós jellemzőtér különböző területein.

A jellemzőértékek eloszlási sűrűségének becslésén alapuló módszerek egy csoportja közvetlenül kapcsolódik a diszkriminanciaanalízis módszereihez. A döntéshozatal Bayes-féle megközelítése a modern statisztika egyik legfejlettebb úgynevezett parametrikus módszere, amelynél az eloszlási törvény (jelen esetben a normáltörvény) analitikus kifejezése ismertnek tekinthető, és csak kis számú paraméter ( átlagértékek vektorait és kovarianciamátrixait) meg kell becsülni.

E módszerek használatának fő nehézségei az, hogy meg kell emlékezni a teljes képzési mintára a helyi valószínűségi eloszlási sűrűség becsléseinek kiszámításához, valamint a betanítási minta nem reprezentatív jellegére való nagy érzékenység.

A döntési függvények osztályára vonatkozó feltevéseken alapuló módszerek

Ebben a módszercsoportban a döntési függvény általános formáját ismertnek tekintjük, és annak minőségi funkcióját határozzuk meg. E függvény alapján a döntési függvény legjobb közelítését a betanítási szekvencia segítségével találjuk meg. A leggyakoribbak a döntési függvények lineáris és általánosított nemlineáris polinomok formájában történő megjelenítése. A döntési szabály minőségi funkciója általában osztályozási hibához kapcsolódik.

A döntési függvények osztályára vonatkozó feltevéseken alapuló módszerek fő előnye a felismerési probléma, mint szélsőségkeresési probléma matematikai megfogalmazásának egyértelműsége. Az ebbe a csoportba tartozó módszerek sokféleségét a döntési szabály minőségi funkcionálisok és az alkalmazott szélsőséges keresési algoritmusok széles köre magyarázza. A vizsgált algoritmusok általánosítása, amelyek közé tartozik különösen a Newton-algoritmus, a perceptron típusú algoritmusok stb., a sztochasztikus közelítés módszere.

A gradiens szélsőséges keresési algoritmusok képességeit, különösen a lineáris döntési szabályok csoportjában, meglehetősen alaposan tanulmányozták. Ezen algoritmusok konvergenciája csak abban az esetben igazolódott, amikor a felismert objektumosztályokat a jellemzőtérben kompakt geometriai struktúrák jelenítik meg.

A döntési szabály kellően magas minősége olyan algoritmusokkal érhető el, amelyek nem rendelkeznek szigorú matematikai bizonyítékkal a megoldás globális szélsőséghez való konvergenciájára. Az ilyen algoritmusok a heurisztikus programozási eljárások nagy csoportját foglalják magukban, amelyek az evolúciós modellezés irányát képviselik. Az evolúciós modellezés a természettől kölcsönzött bionikus módszer. Az ismert evolúciós mechanizmusok használatán alapul annak érdekében, hogy egy összetett objektum értelmes modellezésének folyamatát felváltsa az evolúció fenomenológiai modellezésével. Az evolúciós modellezés jól ismert képviselője a mintafelismerésben az argumentumok csoportos elszámolásának módszere (MGUA). A GMDH alapja az önszerveződés elve, a GMDH algoritmusok pedig a tömegszelekció sémáját reprodukálják.

A gyakorlati célok elérése azonban ebben az esetben nem jár együtt a felismert tárgyak természetére vonatkozó új ismeretek kinyerésével. Ezen ismeretek, különösen az attribútumok (jellemzők) kölcsönhatási mechanizmusaira vonatkozó ismeretek kinyerésének lehetőségét itt alapvetően korlátozza az ilyen interakció adott, a döntési funkciók kiválasztott formájában rögzített struktúrája.

Boole-módszerek

A mintázatfelismerés logikai módszerei a logikai algebra apparátusán alapulnak, és lehetővé teszik, hogy ne csak az egyes jellemzőkben, hanem a jellemzőértékek kombinációiban is szereplő információkkal dolgozzunk. Ezekben a módszerekben bármely attribútum értéke elemi eseménynek számít.

A legáltalánosabb formában a logikai módszerek egyfajta keresésként jellemezhetők a logikai minták betanító mintáján és egy bizonyos logikai döntési szabályrendszer kialakításán keresztül (például elemi események konjunkciói formájában), minden egyes amelynek megvan a maga súlya. A logikai módszerek csoportja változatos, és különböző összetettségű és mélységű elemzési módszereket foglal magában. A dichotóm (Boole-féle) jellemzők esetében népszerűek az úgynevezett faszerű osztályozók, a zsákutcás vizsgálati módszer, a „Bark” algoritmus stb.

A „Kora” algoritmus a mintafelismerés más logikai módszereihez hasonlóan meglehetősen számításigényes, mivel a kötőszók kiválasztásakor teljes keresésre van szükség. Ezért a logikai módszerek alkalmazásakor magas követelményeket támasztanak a számítási folyamat hatékony megszervezésével szemben, és ezek a módszerek viszonylag kis jellemzőtérrel és csak nagy teljesítményű számítógépeken működnek jól.

Nyelvi (strukturális) módszerek

A mintafelismerés nyelvi módszerei speciális nyelvtanok használatán alapulnak, amelyek olyan nyelveket generálnak, amelyek segítségével leírhatók a felismert objektumok tulajdonságai.

Az objektumok különböző osztályaihoz azonosítják a nem származtatott (atomi) elemeket (alképeket, attribútumokat) és a köztük lévő lehetséges kapcsolatokat. A nyelvtan az objektumok ezekből a nem származtatott elemekből való felépítésének szabályaira utal.

Így minden tárgy nem származékos elemek gyűjteménye, amelyek így vagy úgy „kapcsolódnak” egymáshoz, vagy más szóval valamilyen „nyelv” „mondatával”. Külön szeretném hangsúlyozni e gondolat igen jelentős ideológiai értékét.

Egy „mondat” szintaktikai elemzésével meghatározzuk annak szintaktikai „helyességét”, vagy ezzel egyenértékűen azt, hogy egy osztályt leíró rögzített nyelvtan elő tudja-e generálni egy objektum meglévő leírását.

Az a feladat azonban, hogy egy adott nyelvet generáló állítások (mondatok - objektumok leírásai) meghatározott halmazából rekonstruáljunk (definiáljunk) nyelvtanokat, nehezen formalizálható.

Kiterjesztési módszerek

Ennek a csoportnak a módszereiben az intenzionális iránytól eltérően minden vizsgált objektum kisebb-nagyobb mértékben önálló diagnosztikai jelentőséget kap. Ezek a módszerek lényegükben közel állnak a klinikai megközelítéshez, amely az embert nem objektumok láncolatának tekinti, amelyeket egyik vagy másik indikátor rangsorol, hanem integrált rendszerként, amelyek mindegyike egyedi és különleges diagnosztikai értékkel bír. A kutatás tárgyaihoz való ilyen körültekintő hozzáállás nem teszi lehetővé az egyes objektumok információinak kizárását vagy elvesztését, ami akkor történik, ha olyan intenzív iránymódszereket használnak, amelyek az objektumokat csak tulajdonságaik viselkedési mintáinak észlelésére és rögzítésére használják.

A tárgyalt módszerekkel végzett mintafelismerés fő műveletei az objektumok hasonlóságának és különbségének meghatározására szolgáló műveletek. A meghatározott módszercsoportba tartozó objektumok diagnosztikai precedensek szerepét töltik be. Sőt, egy-egy konkrét feladat körülményeitől függően az egyéni precedens szerepe a legtágabb határokon belül változhat: a fő és meghatározó szereptől az elismerési folyamatban való nagyon közvetett részvételig. A probléma körülményei viszont a sikeres megoldáshoz eltérő számú diagnosztikai precedens részvételét követelhetik meg: minden elismert osztályban egytől a teljes mintaméretig, valamint különböző módszereket az objektumok közötti hasonlóság és különbség mértékének kiszámításához. . Ezek a követelmények magyarázatot adnak a kiterjesztési módszerek további alosztályokra való felosztására.

Prototípussal való összehasonlítás módszere

Ez a legegyszerűbb kiterjesztési felismerési módszer. Használható például abban az esetben, ha a felismert osztályok kompakt geometriai csoportosítással jelennek meg a jellemzőtérben. Ebben az esetben általában az osztály geometriai csoportosításának középpontját (vagy a középponthoz legközelebb eső objektumot) választják ki prototípuspontként.

Egy ismeretlen objektum osztályozásához meg kell találni a legközelebbi prototípust, és az objektum ugyanabba az osztályba tartozik, mint ez a prototípus. Nyilvánvaló, hogy ezzel a módszerrel nem generálnak általánosított osztályképeket.

Különféle távolságok használhatók a közelség mérésére. A dichotóm jellemzők esetében gyakran a Hamming-távolságot használják, amely ebben az esetben egyenlő az euklideszi távolság négyzetével. Ebben az esetben az objektumok osztályozásának döntési szabálya egyenértékű a lineáris döntési függvénnyel.

Ezt a tényt különösen meg kell jegyezni. Világosan szemlélteti a kapcsolatot a prototípus és az adatok szerkezetére vonatkozó információ attribútum-reprezentációja között. A fenti ábrázolás segítségével például bármilyen hagyományos mérési skála, amely a dichotóm jellemzők értékeinek lineáris függvénye, tekinthető hipotetikus diagnosztikai prototípusnak. Ha viszont a felismert osztályok térszerkezetének elemzése lehetővé teszi, hogy következtetést vonjunk le geometriai tömörségükről, akkor elegendő ezen osztályok mindegyikét egy prototípussal helyettesíteni, amely valójában egy lineáris diagnosztikai modellel egyenértékű.

A gyakorlatban persze sokszor eltér a helyzet a leírt idealizált példától. Nehéz problémákkal néz szembe az a kutató, aki prototípus diagnosztikai osztályokkal való összehasonlításon alapuló felismerési módszert kíván alkalmazni.

Először is, ez a közelségi mérték (metrika) megválasztása, amely jelentősen megváltoztathatja az objektumok eloszlásának térbeli konfigurációját. Másodszor, önálló probléma a kísérleti adatok többdimenziós struktúráinak elemzése. Mindkét probléma különösen akut a kutató számára a jellemzőtér nagy dimenziós körülményei között, ami a valós problémákra jellemző.

k legközelebbi szomszédok módszere

A diszkriminanciaelemzési problémák megoldására szolgáló k-legközelebbi szomszéd módszert először 1952-ben javasolták. Ez a következő.

Egy ismeretlen objektum osztályozása során a felismert osztályokhoz már ismert tagsággal rendelkező egyéb objektumok (legközelebbi szomszédok) jellemzőinek terében egy adott számú (k) számot találunk hozzá geometriailag legközelebb. A döntés egy ismeretlen objektum egy adott diagnosztikai osztályhoz való hozzárendeléséről a legközelebbi szomszédok ismert hovatartozására vonatkozó információk elemzésével történik, például egy egyszerű szavazatszámlálás segítségével.

Kezdetben a k-legközelebbi szomszédok módszerét nem paraméteres módszernek tekintették a valószínűségi arány becslésére. Ehhez a módszerhez elméleti becsléseket kaptunk a hatékonyságáról az optimális Bayes-osztályozóval összehasonlítva. Bebizonyosodott, hogy a k-legközelebbi szomszédok módszerének aszimptotikus hibavalószínűsége legfeljebb kétszer haladja meg a Bayes-szabály hibáit.

Amikor a k-legközelebbi szomszédok módszerét alkalmazzuk a mintafelismerésre, a kutatónak meg kell oldania a metrika kiválasztásának nehéz problémáját a diagnosztizált objektumok közelségének meghatározásához. Ez a probléma a jellemzőtér nagy dimenziójú körülményei között rendkívül súlyosbodik a módszer kellő összetettsége miatt, amely még a nagy teljesítményű számítógépek esetében is jelentőssé válik. Ezért itt is, csakúgy, mint a prototípussal való összehasonlításnál, meg kell oldani a kísérleti adatok többdimenziós szerkezetének elemzésének kreatív problémáját, hogy minimalizáljuk a diagnosztikai osztályokat reprezentáló objektumok számát.

Ennek a módszernek a hátránya, hogy csökkenteni kell a betanítási mintában lévő objektumok számát (diagnosztikai precedensek), mivel csökkenti a betanítási minta reprezentativitását.

Az értékelések kiszámításának algoritmusai („szavazás”)

Az értékelési számítási algoritmusok (ABO) működési elve, hogy a felismert és referenciaobjektumok „közelségét” jellemző prioritásokat (hasonlósági pontszámokat) a jellemzőegyüttesek rendszere szerint számítják ki, amely egy adott jellemzőkészlet részhalmazainak rendszere. .

Az összes korábban tárgyalt módszertől eltérően a becslések kiszámítására szolgáló algoritmusok alapvetően új módon működnek az objektumleírásokkal. Ezeknél az algoritmusoknál az objektumok egyidejűleg léteznek a jellemzőtér nagyon különböző altereiben. Az ABO osztály a jellemzők használatának gondolatát a logikus következtetésre viszi: mivel nem mindig ismert, hogy a jellemzők melyik kombinációja a leginformatívabb, ezért az ABO-ban az objektumok hasonlóságának mértékét az összes lehetséges vagy konkrét kombináció összehasonlításával számítják ki. a tárgyak leírásában szereplő jellemzők.

A szerzők a jellemzők (alterek) használt kombinációit támogató halmazoknak vagy objektumok részleírásainak halmazainak nevezik. Bevezetésre kerül az általánosított közelség fogalma a felismert objektum és a betanítási minta objektumai között (ismert osztályozással), amelyeket referencia objektumoknak nevezünk. Ezt a közelséget a felismert objektum és a referenciaobjektum közelségének kombinációja jelenti, amelyet részleírások halmazai alapján számítanak ki. Így az ABO a k-legközelebbi szomszédok módszer kiterjesztése, amelyben az objektumok közelségét csak egy adott jellemzőtérben veszik figyelembe.

Az ABO további kiterjesztése, hogy ezekben az algoritmusokban az objektumok hasonlóságának és különbségének meghatározásának feladata parametrikusan van megfogalmazva, és ki van emelve az ABO képzési halmaz alapján történő beállításának szakasza, amelynél a beírt optimális értékei. paraméterek vannak kiválasztva. A minőségi kritérium a felismerési hiba, és szó szerint minden paraméterezett:

  • az objektumok közelségének egyéni jellemzők alapján történő kiszámításának szabályai;
  • a jellemző alterekben lévő objektumok közelségének kiszámítására vonatkozó szabályok;
  • egy adott referenciaobjektum, mint diagnosztikai precedens fontosságának mértéke;
  • a jellemzők egyes referenciakészletei hozzájárulásának jelentősége a felismert objektum bármely diagnosztikai osztályhoz való hasonlóságának végső értékeléséhez.

Az ABO paraméterek küszöbértékek formájában és (vagy) a megadott komponensek súlyaként vannak megadva.

Az AVO elméleti képességei legalábbis semmivel sem alacsonyabbak bármely más mintafelismerő algoritmusnál, hiszen az AVO segítségével minden elképzelhető művelet megvalósítható a vizsgált objektumokkal.

De ahogy az lenni szokott, a potenciális képességek bővítése nagy nehézségekbe ütközik gyakorlati megvalósításuk során, különösen az ilyen típusú algoritmusok felépítésének (hangolásának) szakaszában.

Korábban a k-legközelebbi szomszédok módszerének tárgyalása során felmerült néhány nehézség, amely az ABO csonka változataként értelmezhető. Paraméteres formában is megfontolható, és a problémát a kiválasztott típusú súlyozott metrika megtalálására redukálhatjuk. Ugyanakkor már itt is a nagydimenziós problémáknál összetett elméleti kérdések, problémák merülnek fel a hatékony számítási folyamat megszervezésével kapcsolatban.

Az AVO esetében, ha megpróbálja a lehető legteljesebb mértékben kihasználni ezen algoritmusok képességeit, ezek a nehézségek sokszorosára nőnek.

A feljegyzett problémák magyarázatot adnak arra, hogy a gyakorlatban az ABO használata nagydimenziós problémák megoldására néhány heurisztikus megszorítás és feltételezés bevezetésével párosul. Különösen ismert példa az ABO pszichodiagnosztikában való alkalmazására, amelyben az ABO egy típusát tesztelték, amely valójában egyenértékű a k-legközelebbi szomszédok módszerével.

Döntési szabály Kollektívák

A mintafelismerési módszerek áttekintésének befejezéséhez nézzünk meg még egy megközelítést. Ezek az úgynevezett döntési szabály-kollektívák (DRG).

Mivel a különböző felismerési algoritmusok eltérően jelennek meg ugyanazon az objektummintán, természetesen felmerül egy olyan szintetikus döntési szabály kérdése, amely adaptívan használja ezen algoritmusok erősségeit. A szintetikus döntési szabály kétszintű felismerési sémát használ. Az első szinten privát felismerő algoritmusok működnek, amelyek eredményeit a második szinten kombinálják a szintézis blokkban. Az ilyen egyesítés leggyakoribb módszerei egy adott algoritmus kompetenciaterületeinek azonosításán alapulnak. A kompetenciaterületek megtalálásának legegyszerűbb módja az attribútumok terének előzetes felosztása egy adott tudomány szakmai szempontjai alapján (például a minta rétegezése egy adott attribútum szerint). Ezután minden kiválasztott területhez saját felismerési algoritmus épül fel. Egy másik módszer a formális elemzésen alapul, hogy meghatározza a jellemzőtér helyi területeit olyan felismert objektumok szomszédságaként, amelyekre bármely felismerési algoritmus sikeressége bizonyított.

A szintézisblokk felépítésének legáltalánosabb megközelítése az egyes algoritmusok eredő indikátorait tekinti az új általánosított döntési szabály megalkotásának kezdeti jellemzőinek. Ebben az esetben a mintafelismerésben a fenti intenzációs és kiterjesztési irányok mindegyike használható. A döntési szabálycsoport létrehozásának problémájának megoldására hatékonyak a „Kora” típusú logikai algoritmusok és a becslések kiszámítására szolgáló algoritmusok (ABO), amelyek az úgynevezett algebrai megközelítés alapját képezik, amely tanulmányozza és konstruktív leírását adja felismerési algoritmusok, amelyek keretébe minden létező típusú algoritmus belefér.

Mintafelismerő módszerek összehasonlító elemzése

Hasonlítsuk össze a fent leírt mintafelismerési módszereket, és értékeljük, hogy mennyire felelnek meg a 3.3.3. szakaszban az SDA modellekre vonatkozóan megfogalmazott követelményeknek, amelyek összetett rendszerek adaptív automatizált vezérlőrendszereihez tartoznak.

Az intenzionális irány módszerei közül valós problémák megoldásához gyakorlati értékűek a parametrikus módszerek és a döntési függvények formájára vonatkozó javaslatokon alapuló módszerek. A paraméteres módszerek képezik az indikátorok felépítésének hagyományos módszertanának alapját. Ezeknek a módszereknek a valós problémákban való alkalmazása az adatszerkezetre vonatkozó erős korlátozásokkal jár, amelyek lineáris diagnosztikai modellekhez vezetnek, amelyek paramétereik nagyon durva becslését teszik lehetővé. A döntési függvények formájára vonatkozó feltételezéseken alapuló módszerek alkalmazásakor a kutató kénytelen a lineáris modellek felé fordulni. Ennek oka a jellemzőtér valós problémákra jellemző nagy dimenzióssága, amely a polinomiális döntési függvény mértékének növelésével óriási létszámnövekedést ad a tagok számában, ezzel párhuzamosan a felismerés minőségének problémás növekedésével. Így az intenzionális felismerési módszerek lehetséges alkalmazási területét valós problémákra vetítve olyan képet kapunk, amely megfelel a lineáris diagnosztikai modellek jól kidolgozott hagyományos módszertanának.

Jól tanulmányozták azon lineáris diagnosztikai modellek tulajdonságait, amelyekben a diagnosztikai indikátort a kezdeti jellemzők súlyozott összege képviseli. Ezeknek a modelleknek az eredményei (megfelelő normalizálással) a vizsgált objektumok és a jellemzőtér valamely hipersík közötti távolságaként, vagy ennek megfelelő módon objektumok vetületeiként ebben a térben valamilyen egyenesre értelmezhetők. Ezért a lineáris modellek csak a jellemzőtér azon területeinek egyszerű geometriai konfigurációira alkalmasak, amelyekbe különböző diagnosztikai osztályokba tartozó objektumok vannak leképezve. Bonyolultabb eloszlás esetén ezek a modellek alapvetően nem tükrözik a kísérleti adatok szerkezetének számos jellemzőjét. Ugyanakkor az ilyen funkciók értékes diagnosztikai információkat szolgáltathatnak.

Ugyanakkor az egyszerű többdimenziós struktúrák (különösen a többdimenziós normális eloszlások) minden valós problémában való megjelenését inkább kivételnek, semmint szabálynak kell tekinteni. A diagnosztikai osztályokat gyakran összetett külső kritériumok alapján alakítják ki, ami automatikusan magával vonja ezen osztályok geometriai heterogenitását a jellemzőtérben. Ez különösen igaz a gyakorlatban leggyakrabban előforduló „létfontosságú” kritériumokra. Ilyen körülmények között a lineáris modellek használata csak a kísérleti információk legdurvább mintáit rögzíti.

A kiterjesztési módszerek használata nem jár semmilyen feltételezéssel a kísérleti információ szerkezetére vonatkozóan, kivéve, hogy a felismert osztályokon belül kell lennie egy vagy több hasonló objektumcsoportnak, és a különböző osztályok objektumainak némileg különbözniük kell egymástól. Nyilvánvalóan a betanítási minta bármely véges méreténél (és nem lehet más) ez a követelmény mindig teljesül, pusztán azért, mert véletlenszerű különbségek vannak az objektumok között. Hasonlósági mértékként a jellemzőtérben lévő objektumok közelségének (távolságának) különböző mértékeit használják. Ezért a mintafelismerés extenzív módszereinek hatékony alkalmazása attól függ, hogy a megadott közelségi mérőszámok mennyire vannak meghatározva, valamint attól, hogy a betanítási minta mely objektumai (ismert osztályozású objektumok) szolgálnak diagnosztikai precedensként. Ezeknek a problémáknak a sikeres megoldása a felismerési hatékonyság elméletileg elérhető határait megközelítő eredményeket ad.

Az extenzív mintafelismerési módszerek előnyeit elsősorban gyakorlati megvalósításuk nagy technikai bonyolultsága ellensúlyozza. A nagy dimenziójú jellemzőterek esetében komoly problémát jelent az egyszerűnek tűnő feladat a legközelebbi pontok párjainak megtalálása. Sok szerző problémaként említi azt is, hogy kellően sok felismert osztályokat képviselő objektumra kell emlékezni.

Ez önmagában nem jelent problémát, de problémaként érzékelik (például a k-legközelebbi szomszédok metódusában) abból az okból, hogy minden egyes objektum felismerésekor a betanító halmazban lévő összes objektum teljes keresése megtörténik.

Ezért célszerű olyan felismerési rendszermodellt alkalmazni, amelyben a felismerés során megszűnik az objektumok teljes felsorolásának problémája a betanítási mintában, mivel ezt csak egyszer hajtják végre a felismerési osztályok általánosított képeinek generálásakor. Maga a felismerés során az azonosított objektumot csak a felismerési osztályok általánosított képeivel hasonlítják össze, amelyek száma rögzített és teljesen független a betanítási minta méretétől. Ez a megközelítés lehetővé teszi a betanítási minta méretének növelését mindaddig, amíg el nem éri az általánosított képek szükséges magas minőségét, anélkül, hogy félne attól, hogy ez a felismerési idő elfogadhatatlan növekedéséhez vezethet (mivel a felismerési idő ebben a modellben nem függ a képzési minták mérete).

Az extenzív felismerési módszerek alkalmazásának elméleti problémái az informatív jellemzőcsoportok keresésének, az objektumok hasonlóságának és különbségének mérésére optimális mérőszámok megtalálásának, valamint a kísérleti információk szerkezetének elemzésének problémáihoz kapcsolódnak. Ugyanakkor ezeknek a problémáknak a sikeres megoldása nemcsak hatékony felismerési algoritmusok felépítését teszi lehetővé, hanem az empirikus tények extenzív ismeretéről a szerkezetük mintázatairól szóló intenzionális tudásra való átmenetet is.

Az extenzív tudásról az intenzionális tudásra való átmenet abban a szakaszban történik, amikor a formális felismerési algoritmus már elkészült, és annak hatékonysága bizonyított. Ezután tanulmányozzák azokat a mechanizmusokat, amelyekkel az eredményül kapott hatékonyság érhető el. Egy ilyen, az adatok geometriai struktúrájának elemzésével összefüggő vizsgálat például arra a következtetésre vezethet, hogy az adott diagnosztikai osztályt képviselő objektumokat elegendő egy tipikus képviselővel (prototípussal) helyettesíteni. Ez egyenértékű a hagyományos lineáris diagnosztikai skála meghatározásával, mint fentebb megjegyeztük. Az is előfordulhat, hogy elegendő minden diagnosztikai osztályt több objektummal helyettesíteni, amelyeket egyes alosztályok tipikus képviselőiként értelmeznek, ami egyenértékű a lineáris skálák rajongójának felépítésével. Vannak más lehetőségek is, amelyeket az alábbiakban tárgyalunk.

Így a felismerési módszerek áttekintése azt mutatja, hogy mára elméletileg számos különböző mintafelismerési módszert fejlesztettek ki. A szakirodalom részletes osztályozást ad ezekről. A legtöbb ilyen módszernél azonban nincs szoftveres implementáció, és ez mélyen természetes, akár maguknak a felismerési módszereknek a sajátosságai által is „előre meghatározott”. Ezt abból a tényből lehet megítélni, hogy az ilyen rendszereket a szakirodalom és más információforrások ritkán említik.

Következésképpen az egyes elméleti felismerési módszerek gyakorlati alkalmazhatóságának kérdése valós (azaz meglehetősen jelentős) adatdimenziókkal és valós modern számítógépeken való gyakorlati problémák megoldásában továbbra sem eléggé kidolgozott.

A fent említett körülmény érthető, ha felidézzük, hogy a matematikai modell összetettsége exponenciálisan növeli a rendszer szoftveres megvalósításának összetettségét, és ugyanilyen mértékben csökkenti annak esélyét, hogy ez a rendszer gyakorlatilag működni fog. Ez azt jelenti, hogy a valóságban csak olyan szoftverrendszerek valósíthatók meg a piacon, amelyek meglehetősen egyszerű és „átlátható” matematikai modelleken alapulnak. Ezért a szoftvertermékének replikálásában érdekelt fejlesztő nem pusztán tudományos oldalról, hanem pragmatikusként közelíti meg a matematikai modell kiválasztásának kérdését, figyelembe véve a szoftvermegvalósítás lehetőségeit. Véleménye szerint a modellnek a lehető legegyszerűbbnek kell lennie, vagyis alacsonyabb költséggel és jobb minőségben kell megvalósítani, és működnie is kell (gyakorlatilag hatékonynak kell lennie).

Ebben a tekintetben különösen fontosnak tűnik az a feladat, hogy a felismerő rendszerekben egy olyan mechanizmust implementáljanak, amely az azonos osztályba tartozó objektumok leírását általánosítja, pl. kompakt általánosított képek kialakításának mechanizmusa. Nyilvánvaló, hogy egy ilyen általánosító mechanizmus lehetővé teszi bármely dimenziójú betanítási minta „tömörítését” a dimenziónként előre ismert általánosított képek adatbázisába. Ez lehetővé teszi számos olyan probléma felvetését és megoldását is, amelyeket olyan felismerési módszerekben nem is lehet megfogalmazni, mint a prototípussal való összehasonlítás módszere, a k-legközelebbi szomszédok módszere és az ABO.

Ezek a feladatok:

  • a jellemzők információs hozzájárulásának meghatározása egy általánosított kép információs portréjához;
  • általánosított képek klaszter-konstruktív elemzése;
  • egy jellemző szemantikai terhelésének meghatározása;
  • jellemzők szemantikai klaszter-konstruktív elemzése;
  • osztályok általánosított képeinek és jellemzőinek egymással való értelmes összehasonlítása (kognitív diagramok, köztük Merlin-diagramok).

Az a módszer, amely lehetővé tette e problémák megoldását, az erre épülő ígéretes rendszert is megkülönbözteti a többi rendszertől, ahogy a fordítók is különböznek az interpretátoroktól, hiszen az általánosított képek kialakításának köszönhetően ebben az ígéretes rendszerben a felismerési idő függetlensége a képzési minta méretét elérjük. Köztudott, hogy ennek a függőségnek a megléte vezet gyakorlatilag elfogadhatatlan számítógépes időköltségekhez a felismeréshez olyan módszereknél, mint a k-legközelebbi szomszédok módszere, ABO és KRP a képzési minta olyan dimenzióinál, amikor elegendő statisztikáról beszélhetünk. .

A felismerési módszerek rövid áttekintéseként mutassuk be a fentiek lényegét egy összefoglaló táblázatban (3.1. táblázat), amely a különböző mintafelismerési módszerek rövid leírását tartalmazza az alábbi paraméterek szerint:

  • felismerési módszerek osztályozása;
  • felismerési módszerek alkalmazási területei;
  • felismerési módszerek korlátainak osztályozása.
A felismerési módszerek osztályozása Alkalmazási kör Korlátok (hátrányok)
Intenzív felismerési módszerek A jellemzőértékek (vagy az objektumok hasonlóságai és különbségei) eloszlási sűrűségének becslésén alapuló módszerek Az ismert eloszlású, általában normál eloszlású problémák nagy statisztikai gyűjteményt igényelnek A teljes képzési minta számbavételének szükségessége a felismerés során, nagy érzékenység a képzési minta nem reprezentativitására és a műtermékekre
A döntési függvények osztályára vonatkozó feltevéseken alapuló módszerek Az osztályoknak jól elkülöníthetőnek, a jellemzőrendszernek ortonormálisnak kell lenniük A döntési függvény típusát előre ismerni kell. Képtelenség figyelembe venni az új ismereteket a tulajdonságok közötti összefüggésekről
Boole-módszerek A logikai döntési szabályok (kötőszavak) kiválasztásakor teljes keresésre van szükség. Magas számítási komplexitás
Nyelvi (strukturális) módszerek A jellemzőtér kis méretének problémái A nyelvtan rekonstrukciója (definiálása) bizonyos állítások (objektumleírások) halmazából nehezen formalizálható. Megoldatlan elméleti problémák
Kiterjesztéses felismerési módszerek Prototípussal való összehasonlítás módszere A jellemzőtér kis méretének problémái Az osztályozási eredmények nagymértékben függenek a távolságmértéktől (metrikus). Ismeretlen optimális mérőszám
k legközelebbi szomszédok módszere Az osztályozási eredmények nagymértékben függenek a távolságmértéktől (metrikus). A képzési minta teljes számbavételének szükségessége a felismerés során. Számítási erőfeszítés
Algoritmusok az AVO minősítések (szavazás) kiszámításához Kis dimenziójú problémák az osztályok számát és jellemzőit illetően Az osztályozási eredmények függése a távolságmértéktől (metrikus). A képzési minta teljes számbavételének szükségessége a felismerés során. A módszer magas műszaki összetettsége
Döntési szabály kollektívák (DRC) Kis dimenziójú problémák az osztályok számát és jellemzőit illetően A módszer rendkívül magas technikai bonyolultsága, megoldatlan elméleti problémák száma, mind a privát módszerek kompetenciaterületeinek meghatározásában, mind magukban a magánmódszerekben

3.1. táblázat – Összefoglaló táblázat a felismerési módszerek osztályozásáról, alkalmazási területeik és korlátaik összehasonlításáról

A mintafelismerés szerepe és helye a komplex rendszerek vezérlésének automatizálásában

Az automatizált vezérlőrendszer két fő részből áll: egy vezérlőobjektumból és egy vezérlőrendszerből.

A vezérlőrendszer a következő funkciókat látja el:

  • a vezérlő objektum állapotának azonosítása;
  • irányítási célokon alapuló irányítási cselekvés kialakítása, figyelembe véve az irányítási objektum és a környezet állapotát;
  • vezérlő befolyást biztosít a vezérlőobjektumra.

A mintafelismerés nem más, mint valamely tárgy állapotának azonosítása.

Következésképpen a mintafelismerő rendszer használatának lehetősége a vezérlőobjektum állapotának azonosításának szakaszában meglehetősen kézenfekvőnek és természetesnek tűnik. Ez azonban nem feltétlenül szükséges. Felmerül tehát a kérdés, hogy mely esetekben célszerű felismerő rendszert alkalmazni egy automatizált vezérlőrendszerben, és melyikben nem.

A szakirodalom szerint számos korábban kifejlesztett és modern automatizált vezérlőrendszer a vezérlőobjektum állapotának azonosítására és a vezérlési műveletek fejlesztésére szolgáló alrendszerekben a „közvetlen számítás” determinisztikus matematikai modelljeit használja, amelyek egyértelműen és egyszerűen meghatározzák, hogy mit kell tenni a vezérléssel. objektum, ha rendelkezik bizonyos külső paraméterekkel.

Ugyanakkor az a kérdés, hogy ezek a paraméterek hogyan kapcsolódnak a vezérlőobjektum egyes állapotaihoz, nem vetődik fel és nem oldódik meg. Ez az álláspont megfelel annak az álláspontnak, hogy „alapértelmezés szerint” az egy-egy kapcsolatukat elfogadják. Ezért a „vezérlőobjektum paraméterei” és a „vezérlőobjektum állapota” kifejezések szinonimáknak minősülnek, és a „vezérlőobjektum állapota” fogalmát egyáltalán nem vezetik be kifejezetten. Nyilvánvaló azonban, hogy általános esetben a vezérlőobjektum megfigyelhető paraméterei és állapota közötti kapcsolat dinamikus és valószínűségi jellegű.

Így a hagyományos automatizált vezérlőrendszerek alapvetően parametrikus vezérlőrendszerek, azaz. olyan rendszerek, amelyek nem a vezérlőobjektum állapotait, hanem csak a megfigyelhető paramétereit kezelik. Az irányítási műveletről az ilyen rendszerekben a döntés „vakon”, azaz „vakon” történik. anélkül, hogy holisztikus képet alkotnának a vezérlő objektumról és a környezetről azok jelenlegi állapotában, valamint anélkül, hogy előre jeleznék a környezet fejlődését és a vezérlő objektum reakcióját az azt érő bizonyos szabályozási hatásokra, egyidejűleg hatva a környezet előre jelzett hatásával .

A jelen munkában kidolgozott szemszögből a mai értelemben vett „döntéshozatal” kifejezés aligha alkalmazható teljes mértékben a hagyományos automatizált vezérlőrendszerekre. A tény az, hogy a „döntéshozatal” legalább egy holisztikus látásmódot feltételez a környezetben lévő objektumról, nem csak a jelenlegi állapotában, hanem dinamikában is, és mind az egymással, mind a vezérlőrendszerrel kölcsönhatásban. különböző alternatív lehetőségek mérlegelése ennek a teljes rendszernek a fejlesztésére, valamint ezen alternatívák diverzitásának szűkítése (csökkentése) bizonyos célkritériumok alapján. Nyilván a hagyományos automatizált vezérlőrendszerekben ezek egyike sem található meg, vagy létezik, csak leegyszerűsített formában.

Természetesen a hagyományos módszer megfelelő, és alkalmazása meglehetősen helyes és indokolt olyan esetekben, amikor az irányítási objektum valóban stabil és szigorúan meghatározott rendszer, és a környezet rá gyakorolt ​​hatása elhanyagolható.

Más esetekben azonban ez a módszer hatástalan.

Ha a vezérlési objektum dinamikus, akkor a vezérlési algoritmusok alapjául szolgáló modellek gyorsan inadekváttá válnak, mivel a bemeneti és kimeneti paraméterek közötti kapcsolatok, valamint maga a lényeges paraméterek halmaza megváltozik. Ez lényegében azt jelenti, hogy a hagyományos automatizált vezérlőrendszerek csak az egyensúlyi pont közelében képesek a vezérlőobjektum állapotát a rajta végrehajtott gyenge vezérlési akciókon keresztül szabályozni, pl. kis perturbációk módszerével. Az egyensúlyi állapottól távol, a hagyományos nézőpontból a vezérlő objektum viselkedése kiszámíthatatlannak és ellenőrizhetetlennek tűnik.

Ha nincs egyértelmű kapcsolat a vezérlőobjektum bemeneti és kimeneti paraméterei között (azaz a bemeneti paraméterek és az objektum állapota között), más szóval, ha ennek a kapcsolatnak kifejezett valószínűségi természete van, akkor determinisztikus modellek, amelyekben ez Feltételezve, hogy egy bizonyos paraméter mérésének eredménye egyszerűen szám, kezdetben nem alkalmazható. Emellett előfordulhat, hogy ennek a kapcsolatnak a típusa egyszerűen ismeretlen, és akkor a legáltalánosabb feltevésből kell kiindulni: valószínűségi vagy egyáltalán nem definiált.

A hagyományos elvekre épülő automatizált vezérlőrendszer csak olyan paraméterek alapján tud működni, amelyek kapcsolódási mintái már ismertek, tanulmányozottak és matematikai modellben tükröződnek vezérlőrendszerek, amelyek lehetővé teszik a legjelentősebb paraméterek azonosítására alkalmas rendszerek létrehozását, valamint a köztük lévő kapcsolatok és a vezérlőobjektum állapotainak meghatározását.

Ebben az esetben a valós helyzetnek megfelelő, fejlettebb mérési módszereket kell alkalmazni:

  • képek osztályozása vagy felismerése (tanulási készleten alapuló tanulás, felismerési algoritmusok adaptálhatósága, a vizsgált osztály- és paraméterkészletek adaptálhatósága, a legjelentősebb paraméterek kiválasztása és a leírási dimenzió csökkentése egy adott redundancia megtartása mellett stb.);
  • statisztikai mérések, amikor egy adott paraméter mérésének eredménye nem egy külön szám, hanem egy valószínűségi eloszlás: egy statisztikai változó változása nem önmagában értékének változását jelenti, hanem a valószínűségi eloszlás jellemzőiben bekövetkező változást. értékeit.

Ennek eredményeként a hagyományos determinisztikus megközelítésen alapuló automatizált vezérlőrendszerek gyakorlatilag nem működnek összetett dinamikus, többparaméteres gyengén meghatározott vezérlőobjektumokkal, mint például makro- és mikro-társadalmi-gazdasági rendszerekkel egy dinamikus gazdaságban. átmeneti időszak”, hierarchikus elit és etnikai csoportok, társadalom és választópolgárok, emberi fiziológia és psziché, természetes és mesterséges ökoszisztémák és még sok más.

Nagyon jelentős, hogy a 80-as évek közepén I. Prigogine iskolája kidolgozott egy olyan megközelítést, amely szerint bármely rendszer (beleértve az embert is) fejlődése váltakozik olyan periódusokkal, amelyek során a rendszer vagy „többnyire determinisztikusan”, vagy „többnyire véletlenszerűen” viselkedik. Természetesen egy valódi vezérlőrendszernek nemcsak történetének „determinisztikus” szakaszaiban kell stabilan irányítania a vezérlőobjektumot, hanem olyan pontokon is, amikor további viselkedése erősen bizonytalanná válik. Ez önmagában azt jelenti, hogy olyan vezérlőrendszerek megközelítését kell kidolgozni, amelyek viselkedése nagymértékben tartalmazza a véletlenszerűséget (vagy azt, amit matematikailag „véletlenségnek” neveznek).

Ezért a komplex dinamikus többparaméteres, gyengén determinisztikus rendszerek vezérlését biztosító ígéretes automatizált vezérlőrendszerek alapvető funkcionális kapcsolatként nyilvánvalóan magukban foglalják majd a környezet és a vezérlőobjektum állapotának azonosítására és előrejelzésére szolgáló alrendszereket, amelyek mesterséges intelligencia módszerein (elsősorban mintán) alapulnak. felismerés), támogató módszerek döntéshozatal és információelmélet.

Tekintsük röviden a képfelismerő rendszerek felhasználásának kérdését a vezérlési műveletekkel kapcsolatos döntések meghozatalához (erről a kérdésről később részletesebben lesz szó, mivel ez kulcsfontosságú ebben a munkában). Ha felismerési osztálynak vesszük a vezérlőobjektum cél- és egyéb állapotait, jellemzőknek pedig az azt befolyásoló tényezőket, akkor a mintafelismerő modellben a faktorok és állapotok kapcsolatának mértéke képezhető. Ez lehetővé teszi, hogy egy vezérlőobjektum adott állapotára vonatkozóan információt szerezzünk azokról a tényezőkről, amelyek elősegítik vagy akadályozzák az ebbe az állapotba való átmenetet, és ennek alapján döntést hozhatunk a vezérlési műveletről.

A tényezők a következő csoportokra oszthatók:

  • a vezérlőobjektum hátterének jellemzése;
  • a vezérlőobjektum aktuális állapotának jellemzése;
  • környezeti tényezők;
  • technológiai (szabályozható) tényezők.

Így a mintafelismerő rendszerek az automatizált vezérlőrendszerek részeként használhatók: alrendszerekben egy vezérlőobjektum állapotának azonosítására és vezérlési műveletek fejlesztésére.

Ez akkor célszerű, ha a vezérlőobjektum egy összetett rendszer.

Döntés meghozatala a vezérlési műveletről az automatizált vezérlőrendszerben

Ez a munka az adaptív automatizált vezérlőrendszerek komplex rendszerekkel történő szintetizálásának problémájának megoldását vizsgálja, figyelembe véve a mintafelismerés és a döntéshozatal módszerei közötti számos és mély analógiát.

Egyrészt a mintafelismerés problémája annak eldöntése, hogy a felismert objektum egy bizonyos felismerési osztályba tartozik-e.

Másrészt a szerzők azt javasolják, hogy a döntéshozatali problémát inverz dekódolási problémának vagy inverz mintafelismerési problémának tekintsük (lásd 2.2.2. fejezet).

A mintafelismerés és a döntéshozatal módszereinek alapjául szolgáló alapgondolatok közössége különösen akkor válik szembetűnővé, ha ezeket az információelméleti szemszögből vizsgáljuk.

Sokféle döntési probléma

Döntéshozatal, mint cél megvalósítása

Definíció: a döntéshozatal („választás”) az alternatívák halmaza feletti cselekvés, amelynek eredményeként a kezdeti alternatívakészlet leszűkül, azaz. csökkenése következik be.

A választás az a cselekvés, amely minden tevékenységnek célt ad. A választási aktusok révén valósul meg minden tevékenységnek egy meghatározott célnak vagy egymással összefüggő célok halmazának való alárendelése.

Tehát ahhoz, hogy a választási aktus lehetővé váljon, a következőkre van szükség:

  • alternatívák létrehozása vagy felfedezése a választáshoz;
  • azon célok meghatározása, amelyek érdekében a választás történik;
  • alternatívák egymással való összehasonlítására szolgáló módszer kidolgozása és alkalmazása, pl. Az egyes alternatívák preferenciális besorolása bizonyos kritériumok alapján, amely lehetővé teszi közvetett módon annak felmérését, hogy az egyes alternatívák mennyire felelnek meg a célnak.

A döntéstámogatás területén végzett modern munka egy jellegzetes helyzetet tárt fel, miszerint a legjobb (bizonyos értelemben) megoldás megtalálásának teljes formalizálása csak jól áttanulmányozott, viszonylag egyszerű problémák esetén lehetséges, míg a gyakorlatban a gyengén strukturált problémák a legmegfelelőbbek. gyakrabban találkozunk, amelyekre egyáltalán nem dolgoztak ki formalizált algoritmusokat (kivéve a kimerítő keresést és a próba-hibát). A tapasztalt, hozzáértő és hozzáértő szakemberek azonban gyakran olyan döntéseket hoznak, amelyek egészen jónak bizonyulnak. Ezért a természetes helyzetekben történő döntéshozatal gyakorlatában a modern irányzat az, hogy az emberi informális problémák megoldási képességét a formális módszerek és a számítógépes modellezés képességeivel ötvözzük: interaktív döntéstámogató rendszerek, szakértői rendszerek, adaptív ember-gép automatizált vezérlőrendszerek. , neurális hálózatok és kognitív rendszerek.

Döntéshozatal, mint a bizonytalanság megszüntetése (információs megközelítés)

Az információszerzés folyamata a jel vételéből adódó bizonytalanság csökkenésének, az információ mennyisége pedig a bizonytalanság eltávolítás mértékének kvantitatív mérőszámának tekinthető.

De a halmazból az alternatívák egy bizonyos részhalmazának kiválasztásának eredményeképpen, pl. a döntéshozatal eredményeként ugyanez történik (a bizonytalanság csökkentése). Ez azt jelenti, hogy minden választás, minden döntés bizonyos mennyiségű információt generál, ezért információelméletileg leírható.

A döntéshozatali problémák osztályozása

A döntési feladatok sokrétűsége abból adódik, hogy a döntéshozatali szituáció egyes összetevői minőségileg eltérő lehetőségekben valósíthatók meg.

Soroljunk fel néhányat a lehetőségek közül:

  • az alternatívák halmaza egyrészt lehet véges, megszámlálható vagy folytonos, másrészt zárt (azaz teljesen ismert) vagy nyitott (ismeretlen elemeket is beleértve);
  • az alternatívák értékelése egy vagy több kritérium alapján is elvégezhető, amelyek viszont lehetnek mennyiségi vagy minőségi jellegűek;
  • A kiválasztási mód lehet egyszeri (egyszeri), vagy többszörös, ismétlődő, beleértve a visszajelzést a választás eredményéről, pl. a döntéshozatali algoritmusok képzésének lehetővé tétele az előző választások következményeinek figyelembevételével;
  • az egyes alternatívák választásának következményei előre pontosan ismertek (választás bizonyossági feltételek mellett), valószínűségi jellegűek, ha ismertek a meghozott választás utáni lehetséges kimenetelek valószínűségei (választás kockázati feltételek mellett), vagy kétértelmű kimenetelük ismeretlen, valószínűségek (választás a bizonytalanság körülményei között);
  • a választás felelőssége hiányozhat, egyéni vagy csoportos lehet;
  • a csoportválasztásban a célok konzisztenciájának mértéke a felek érdekeinek teljes egybeesésétől (együttműködő választás) az ellenkezőjéig (konfliktushelyzetben történő választás) változhat. Köztes lehetőségek is lehetségesek: kompromisszum, koalíció, növekvő vagy elhalványuló konfliktus.

Ezen lehetőségek különféle kombinációi számos döntéshozatali problémához vezetnek, amelyeket különböző mértékben tanulmányoztak.

Nyelvek a döntéshozatali módszerek leírására

Ugyanarról a jelenségről beszélhetünk különböző nyelveken, eltérő általánossággal és megfelelőséggel. A mai napig három fő nyelv alakult ki a választás leírására.

A legegyszerűbb, legfejlettebb és legnépszerűbb a kritériumnyelv.

Kritériumok nyelve

Ennek a nyelvnek a nevéhez az az alapfeltevés társul, hogy minden egyes alternatíva valamilyen meghatározott (egy) számmal értékelhető, ami után az alternatívák összehasonlítása a megfelelő számok összehasonlítására redukálódik.

Legyen például (X) alternatívák halmaza, x pedig valami ehhez a halmazhoz tartozó konkrét alternatíva: x∈X. Ekkor úgy gondoljuk, hogy minden x-re megadható egy q(x) függvény, amit kritériumnak nevezünk (minőségi kritérium, célfüggvény, preferenciafüggvény, hasznossági függvény stb.), amelynek az a tulajdonsága, hogy ha az x 1 alternatíva előnyösebb. x 2-re (jelölése: x 1 > x 2), majd q(x 1) > q(x 2).

Ebben az esetben a választás a kritériumfüggvény legmagasabb értékével rendelkező alternatíva keresésén múlik.

A gyakorlatban azonban indokolatlan egyszerűsítésnek bizonyul, ha csak egy kritériumot használunk az alternatívák preferáltsági fokának összehasonlítására, mivel az alternatívák részletesebb mérlegelése azt eredményezi, hogy nem egy, hanem több szempont alapján kell értékelni őket, ami eltérő természetűek és minőségileg különböznek egymástól.

Például bizonyos típusú útvonalakon az utasok és az üzemeltető szervezet számára legelfogadhatóbb repülőgéptípus kiválasztásakor egyidejűleg számos szempontcsoport szerint történik az összehasonlítás: műszaki, technológiai, gazdasági, társadalmi, ergonómiai stb.

A többszempontú problémáknak nincs egyedi általános megoldása. Ezért számos módot javasolnak arra, hogy egy többkritériumú problémát olyan konkrét formába adjunk, amely egyetlen általános megoldást tesz lehetővé. Természetesen ezek a megoldások a különböző módszereknél általában eltérőek. Ezért egy többkritériumú probléma megoldásában talán a legfontosabb az ilyen típusú megfogalmazás indokoltsága.

Különféle lehetőségeket használnak a többszempontú kiválasztási probléma egyszerűsítésére. Soroljunk fel néhányat közülük.

  1. Feltételes maximalizálás (nem az integrálkritérium globális szélsőértéke található, hanem a főkritérium lokális szélsőértéke).
  2. Keressen alternatívát megadott tulajdonságokkal.
  3. A Pareto halmaz megtalálása.
  4. Egy többkritériumú probléma redukálása egyszempontú problémává integrálkritérium bevezetésével.

Tekintsük részletesebben annak a módszernek a formális megfogalmazását, amellyel egy többszempontú probléma egykritérikusra redukálható.

Vezessük be a q 0 (x) integrálkritériumot a vektor argumentum skaláris függvényeként:

q 0 (x) = q 0 ((q 1 (x), q 2 (x), ..., q n (x)).

Az integrál kritérium lehetővé teszi az alternatívák q 0 értékének megfelelő sorrendjét, ezzel kiemelve a legjobbakat (e kritérium értelmében). A q 0 függvény alakját az határozza meg, hogy mennyire konkrétan képzeljük el az egyes kritériumok hozzájárulását az integrálkritériumhoz. Általában additív és multiplikatív függvényeket használnak:

q 0 = ∑a i ⋅q i /s i

1 - q 0 = ∏(1 - b i ⋅q i /s i)

Az általam biztosított együtthatók:

  1. A dimenziómentesség vagy az a i ⋅q i /s i szám egyetlen dimenziója (a különböző részkritériumok különböző dimenziókkal rendelkezhetnek, és akkor nem lehet rajtuk aritmetikai műveleteket végrehajtani és integrálkritériumra redukálni).
  2. Normalizálás, azaz. feltétel biztosítása: b i ⋅q i /s i<1.

Az a i és b i együtthatók a q i részkritériumok relatív hozzájárulását tükrözik az integrálkritériumhoz.

Tehát egy többszempontú megfogalmazásban az egyik alternatíva kiválasztásával kapcsolatos döntés meghozatalának problémája az integrál kritérium maximalizálásához vezet:

x * = arg max(q 0 (q 1 (x), q 2 (x), ..., q n (x)))

A döntési probléma többszempontú megfogalmazásánál a fő probléma az, hogy az a i és b i együtthatók olyan analitikus formáját kell megtalálni, amely a modell alábbi tulajdonságait biztosítaná:

  • a témakörnek és a szakértői szempontoknak való magas fokú megfelelőség;
  • minimális számítási nehézségek az integrálkritérium maximalizálásában, pl. számítása különböző alternatívákra;
  • az integrálkritérium maximalizálásának eredményeinek stabilitása a kezdeti adatok kis zavaraiból.
  • A megoldás stabilitása azt jelenti, hogy a kezdeti adatok kis változtatása az integrálkritérium értékének kismértékű változásához, ennek megfelelően a meghozott döntés kismértékű változásához vezet. Így, ha a kiindulási adatok gyakorlatilag megegyeznek, akkor vagy azonos vagy nagyon közeli döntést kell hozni.

Szekvenciális bináris választási nyelv

A bináris relációk nyelve egy többkritériumú nyelv általánosítása, és azon alapul, hogy figyelembe vesszük, hogy amikor egy alternatívát értékelünk, ez az értékelés mindig relatív, azaz. kifejezetten vagy gyakrabban implicit módon a vizsgált halmazból vagy az általános populációból származó egyéb alternatívákat használnak összehasonlítási alapként vagy referenciakeretként. Az emberi gondolkodás az ellentétek (konstrukciók) keresésén és elemzésén alapul, így mindig könnyebben választhatunk két ellentétes lehetőség közül egyet, mint egyet egy nagy és semmiképpen sem rendezett halmazból.

Így ennek a nyelvnek az alapvető feltevései a következők:

  • külön alternatívát nem értékelnek, i.e. a kritériumfüggvény nincs bevezetve;
  • minden alternatívapár esetében valamilyen módon megállapítható, hogy az egyik előnyösebb a másiknál, vagy egyenértékűek vagy összehasonlíthatatlanok;
  • a preferencia reláció egyetlen alternatívapárban sem függ a választásra bemutatott többi alternatívától.

A bináris relációk megadásának többféle módja van: közvetlen, mátrix, preferenciagráfok, szakaszmódszer stb.

Az egy pár alternatívái közötti kapcsolatokat az ekvivalencia, a sorrend és a dominancia fogalmai fejezik ki.

Általános kiválasztási funkció nyelve

A választási függvény nyelve a halmazelméleten alapul, és lehetővé teszi, hogy a halmazoktól a különböző választási lehetőségeknek megfelelő részhalmazokhoz tartozó leképezésekkel dolgozzon anélkül, hogy fel kellene sorolnia az elemeket. Ez a nyelv nagyon általános, és bármilyen választást leírhat. Az általánosított szelekciós függvények matematikai apparátusát azonban jelenleg még csak fejlesztik és főként olyan problémákon tesztelik, amelyeket kritérium alapú vagy bináris megközelítéssel már megoldottak.

Csoportválasztás

Legyen olyan embercsoport, akinek joga van részt venni a kollektív döntéshozatalban. Tételezzük fel, hogy ez a csoport egy bizonyos alternatívát mérlegel, és a csoport minden tagja saját maga választ. A feladat egy olyan megoldás kidolgozása, amely bizonyos módon összehangolja az egyéni választásokat, és bizonyos értelemben kifejezi a csoport „általános véleményét”, pl. csoportválasztásként fogadták el.

Természetesen az egyéni döntések összehangolásának más-más elvei megfelelnek a különböző csoportdöntéseknek.

A csoportválasztás során az egyéni döntések összehangolására vonatkozó szabályokat szavazási szabályoknak nevezzük. A legelterjedtebb a „többségi szabály”, amelyben a legtöbb szavazatot kapott alternatívát fogadják el csoportdöntésnek.

Meg kell érteni, hogy egy ilyen döntés csak a különböző nézőpontok csoporton belüli elterjedését tükrözi, nem pedig az igazán optimális lehetőséget, amelyre egyáltalán nem szavazhat senki. "Az igazságot nem szavazás határozza meg."

Ezen kívül vannak úgynevezett „szavazási paradoxonok”, amelyek közül a leghíresebb Arrow paradoxona.

Ezek a paradoxonok a szavazási eljárás nagyon kellemetlen sajátosságaihoz vezethetnek, és néha vezetnek is: például vannak olyan esetek, amikor a csoport egyáltalán nem tud egyetlen döntést hozni (nincs határozatképes, vagy mindenki a saját egyedi választására szavaz stb. .), és néha (többlépcsős szavazással) a kisebbség rákényszerítheti akaratát a többségre.

Választás a bizonytalanság körülményei között

A bizonyosság a bizonytalanság speciális esete, nevezetesen: a nullához közeli bizonytalanság.

A modern választáselméletben úgy vélik, hogy a döntéshozatali problémákban a bizonytalanság három fő típusa van:

  1. A kiinduló adatok információs (statisztikai) bizonytalansága a döntéshozatalhoz.
  2. A döntéshozatal (választás) következményeinek bizonytalansága.
  3. Homályosság a döntéshozatali folyamat összetevőinek leírásában.

Nézzük őket sorban.

Információs (statisztikai) bizonytalanság a forrásadatokban

A tárgykörről szerzett adatok nem tekinthetők teljesen pontosnak. Ráadásul ezek az adatok nyilvánvalóan nem önmagukban érdekelnek bennünket, hanem csak jelekként, amelyek bizonyos információkat hordozhatnak arról, hogy mi is érdekel minket. Így reálisabb azt gondolni, hogy nemcsak zajos és pontatlan, hanem közvetett, esetleg hiányos adatokkal is van dolgunk. Ráadásul ezek az adatok nem a teljes vizsgált populációra vonatkoznak, hanem annak csak egy bizonyos részhalmazára, amelyről ténylegesen tudtunk adatokat gyűjteni, ugyanakkor a teljes populációra szeretnénk következtetéseket levonni, illetve szeretné tudni, hogy ezek a következtetések mekkora megbízhatóságúak.

Ilyen körülmények között a statisztikai döntések elméletét alkalmazzák.

Ebben az elméletben két fő bizonytalansági forrás van. Először is nem ismert, hogy az eredeti adatok milyen eloszlást követnek. Másodszor, nem ismert, hogy milyen eloszlása ​​van annak a halmaznak (általános sokaság), amelyre vonatkozóan a kiindulási adatokat képező részhalmazából kívánunk következtetéseket levonni.

A statisztikai eljárások olyan döntéshozatali eljárások, amelyek mindkét típusú bizonytalanságot megszüntetik.

Meg kell jegyezni, hogy számos oka van a statisztikai módszerek helytelen alkalmazásának:

  • A statisztikai következtetéseknek, mint minden másnak, mindig van bizonyos megbízhatósága vagy érvényessége. De sok más esettől eltérően a statisztikai következtetések megbízhatósága ismert és a statisztikai vizsgálat során meghatározott;
  • a statisztikai eljárás alkalmazásával kapott megoldás minősége a forrásadatok minőségétől függ;
  • a nem statisztikai jellegű adatokat nem szabad statisztikai feldolgozásnak alávetni;
  • statisztikai eljárásokat kell alkalmazni, amelyek megfelelnek a vizsgált sokaságra vonatkozó a priori információk szintjének (például az ANOVA-módszereket nem szabad nem Gauss-féle adatokra alkalmazni). Ha a kiindulási adatok eloszlása ​​nem ismert, akkor vagy meg kell határozni, vagy több különböző módszert kell alkalmazni és az eredményeket összehasonlítani. Ha nagyon eltérnek egymástól, az egyes alkalmazott eljárások alkalmatlanságát jelzi.

A következmények bizonytalansága

Ha az egyik vagy másik alternatíva választásának következményeit egyértelműen maga az alternatíva határozza meg, akkor nem tudunk különbséget tenni az alternatíva és annak következményei között, természetesnek vesszük, hogy az alternatíva választásával valójában annak következményeit választjuk.

A gyakorlatban azonban gyakran bonyolultabb helyzettel kell megküzdenie, amikor az egyik vagy másik alternatíva választása félreérthetően meghatározza a meghozott választás következményeit.

Az alternatívák és az általuk választott kimenetek diszkrét halmaza esetén, feltéve, hogy maga a lehetséges kimenetelek halmaza minden alternatívára közös, feltételezhetjük, hogy a különböző alternatívák az eredmények valószínűségi eloszlásában különböznek egymástól. Ezek a valószínűségi eloszlások általános esetben függhetnek az alternatívák kiválasztásának eredményétől és a tényleges eredményektől. A legegyszerűbb esetben az eredmények egyformán valószínűek. Maguk az eredmények általában nyereséget vagy veszteséget jelentenek, és mennyiségileg fejeződnek ki.

Ha az eredmények minden alternatíva esetében azonosak, akkor nincs mit választani. Ha különböznek, akkor összehasonlíthatja az alternatívákat bizonyos mennyiségi becslések bevezetésével. A játékelméleti problémák sokfélesége összefügg az alternatívák megválasztásából adódó veszteségek és nyereségek számszerű jellemzőinek eltérő megválasztásával, az alternatívát választó felek közötti konfliktus különböző fokával stb.

Tekintse ezt a fajta bizonytalanságot homályos bizonytalanságnak

Bármilyen választási probléma az alternatívák halmazának célzott leszűkítésének feladata. Mind az alternatívák formális leírása (maga listája, jellemzőik vagy paramétereik listája), mind az összehasonlításukra vonatkozó szabályok (kritériumok, összefüggések) leírása mindig egy vagy másik mérési skála szerint van megadva (még akkor is, ha az aki ezt csinálja, az nem tud erről).

Ismeretes, hogy minden skála elmosódott, de eltérő mértékben. Az „elmosódás” kifejezés a skálák tulajdonságára utal, ami abban áll, hogy mindig lehetséges két megkülönböztethető alternatíva bemutatása, pl. azonos skálán különbözőek és megkülönböztethetetlenek, i.e. azonos, a másikban - elmosódottabb. Minél kevesebb az átmenet egy adott skálán, annál elmosódottabb.

Így jól láthatjuk az alternatívákat és egyben homályosan osztályozhatjuk is, i.e. bizonytalanok abban, hogy melyik osztályba tartoznak.

Bellman és Zadeh már a homályos helyzetekben történő döntéshozatalról szóló első munkájukban felvetette azt az elképzelést, hogy mind a célokat, mind a korlátokat homályos halmazokként kell ábrázolni az alternatívák halmazán.

Az optimalizálási megközelítés néhány korlátjáról

Valamennyi fent tárgyalt kiválasztási problémánál és döntési módszernél az volt a probléma, hogy adott feltételek mellett megtaláljuk a legjobbakat az eredeti halmazban, pl. bizonyos értelemben optimális alternatívák.

Az optimalitás gondolata a kibernetika központi gondolata, és szilárdan meghonosodott a műszaki rendszerek tervezésének és üzemeltetésének gyakorlatában. Ugyanakkor ez az elképzelés körültekintő hozzáállást igényel, amikor megpróbáljuk átvinni az összetett, nagy és gyengén meghatározott rendszerek, mint például a társadalmi-gazdasági rendszerek irányításának területére.

Ennek a következtetésnek elég jó okai vannak. Nézzünk ezek közül néhányat:

  1. Az optimális megoldás gyakran bizonyul instabilnak, pl. a problémakörülmények, inputok vagy korlátok kisebb változásai jelentősen eltérő alternatívák kiválasztásához vezethetnek.
  2. Az optimalizálási modelleket csak a meglehetősen egyszerű problémák szűk osztályaira fejlesztették ki, amelyek nem mindig tükrözik megfelelően és szisztematikusan a valós vezérlőobjektumokat. Az optimalizálási módszerek leggyakrabban csak néhány nagy és összetett rendszer meglehetősen egyszerű és formálisan jól leírt alrendszereinek optimalizálását teszik lehetővé, pl. csak helyi optimalizálást engedélyez. Ha azonban egy nagy rendszer minden alrendszere optimálisan működik, ez egyáltalán nem jelenti azt, hogy a rendszer egésze optimálisan fog működni. Ezért egy alrendszer optimalizálása nem feltétlenül vezet ahhoz a viselkedéshez, amely a rendszer egészének optimalizálásakor megköveteli tőle. Ezenkívül a helyi optimalizálás néha negatív következményekkel járhat a rendszer egészére nézve. Ezért az alrendszerek és a rendszer egészének optimalizálásakor meg kell határozni a célok és részcélok fáját és azok prioritását.
  3. Gyakran egy optimalizálási feltétel maximalizálását valamilyen matematikai modell szerint tekintik az optimalizálás céljának, de a valóságban a vezérlőobjektum optimalizálása a cél. Az optimalizálási kritériumok és a matematikai modellek mindig csak közvetetten kapcsolódnak a célhoz, pl. többé-kevésbé megfelelően, de mindig hozzávetőlegesen.

Tehát a matematikailag megfelelően formalizálható rendszerek számára rendkívül gyümölcsöző optimalitás gondolatát óvatosan kell átvinni a komplex rendszerekre. Természetesen az ilyen rendszerekre olykor javasolható matematikai modellek optimalizálhatók. Figyelembe kell venni azonban ezen modellek erőteljes egyszerűsítését, ami összetett rendszerek esetében már nem elhanyagolható, valamint azt, hogy ezeknek a modelleknek a megfelelőségi foka összetett rendszerek esetén gyakorlatilag ismeretlen. . Ezért nem ismert, hogy ennek az optimalizálásnak milyen pusztán gyakorlati jelentősége van. A műszaki rendszerekben az optimalizálás nagy gyakorlatiassága nem keltheti azt az illúziót, hogy az összetett rendszerek optimalizálásakor is ugyanolyan hatékony lesz. Az összetett rendszerek értelmes matematikai modellezése nagyon nehéz, közelítő és pontatlan. Minél összetettebb a rendszer, annál körültekintőbben kell optimalizálnia.

Ezért a bonyolult, nagy, gyengén determinisztikus rendszerek vezérlésére szolgáló módszerek kidolgozásakor a szerzők nem csupán a választott megközelítés formális matematikai szempontból való optimalitását tartják a legfontosabbnak, hanem a célnak való megfelelőségét és a rendszer természetét is. vezérlő objektum.

Szakértői kiválasztási módszerek

Az összetett rendszerek tanulmányozása során gyakran olyan problémák merülnek fel, amelyek különböző okok miatt nem fogalmazhatók meg és nem oldhatók meg szigorúan a jelenleg kifejlesztett matematikai apparátussal. Ezekben az esetekben szakértők (rendszerelemzők) szolgáltatásait veszik igénybe, akiknek tapasztalata és intuíciója segít csökkenteni a probléma összetettségét.

Figyelembe kell azonban venni, hogy a szakértők maguk is rendkívül összetett rendszerek, tevékenységük számos külső és belső körülménytől is függ. Ezért a szakértői értékelések megszervezésének módszereiben nagy figyelmet fordítanak a szakértői munka kedvező külső és pszichológiai feltételeinek megteremtésére.

A szakértő munkáját a következő tényezők befolyásolják:

  • felelősség a vizsgálati eredmények felhasználásáért;
  • annak ismerete, hogy más szakértők is részt vesznek;
  • a szakértők közötti információs kapcsolat elérhetősége;
  • a szakértők interperszonális kapcsolatai (ha van köztük információs kapcsolat);
  • a szakértő személyes érdeklődése az értékelés eredményei iránt;
  • a szakértők személyes tulajdonságai (önhittség, konformitás, akarat stb.)

A szakértők közötti interakció serkentheti és elnyomhatja tevékenységüket. Ezért különböző esetekben különböző vizsgálati módszereket alkalmaznak, amelyek a szakértők egymás közötti interakciójának jellegében különböznek: anonim és nyílt felmérések és kérdőívek, találkozók, megbeszélések, üzleti játékok, ötletbörze stb.

A szakértői vélemények matematikai feldolgozására többféle módszer létezik. A szakértőket arra kérik, hogy értékeljék a különböző alternatívákat akár egy, akár egy mutatórendszer segítségével. Ezen túlmenően felkérik őket, hogy értékeljék az egyes mutatók fontossági fokát („súlyukat” vagy „hozzájárulásukat”). Maguk a szakértők is hozzá vannak rendelve egy olyan kompetenciaszinthez, amely megfelel mindegyiküknek a csoport véleményéhez való hozzájárulásának.

A szakértőkkel való együttműködés kidolgozott módszertana a Delphi módszer. Ennek a módszernek az a lényege, hogy a kritika és az érvelés jótékony hatással van a szakértőre, ha büszkeségét nem érinti, és olyan feltételeket biztosítanak, amelyek kizárják a személyes konfrontációt.

Külön hangsúlyozni kell, hogy alapvető különbség van a szakértői módszerek szakértői rendszerekben és a döntéstámogatásban való alkalmazásának jellegében. Ha az első esetben a szakértőknek formalizálniuk kell a döntéshozatali módszereket, akkor a második esetben csak magát a döntést, mint olyat.

Mivel a szakemberek pontosan azon funkciók megvalósításában vesznek részt, amelyeket jelenleg vagy egyáltalán nem biztosítanak az automatizált rendszerek, vagy azokat rosszabbul látják el, mint az emberek, az automatizált rendszerek fejlesztésének ígéretes iránya ezen funkciók maximális automatizálása.

Automatizált döntéstámogató rendszerek

Az ember mindig is asszisztenseket használt a döntések meghozatalakor: ezek pusztán információszolgáltatók voltak a menedzsment tárgyáról, és tanácsadók (tanácsadók), akik döntési lehetőségeket kínáltak fel és elemezték azok következményeit. A döntéshozó mindig is egy bizonyos információs környezetben hozta meg azokat: a katonai vezetőnek a parancsnokság, a rektornak a tudományos tanács, a miniszternek a kollégium.

Napjainkban a döntéshozatal információs infrastruktúrája elképzelhetetlen az interaktív döntésértékelés automatizált rendszerei és különösen a döntéstámogató rendszerek (DDS - Decision Support Systems), azaz a döntéstámogató rendszerek nélkül. automatizált rendszerek, amelyeket kifejezetten arra terveztek, hogy előkészítsék azokat az információkat, amelyekre egy személynek szüksége van egy döntés meghozatalához. A döntéstámogató rendszerek fejlesztése különösen a laxenburgi (Ausztria) International Institute for Applied Systems Analysis égisze alatt megvalósuló nemzetközi projekt keretében valósul meg.

A valós élethelyzetekben történő döntéshozatalhoz számos műveletre van szükség, amelyek közül néhányat az emberek, másokat pedig a gépek hajtanak végre hatékonyabban. Előnyeik hatékony kombinációja és hiányosságaik kompenzálása az automatizált döntéstámogató rendszerekben testesül meg.

Az ember a bizonytalanság körülményei között jobban hoz döntéseket, mint egy gép, de a helyes döntéshez a témakört jellemző megfelelő (teljes és megbízható) információkra is szüksége van. Köztudott azonban, hogy az ember nem birkózik meg jól a nagy mennyiségű „nyers” feldolgozatlan információval. A döntéstámogató gép szerepe tehát az lehet, hogy előzetes információ-előkészítést végez a vezérlő objektumról és a nem kontrollálható tényezőkről (környezet), segít átlátni bizonyos döntések következményeit, és mindezt vizuálisan bemutatja. és kényelmes módja a döntéshozatalnak.

Így az automatizált döntéstámogató rendszerek kompenzálják az ember gyengeségeit, megszabadítva őt a rutin előzetes információfeldolgozástól, és kényelmes információs környezetet biztosítanak számára, amelyben jobban ki tudja mutatni erősségeit. Ezeknek a rendszereknek nem az a célja, hogy automatizálják a döntéshozó funkcióit (és ennek következtében elidegenítsék tőle ezeket a funkciókat, és ezáltal a meghozott döntésekért való felelősséget, ami gyakran általában elfogadhatatlan), hanem az, hogy segítséget nyújtsanak neki a jó megtalálásában. megoldás.

V, 2015. március 29

Jelenleg számos olyan feladat létezik, amelyben valamilyen döntést kell hozni a képen lévő objektum jelenlététől függően, vagy osztályozni kell. A „felismerés” képességét a biológiai lények fő tulajdonságának tekintik, míg a számítógépes rendszerek nem rendelkeznek teljesen ezzel a tulajdonsággal.

Nézzük meg az osztályozási modell általános elemeit.

Osztály- közös tulajdonságokkal rendelkező objektumok halmaza. Az azonos osztályba tartozó objektumok esetében feltételezzük a „hasonlóság” jelenlétét. Egy felismerési feladathoz tetszőleges számú, 1-nél nagyobb osztály definiálható. Az osztályok számát az S szám jelöli. Minden osztálynak saját azonosító osztálycímkéje van.

Osztályozás- az osztálycímkék objektumokhoz való hozzárendelésének folyamata, ezen objektumok tulajdonságainak bizonyos leírása szerint. Az osztályozó olyan eszköz, amely objektum attribútumokat kap bemeneti adatként, és ennek eredményeként osztálycímkét állít elő.

Ellenőrzés- az objektumpéldány egyetlen objektummodellhez vagy osztályleíráshoz való hozzárendelésének folyamata.

Alatt út meg fogjuk érteni annak a területnek a nevét a jellemzők terében, amelyben az anyagi világ számos tárgya vagy jelensége megjelenik. Jel- a vizsgált tárgy vagy jelenség egy adott tulajdonságának mennyiségi leírása.

Feature space ez egy adott felismerési feladathoz definiált N-dimenziós tér, ahol N bármely objektum mért jellemzőinek rögzített száma. A felismerési feladat objektumnak megfelelő x jellemzőtérből származó vektor egy N-dimenziós vektor komponensekkel (x_1,x_2,…,x_N), amelyek ennek az objektumnak a jellemzőértékei.

Más szóval, a mintafelismerés úgy definiálható, mint a forrásadatoknak egy bizonyos osztályhoz való hozzárendelése azáltal, hogy a lényegtelen részletek teljes tömegéből azonosítjuk azokat a lényeges jellemzőket vagy tulajdonságokat, amelyek ezeket az adatokat jellemzik.

Példák az osztályozási problémákra:

  • karakter felismerés;
  • beszédfelismerés;
  • orvosi diagnózis felállítása;
  • időjárás-jelentés;
  • arcfelismerés
  • dokumentumok minősítése stb.

A forrásanyag leggyakrabban a kamerából kapott kép. A probléma úgy fogalmazható meg, hogy a vizsgált kép minden osztályára jellemzővektorokat kapunk. A folyamat egy olyan kódolási folyamatnak tekinthető, amely magában foglalja az egyes osztályok jellemzőteréből minden egyes jellemzőhöz érték hozzárendelését.

Ha figyelembe vesszük a tárgyak 2 osztályát: felnőttek és gyermekek. Jelként választhat magasságot és súlyt. Amint az ábrából következik, ez a két osztály két diszjunkt halmazt alkot, ami a kiválasztott jellemzőkkel magyarázható. Nem mindig lehet azonban osztályjellemzőként kiválasztani a helyes mért paramétereket. Például a kiválasztott paraméterek nem alkalmasak focisták és kosárlabdázók diszjunkt osztályainak létrehozására.

A felismerés második feladata jellegzetes vonások vagy tulajdonságok kinyerése a forrásképekből. Ez a feladat az előfeldolgozáshoz sorolható. Ha figyelembe vesszük a beszédfelismerés feladatát, megkülönböztethetünk olyan jellemzőket, mint a magánhangzók és a mássalhangzók. Az attribútumnak egy adott osztály jellemző tulajdonságának kell lennie, ugyanakkor közösnek kell lennie ebben az osztályban. Jellemzők, amelyek a különbségeket jellemzik - osztályok közötti jellemzők. Az összes osztályban közös jellemzők nem hordoznak hasznos információkat, és nem tekintendők jellemzőknek a felismerési feladatban. A jellemzők kiválasztása a felismerő rendszer kiépítésével kapcsolatos egyik fontos feladat.

A jellemzők meghatározása után meg kell határozni az osztályozás optimális döntési eljárását. Tekintsünk egy mintafelismerő rendszert, amely különböző M osztályok felismerésére szolgál, m_1,m_2,…,m 3. Ekkor feltételezhetjük, hogy a képtér M régióból áll, amelyek mindegyike egy osztály képének megfelelő pontokat tartalmaz. Ekkor a felismerési probléma felfogható az M osztályt elválasztó határok felépítésének az átvett mérési vektorok alapján.

A kép-előfeldolgozás, a jellemzők kinyerése, valamint az optimális megoldás és osztályozás problémájának megoldása általában számos paraméter becslésének szükségességével jár. Ez a paraméterbecslés problémájához vezet. Ezen túlmenően nyilvánvaló, hogy a jellemzők kinyerése további információkat használhat az osztályok jellege alapján.

Az objektumok mérési vektorként való megjelenítésük alapján összehasonlíthatók. Kényelmes a mérési adatokat valós számok formájában ábrázolni. Ekkor két objektum jellemzővektorának hasonlósága az euklideszi távolság segítségével írható le.

ahol d a jellemzővektor dimenziója.

A mintafelismerő módszereknek 3 csoportja van:

  • Összehasonlítás a mintával. Ez a csoport tartalmazza a legközelebbi átlag szerinti osztályozást, a legközelebbi szomszédtól való távolság szerinti osztályozást. A mintával való összehasonlítás csoportjába a strukturális felismerési módszerek is beilleszthetők.
  • Statisztikai módszerek. Ahogy a neve is sugallja, a statisztikai módszerek bizonyos statisztikai információkat használnak fel egy felismerési probléma megoldása során. A módszer a valószínűség alapján határozza meg, hogy egy objektum egy adott osztályhoz tartozik-e. Bizonyos esetekben ez egy adott osztályhoz tartozó objektum utólagos valószínűségének meghatározásához vezet, feltéve, hogy az objektum jellemzői a megfelelő értékeket vették fel. Példa erre a Bayes-féle döntési szabályon alapuló módszer.
  • Neurális hálózatok. A felismerési módszerek külön osztálya. Mások megkülönböztető jellemzője a tanulási képesség.

Osztályozás a legközelebbi átlag szerint

A klasszikus mintafelismerő megközelítésben, amelyben egy ismeretlen osztályozási objektumot elemi jellemzők vektoraként ábrázolnak. A jellemző alapú felismerő rendszer többféleképpen fejleszthető. Ezeket a vektorokat a rendszer előzetesen ismerheti a betanítás eredményeként, vagy egyes modellek alapján valós időben előre jelezheti.

Egy egyszerű osztályozási algoritmus az osztály referenciaadatok csoportosítása az osztály elvárásvektor (átlag) segítségével.

ahol x(i,j) az i osztály j-edik referencia jellemzője, n_j az i osztály referenciavektorainak száma.

Ekkor egy ismeretlen objektum az i. osztályba tartozik, ha lényegesen közelebb van az i. osztály matematikai elvárásainak vektorához, mint más osztályok matematikai elvárásainak vektoraihoz. Ez a módszer olyan problémákra alkalmas, amelyekben az egyes osztályok pontjai kompaktan és távol helyezkednek el más osztályok pontjaitól.

Nehézségek adódhatnak, ha az osztályok kissé bonyolultabb szerkezetűek, például, mint az ábrán. Ebben az esetben a 2. osztály két diszjunkt részre oszlik, amelyeket egyetlen átlagérték rosszul ír le. Ezenkívül a 3. osztály túlságosan megnyúlt; a 3. osztály nagy x_2 ​​koordinátájú mintái közelebb állnak az 1. osztály átlagos értékéhez, mint a 3. osztályhoz.

A leírt probléma bizonyos esetekben megoldható a távolságszámítás megváltoztatásával.

Figyelembe vesszük az osztályértékek „szórásának” jellemzőjét - σ_i, minden i koordinátairány mentén. A szórás egyenlő a variancia négyzetgyökével. Az x vektor és az x_c elvárásvektor közötti skálázott euklideszi távolság a következő

Ez a távolságképlet csökkenti az osztályozási hibák számát, de a valóságban a legtöbb probléma nem ábrázolható ilyen egyszerű osztállyal.

Osztályozás a legközelebbi szomszédtól való távolság szerint

Az osztályozás másik módja az, hogy egy ismeretlen x jellemzővektort rendelünk ahhoz az osztályhoz, amelyhez az egyedi mintához ez a vektor a leginkább hasonlít. Ezt a szabályt a legközelebbi szomszéd szabályának nevezzük. A legközelebbi szomszéd osztályozása még akkor is hatékonyabb lehet, ha az osztályok összetett szerkezetűek, vagy ha az osztályok átfedik egymást.

Ez a megközelítés nem igényel feltételezéseket a jellemzővektorok térbeli eloszlási modelljeivel kapcsolatban. Az algoritmus csak az ismert referenciamintákra vonatkozó információkat használ fel. A megoldási módszer az adatbázisban lévő egyes mintáktól számított x távolság kiszámításán és a minimális távolság megtalálásán alapul. Ennek a megközelítésnek az előnyei nyilvánvalóak:

  • bármikor hozzáadhat új mintákat az adatbázishoz;
  • fa és rács adatszerkezetek csökkentik a számított távolságok számát.

Ráadásul jobb lesz a megoldás, ha az adatbázisban nem egy legközelebbi szomszédra keresünk, hanem k-ra. Ekkor k > 1 esetén ez biztosítja a legjobb mintavételezést a vektorok d-dimenziós térbeli eloszlásáról. A k érték hatékony felhasználása azonban attól függ, hogy elegendő szám van-e a tér minden régiójában. Ha kettőnél több osztály van, nehezebb meghozni a helyes döntést.

Irodalom

  • M. Castrillon, . O. Deniz, . D. Hernández és J. Lorenzo, „Arc- és arcvonás-detektorok összehasonlítása a Viola-Jones általános tárgyfelismerési keretrendszer alapján”, International Journal of Computer Vision, 22., pp. 481-494, 2011.
  • Y.-Q. Wang, „An Analysis of Viola-Jones Face Detection Algorithm”, IPOL Journal, 2013.
  • L. Shapiro és D. Stockman, Computer Vision, Binom. Tudáslaboratórium, 2006.
  • Z. N. G., Felismerési módszerek és alkalmazásuk, Szovjet Rádió, 1972.
  • J. Tu, R. Gonzalez, A mintafelismerés matematikai alapelvei, Moszkva: „Mir” Moszkva, 1974.
  • Khan, H. Abdullah és M. Shamian Bin Zainal, „Hatékony szem- és szájfelismerési algoritmus a viola jones és a bőrszín pixelérzékelés kombinációjával”, International Journal of Engineering and Applied Sciences, No. Vol. 3 2013. 4. sz.
  • V. Gaede és O. Gunther, „Multidimensional Access Methods”, ACM Computing Surveys, pp. 170-231, 1998.


Előző cikk: Következő cikk:

© 2015 .
Az oldalról | Kapcsolatok
| Webhelytérkép