Otthon » Feltételesen ehető gomba » Mintafelismerő konstrukció és képzés. A tárgykör formalizálásának feladata

Mintafelismerő konstrukció és képzés. A tárgykör formalizálásának feladata

Az élő rendszerek, köztük az emberek megjelenésük óta folyamatosan szembesülnek a mintafelismerés problémájával. Különösen az érzékszervekből érkező információkat dolgozza fel az agy, amely sorba rendezi az információkat, biztosítja a döntéshozatalt, majd elektrokémiai impulzusok segítségével továbbítja a szükséges jelet például a mozgásszervekhez, amelyek megvalósítják. a szükséges intézkedéseket. Ekkor megváltozik a környezet, és ismét a fenti jelenségek jelentkeznek. És ha ránézünk, minden szakaszt elismerés kísér.

A számítástechnika fejlődésével számos életfolyamat során felmerülő probléma megoldása, az eredmény megkönnyítése, felgyorsítása, minőségének javítása vált lehetővé. Például a munka különféle rendszerekéletfenntartás, ember-számítógép interakció, robotrendszerek megjelenése stb.. Megjegyezzük azonban, hogy egyes feladatokban (gyorsan mozgó hasonló tárgyak felismerése, kézzel írt szöveg) jelenleg nem lehet kielégítő eredményt nyújtani.

A munka célja: a képfelismerő rendszerek történetének tanulmányozása.

Jelölje meg a mintafelismerés területén bekövetkezett, elméleti és technikai minőségi változásokat, az okok megjelölésével;

A számítástechnikában használt módszerek és elvek megbeszélése;

Mondjon példákat a közeljövőben várható kilátásokra.

1. Mi a mintafelismerés?

Az első tanulmányok vele számítástechnika alapvetően a matematikai modellezés klasszikus sémáját követte - matematikai modell, algoritmus és számítás. Ezek voltak az atombomba-robbanások során fellépő folyamatok modellezése, ballisztikus pályák kiszámítása, gazdasági és egyéb alkalmazások. Ennek a sorozatnak a klasszikus elképzelései mellett azonban egészen más természeten alapuló módszerek is felmerültek, és ahogy az egyes problémák megoldásának gyakorlata mutatta, gyakran adtak legjobb eredmény nem pedig a túlbonyolított matematikai modelleken alapuló megoldásokat. Elképzelésük az volt, hogy feladják azt a vágyat, hogy kimerítő matematikai modellt alkossanak a vizsgált objektumról (sőt sokszor szinte lehetetlen is volt adekvát modelleket megalkotni), és ehelyett csak a minket érdeklő konkrét kérdések megválaszolásával elégedjenek meg. ezekre a válaszokra keresse a problémák széles osztályára jellemző megfontolások alapján. Az ilyen jellegű kutatások magukban foglalták a vizuális képek felismerését, a terméshozamok, a folyók vízszintjének előrejelzését, az olajtartalmú és vízadó rétegek közvetett geofizikai adatok alapján történő megkülönböztetésének feladatát stb. Ezekben a feladatokban konkrét válaszra volt szükség, meglehetősen egyszerű formában, pl. például, hogy egy objektum az előre rögzített osztályok valamelyikébe tartozik-e. És ezeknek a feladatoknak a kezdeti adatait általában töredékes információk formájában adták meg a vizsgált objektumokról, például előre osztályozott objektumok halmaza formájában. Matematikai szempontból ez azt jelenti, hogy a mintafelismerés (és így hívták ezt a problémaosztályt hazánkban) a függvény extrapoláció gondolatának messzemenő általánosítása.

Egy ilyen megállapítás fontossága a műszaki tudományok számára kétségtelen, és ez önmagában is igazolja, hogy számos vizsgálatot végeznek ezen a területen. A mintafelismerés problémájának azonban tágabb aspektusa is van a természettudomány számára (bár furcsa lenne, ha a mesterséges kibernetikai rendszerek számára ennyire fontos dolognak ne lenne jelentősége a természeteseknél). Ennek a tudománynak a kontextusába szervesen beletartoztak az ókori filozófusok által feltett kérdések is tudásunk természetéről, a környező világ képeinek, mintáinak és helyzeteinek felismerésének képességéről. Valójában nem kétséges, hogy a legegyszerűbb képek felismerésének mechanizmusai, mint például a közeledő veszélyes ragadozók vagy táplálékok képei, sokkal korábban kialakultak, mint a elemi nyelvés formális logikai apparátus. És kétségtelen, hogy az ilyen mechanizmusok meglehetősen fejlettek a magasabb rendű állatokban, amelyeknek élettevékenységük során is sürgősen szükségük van arra, hogy képesek legyenek megkülönböztetni a természet meglehetősen összetett jelrendszerét. A természetben tehát azt látjuk, hogy a gondolkodás és a tudat jelensége egyértelműen a képfelismerési képességen alapul, és az intelligencia tudományának további fejlődése közvetlenül összefügg a felismerés alaptörvényeinek megértésének mélységével. Megértve azt a tényt, hogy a fenti kérdések messze túlmutatnak a mintafelismerés szokásos definícióján (az angol nyelvű szakirodalomban gyakoribb a felügyelt tanulás kifejezés), azt is meg kell értenünk, hogy mély összefüggéseik vannak ezzel a viszonylag szűk (de mégis messze nem kimerült) irány.

A mintafelismerés már most szilárdan meghonosodott mindennapi életés a modern mérnök egyik leglényegesebb tudása. Az orvostudományban a mintafelismerés segít az orvosoknak pontosabb diagnózis felállításában a gyárakban, az árutételek hibáinak előrejelzésére szolgál. A biometrikus személyazonosító rendszerek, mint algoritmikus magjuk, szintén ennek a tudományágnak az eredményein alapulnak. További fejlesztés mesterséges intelligencia, különösen az ötödik generációs számítógépek tervezése, amelyek képesek közvetlenebb kommunikációra az emberekkel az ember számára természetes nyelveken és a beszéd útján, elképzelhetetlen felismerés nélkül. Csak egy kőhajításnyira van a robotikától és a mesterséges vezérlőrendszerektől, amelyek létfontosságú alrendszerként tartalmazzák a felismerő rendszereket.

Éppen ezért a mintafelismerés fejlesztése a kezdetektől fogva nagy figyelmet keltett a különféle profilú szakemberek - kibernetikusok, neurofiziológusok, pszichológusok, matematikusok, közgazdászok stb. Nagyrészt ez az oka annak, hogy magát a modern mintafelismerést is e tudományágak elképzelései táplálják. A teljesség (és benne) színlelése nélkül rövid esszé lehetetlen állítani) ismertetjük a mintafelismerés történetét, kulcsgondolatait.

Meghatározások

Mielőtt rátérnénk a mintafelismerés főbb módszereire, bemutatunk néhány szükséges definíciót.

A mintafelismerés (objektumok, jelek, szituációk, jelenségek vagy folyamatok) az a feladat, hogy egy tárgyat azonosítsunk, vagy annak képéről (optikai felismerés) vagy hangfelvételéről (akusztikus felismerés) és egyéb jellemzőiből meghatározzuk annak bármely tulajdonságát.

Az egyik alapvető a halmaz fogalma, amelynek nincs konkrét megfogalmazása. A számítógépben egy halmazt azonos típusú, nem ismétlődő elemek halmazaként ábrázolunk. A „nem ismétlődő” szó azt jelenti, hogy a halmaz valamely eleme vagy ott van, vagy nincs. Az univerzális halmaz tartalmazza a megoldandó probléma összes lehetséges elemét, az üres halmaz nem tartalmaz.

Kép – osztályozási csoportosítás egy osztályozási rendszerben, amely egyesíti (kiemeli) bizonyos csoport tárgyak valamilyen jellemző szerint. A képeknek van egy jellegzetes tulajdonságuk, ami abban nyilvánul meg, hogy a megismerést véges szám ugyanabból a halmazból származó jelenségek lehetővé teszik tetszőleges számú képviselőjének felismerését. A képeknek jellegzetes objektív tulajdonságaik vannak abban az értelemben, hogy a különböző megfigyelési anyagokon képzett emberek többnyire azonos módon és egymástól függetlenül osztályozzák ugyanazokat a tárgyakat. A felismerési probléma klasszikus megfogalmazásában az univerzális halmaz képrészekre oszlik. Egy tárgynak a felismerőrendszer észlelőszerveire történő minden egyes leképezését, függetlenül a szervekhez viszonyított helyzetétől, általában a tárgy képének, illetve az ilyen képek halmazainak nevezik, amelyeket egyesít általános tulajdonságok, ábrázolja a képeket.

Azt a módszert, amellyel bármely képhez elemet rendelünk, döntő szabálynak nevezzük. Egy másik fontos fogalom a metrika, egy univerzális halmaz elemei közötti távolság meghatározásának módja. Minél kisebb ez a távolság, annál hasonlóbbak a tárgyak (szimbólumok, hangok stb.) - amit felismerünk. Az elemek általában számok halmazaként vannak megadva, a metrika pedig függvényként. A program hatékonysága a képábrázolás megválasztásától és a metrika megvalósításától függ, hogy egy-egy felismerési algoritmus különböző mérőszámokkal hibázik különböző gyakorisággal.

A tanulást általában annak a folyamatnak nevezik, amikor egy bizonyos rendszerben egy vagy másik reakciót alakítanak ki külső azonos jelek csoportjaira a külső kiigazítások rendszerének való ismételt expozíció révén. Az ilyen külső kiigazításokat az edzésben általában „jutalomnak” és „büntetésnek” nevezik. A kiigazítás létrehozásának mechanizmusa szinte teljesen meghatározza a tanulási algoritmust. Az öntanulás abban különbözik a képzéstől, hogy itt nem adnak további információkat a rendszerre adott reakció helyességéről.

Az adaptáció a rendszer paramétereinek és szerkezetének, esetleg vezérlési akcióinak megváltoztatásának folyamata az aktuális információk alapján annak érdekében, hogy kezdeti bizonytalanság és változó működési feltételek mellett a rendszer bizonyos állapotát elérjük.

A tanulás egy olyan folyamat, melynek eredményeként a rendszer fokozatosan elsajátítja azt a képességet, hogy a külső hatások bizonyos halmazaira a szükséges reakciókkal válaszoljon, az adaptáció pedig a rendszer paramétereinek és felépítésének beállítása a kívánt ellenőrzési minőség elérése érdekében. a külső körülmények folyamatos változásával szemben.

Példák mintafelismerő feladatokra: - Betűfelismerés;

És jelek. Az ilyen problémák gyakran megoldódnak, például amikor keresztezik vagy áthaladnak egy utcán a közlekedési lámpákat követve. A világító lámpa színének felismerése és a szabályok ismerete forgalom lehetővé teszi, hogy megfelelő döntést hozzon arról, hogy átmehet-e vagy sem az utcán.

A biológiai evolúció folyamatában sok állat látó- és hallókészüléke segítségével oldott meg problémákat. minta felismerés elég jó. Mesterséges rendszerek létrehozása minta felismerés továbbra is összetett elméleti és műszaki probléma. Az ilyen felismerés szükségessége számos területen felmerül – a katonai ügyektől és a biztonsági rendszerektől a mindenféle analóg jel digitalizálásáig.

Hagyományosan a mintafelismerő feladatok is a mesterséges intelligencia feladatok körébe tartoznak.

Útmutató a mintafelismeréshez

Két fő irányvonal különíthető el:

  • Az élőlények felismerő képességeinek tanulmányozása, magyarázata, modellezése;
  • Elméleti és módszerek kidolgozása alkalmazott alkalmazások egyedi problémáinak megoldására tervezett eszközök konstrukciójához.

A probléma hivatalos megfogalmazása

A mintafelismerés a forrásadatok egy adott osztályhoz való hozzárendelése kiválasztással lényeges jellemzői, jellemzi ezeket az adatokat össztömeg irreleváns adatok.

A felismerési problémák felállításakor a matematikai nyelvet próbálják használni, a mesterséges neurális hálózatok elméletétől eltérően, ahol az eredmény kísérleti úton történő megszerzése az alap, a kísérletet logikai érveléssel és matematikai bizonyítással helyettesíteni.

A monokróm képeket leggyakrabban mintafelismerési problémákban veszik figyelembe, ami lehetővé teszi, hogy a képet egy síkon lévő függvényként tekintsük. Ha figyelembe vesszük a síkon beállított pontot T, ahol a függvény x(x,y) jellemzőit fejezi ki a kép minden pontján - fényerő, átlátszóság, optikai sűrűség, akkor ilyen funkció a kép formális rögzítése.

Az összes lehetséges függvény halmaza x(x,y) a repülőn T- van egy modell az összes kép halmazáról X. A koncepció bemutatása hasonlóságokat a képek között fel lehet tenni egy felismerési feladatot. Egy ilyen kijelentés konkrét típusa erősen függ a felismerés későbbi szakaszaitól az egyik vagy másik megközelítés szerint.

Mintafelismerési módszerek

Az optikai mintafelismeréshez használhatja az objektum nézetének számbavételét különböző szögekben, léptékekben, eltolásokban stb. A betűk esetében fel kell sorolni a betűtípust, a betűtípus tulajdonságait stb.

A második megközelítés az objektum körvonalának megkeresése és tulajdonságainak (összeköthetőség, sarkok jelenléte stb.) vizsgálata.

Egy másik megközelítés a mesterséges neurális hálózatok használata. Ez a módszer vagy nagyszámú példát igényel a felismerési feladatra (helyes válaszokkal), vagy egy speciális neurális hálózati struktúrát, amely figyelembe veszi ennek a feladatnak a sajátosságait.

Perceptron mint mintafelismerő módszer

F. Rosenblatt bemutatja az agymodell fogalmát, melynek feladata, hogy bemutassa, hogyan fizikai rendszer, melynek szerkezete és funkcionális tulajdonságai ismertek, pszichológiai jelenségek léphetnek fel - írta le a legegyszerűbben diszkriminációs kísérletek. Ezek a kísérletek teljes mértékben a mintafelismerési módszerekhez kapcsolódnak, de abban különböznek egymástól, hogy a megoldási algoritmus nem determinisztikus.

A legegyszerűbb kísérlet, amelyből egy bizonyos rendszerről pszichológiailag jelentős információhoz juthatunk, abban rejlik, hogy a modell két különböző ingerrel jelenik meg, és ezekre különböző módon kell reagálnia. Egy ilyen kísérlet célja lehet annak vizsgálata, hogy a kísérletet végző személy beavatkozása hiányában a rendszer spontán megkülönbözteti őket, vagy fordítva, a kényszerű diszkrimináció tanulmányozása, amelyben a kísérletvezető arra törekszik, hogy a rendszert arra tanítsa. elvégzi a szükséges osztályozást.

A perceptron tréninggel végzett kísérlet során általában egy bizonyos képsort mutatnak be, amely tartalmazza az egyes megkülönböztetendő osztályok képviselőit. Valamilyen memóriamódosítási szabály szerint helyes választás a reakciók megerősödnek. Ezután a perceptront egy kontrollingerrel mutatják be, és meghatározzák annak valószínűségét, hogy egy adott osztályba tartozó ingerekre a megfelelő választ kapja. Attól függően, hogy a kiválasztott vezérlőinger egybeesik-e vagy nem esik egybe az edzéssorozatban használt képek egyikével, különböző eredményeket kapunk:

  • 1. Ha a kontrollinger nem esik egybe egyik edzésingerrel sem, akkor a kísérlet nem csak a tiszta diszkrimináció, hanem elemeket is tartalmaz általánosítások.
  • 2. Ha egy kontrollinger egy bizonyos szenzoros elemkészletet gerjeszt, amely teljesen különbözik azoktól az elemektől, amelyek az előzőleg azonos osztályba tartozó ingerek hatására aktiválódtak, akkor a kísérlet egy vizsgálat. tiszta általánosítás .

A perceptronok nem rendelkeznek a tiszta általánosítás képességével, de elég kielégítően működnek a diszkriminációs kísérletekben, különösen akkor, ha a kontrollinger elég szorosan illeszkedik valamelyik képhez, amellyel a perceptron már felhalmozott némi tapasztalatot.

Példák mintafelismerési problémákra

  • Betűfelismerés.
  • Vonalkód felismerés.
  • Rendszám felismerés.
  • Arcfelismerés.
  • Beszédfelismerés.
  • Képfelismerés.
  • A földkéreg azon helyi területeinek felismerése, ahol ásványlelőhelyek találhatók.

Mintafelismerő programok

Lásd még

Megjegyzések

Linkek

  • Jurij Lifshits. „Az elméleti számítástechnika modern problémái” tanfolyam - előadások a mintafelismerés statisztikai módszereiről, arcfelismerésről, szövegosztályozásról
  • Journal of Pattern Recognition Research

Irodalom

  • David A. Forsythe, Jean Pons Számítógépes látás. Modern megközelítés= Számítógépes látás: modern megközelítés. - M.: "Williams", 2004. - P. 928. - ISBN 0-13-085198-1
  • George Stockman, Linda Shapiro Számítógépes látás = Computer Vision. - M.: Binom. Tudáslaboratórium, 2006. - P. 752. - ISBN 5947743841

Wikimédia Alapítvány.

2010. - tudományosan a technikában műszaki irány olyan módszerek kifejlesztésével és rendszerek (beleértve a számítógépes alapú) felépítésével is összefüggenek, amelyek egy bizonyos objektum (tárgy, folyamat, jelenség, helyzet, jel) valamely előrelépéshez való tartozását állapítják meg... ...

Az egyik új régió kibernetika. R. o. elméletének tartalma. több osztályba tartozó objektumok (képek) tulajdonságainak extrapolálása olyan objektumokra, amelyek valamilyen értelemben közel állnak hozzájuk. Általában, amikor egy automatát R. o. elérhető...... Földtani enciklopédia

angol felismerés, kép; német Gestalt alterkennung. A matematikai kibernetika olyan ága, amely elveket és módszereket fejleszt az objektumok osztályozására és azonosítására, amelyeket az őket jellemző tulajdonságok véges halmaza ír le. Antinazi. Enciklopédia...... Szociológiai Enciklopédia

Minta felismerés- összetett objektumok számítógépes tanulmányozásának módszere; olyan funkciók kiválasztásából, valamint algoritmusok és programok fejlesztéséből áll, amelyek lehetővé teszik a számítógépek számára, hogy automatikusan osztályozzák az objektumokat e jellemzők alapján. Például annak meghatározása, hogy melyik...... Közgazdasági és matematikai szótár

- (műszaki), tudományos és műszaki irányzat, amely a módszerek fejlesztésével és a rendszerek (beleértve a számítógépes alapú) felépítésével kapcsolatos valamely objektum (tárgy, folyamat, jelenség, helyzet, jel) valamely már meglévőhöz való tartozásának megállapítására. ... ... Enciklopédiai szótár

MINTÁZATFELISMERÉS- a matematikai kibernetika olyan része, amely osztályozási módszereket fejleszt, valamint objektumok, jelenségek, folyamatok, jelek, helyzetek azonosítását mindazon objektumok esetében, amelyek bizonyos jelek vagy tulajdonságok véges halmazával leírhatók... ... Orosz Szociológiai Enciklopédia

minta felismerés- 160 mintafelismerés: Az ábrázolások és konfigurációk formáinak azonosítása automatikus eszközökkel

Ebben a cikkben arra törekedtem, hogy a gépi tanuláselmélet néhány alapvető eredményét kiemeljem oly módon, hogy a fogalmak egyértelművé váljanak az osztályozási és regressziós problémákat némileg ismerő olvasók számára. Egy ilyen cikk megírásának gondolata minden egyes elolvasott könyvvel egyre jobban megfogalmazódott bennem, amelyben a felismerésre tanító gépek gondolatai mintha a közepétől szólnának, és teljesen homályos volt, hogy ennek, ill. arra a módszerre támaszkodott a kidolgozásakor. Másrészt számos könyv foglalkozik az alapvető fogalmakkal gépi tanulás, de a bennük lévő anyagok bemutatása első olvasatra túl bonyolultnak tűnhet.

Motiváció

Tekintsük ezt a problémát. Két osztályú almánk van - ízletes és nem ízletes, 1 és 0. Az almának vannak sajátosságai - szín és méret. A szín folyamatosan változik 0-ról 1-re, azaz. 0 - teljesen zöld alma, 1 - teljesen piros. A méret ugyanúgy változhat, 0 - kis alma, 1 - nagy. Szeretnénk kidolgozni egy olyan algoritmust, amely színt és méretet kapna bemenetként, és kiírná az alma osztályát - akár ízletes, akár nem. Nagyon kívánatos, hogy a hibák száma kisebb legyen, mint kevesebb téma jobb. Ugyanakkor van egy végleges listánk, amely az alma színére, méretére és osztályára vonatkozó történelmi adatokat tartalmazza. Hogyan tudnánk megoldani egy ilyen problémát?

Logikus megközelítés

Problémánk megoldása során elsőként ez juthat eszünkbe: készítsünk manuálisan if-else-szerű szabályokat, és a szín- és méretértékek függvényében egy bizonyos osztályt rendelünk az almához. Azok. megvannak az előfeltételeink - szín és méret, és ennek van egy következménye - az alma íze. Teljesen ésszerű, ha kevés a jel, és összehasonlítás céljából szemre tudod becsülni a küszöbértékeket. De megtörténhet, hogy nem lehet egyértelmű feltételekkel előállni, és az adatokból sem derül ki, hogy melyik küszöböt vegyük fel, és a jelek száma növekedhet a jövőben. Mi lenne, ha a történeti adatokat tartalmazó listánkon két azonos színű és méretű almát találnánk, de az egyik ízletesnek van jelölve, a másik pedig nem? Így az első módszerünk nem olyan rugalmas és skálázható, mint szeretnénk.

Megnevezések

Vezessük be a következő jelölést. A th almát jelöljük . Viszont mindegyik két számból áll - színből és méretből. Ezt a tényt egy számpárral jelöljük: . Minden -edik alma osztályát jelöljük. Az előzményadatokat tartalmazó listát betűvel jelöljük, a lista hossza: . A lista edik eleme az alma attribútumainak és osztályának értéke. Azok. . Nevezzük mintának is. Nagybetűkkel jelöljük azokat a változókat, amelyek egy adott attribútum és osztály értékeit vehetik fel. Vezessünk be egy új koncepciót – a döntési szabály egy olyan függvény, amely színt és méretet vesz fel bemenetként, és egy osztálycímkét ad vissza kimenetként:

Valószínűségi megközelítés

A premisszákkal és következményekkel járó logikai módszer ötletének kidolgozása során tegyük fel magunknak a kérdést - mennyi a valószínűsége annak, hogy a mért szín- és méretértékek mellett ízletes lesz a mintánkba nem tartozó alma? A valószínűségszámítás jelölésében ez a kérdés a következőképpen írható fel:

Ez a kifejezés premisszaként, következményként is értelmezhető, de az előfeltevésből a következménybe való átmenet nem logikai, hanem valószínűségi törvényeknek fog engedelmeskedni. Azok. Egy osztály 0 és 1 logikai értékeivel rendelkező igazságtáblázat helyett 0 és 1 közötti valószínűségi értékek lesznek. Alkalmazza Bayes képletét, és kapja meg a következő kifejezést:

Nézzük meg részletesebben ennek a kifejezésnek a jobb oldalát. A szorzót előzetes valószínűségnek nevezzük, és azt a valószínűséget jelenti, hogy az összes lehetséges alma között ízletes almát találunk. Előzetesen fennáll annak a valószínűsége, hogy ízetlen almával találkozunk. Ez a valószínűség tükrözheti személyes tudásunkat arról, hogy az ízletes és kellemetlen alma hogyan oszlik meg a természetben. Például korábbi tapasztalatainkból tudjuk, hogy az összes alma 80%-a ízletes. Vagy megbecsülhetjük ezt az értéket egyszerűen úgy, hogy kiszámítjuk a listánkon szereplő ízletes almák arányát az S történeti adatokkal. A következő tényező azt mutatja meg, hogy mekkora valószínűséggel kap egy adott szín- és méretértéket egy 1. osztályú alma esetében. Ezt a kifejezést más néven ún. a likelihood függvényt, és így nézhet ki: valamilyen konkrét eloszlás, például normál. A nevezőt normalizáló állandóként használjuk, hogy a kívánt valószínűség 0 és 1 között változzon. Végső célunk nem a valószínűségek keresése, hanem a keresés döntő szabály, ami azonnal osztályt adna nekünk. A döntési szabály végső formája attól függ, hogy milyen értékeket és paramétereket ismerünk. Például csak az előzetes valószínűség értékeit ismerhetjük meg, a fennmaradó értékeket nem tudjuk megbecsülni. Ekkor a döntő szabály ez lesz: rendeljük hozzá az összes almához annak az osztálynak az értékét, amelynek a priori valószínűsége a legnagyobb. Azok. Ha tudjuk, hogy a természetben az alma 80%-a ízletes, akkor minden almának 1-es osztályt adunk. Ekkor a hibánk 20%. Ha meg tudjuk becsülni a $p(X=x_m | Y=1)$ likelihood függvény értékeit is, akkor a Bayes-képlet segítségével megtalálhatjuk a kívánt valószínűség értékét a fent leírtak szerint. A döntő szabály itt a következő lesz: tegyen egy címkét annak az osztálynak, amelynek a valószínűsége a legnagyobb:

Nevezzük ezt a szabályt Bayesi osztályozónak. Mivel valószínűségekkel van dolgunk, sőt nagy érték A valószínűség nem garantálja, hogy az alma nem tartozik a 0 osztályba. Becsüljük meg a hiba valószínűségét egy almán a következőképpen: ha a döntési szabály 1-gyel egyenlő osztályértéket adott vissza, akkor a hiba valószínűsége fordítva:

Nem csak ezen érdekel minket az osztályozó hiba valószínűsége konkrét példa, hanem általában az összes lehetséges almára:

Ez a kifejezés a hiba várható értéke. Tehát az eredeti problémát megoldva elérkeztünk a bayesi osztályozóhoz, de mik a hátrányai? Fő probléma- becsülje meg az adatokból a feltételes valószínűséget. Esetünkben egy tárgyat egy számpárral ábrázolunk - szín és méret, de több összetett feladatok a jellemzők dimenziója sokszorosa lehet, és előfordulhat, hogy a listánkon szereplő megfigyelések száma történeti adatokkal nem elegendő egy többdimenziós valószínűségi változó valószínűségének becsléséhez. Ezután megpróbáljuk általánosítani az osztályozóhiba fogalmát, és azt is megvizsgáljuk, hogy lehetséges-e más osztályozót választani a probléma megoldására.

Osztályozó hibaveszteség

Tegyük fel, hogy már van valamilyen döntési szabály. Ekkor kétféle hibát követhet el – az első az, hogy egy objektumot rendel a 0-s osztályhoz, amelynek valós osztálya 1, és fordítva, egy objektumot rendel az 1-es osztályhoz, amelynek valós osztálya 0. Egyes feladatokban ez fontos. megkülönböztetni ezeket az eseteket. Például jobban szenvedünk, ha egy ízletesnek címkézett alma ízetlennek bizonyul, és fordítva. A csalódott várakozásokból fakadó kényelmetlenségünk mértékét formalizáljuk a koncepcióban. Általánosságban elmondható, hogy van egy veszteségfüggvényünk, amely minden osztályozó hibához egy számot ad vissza. Legyen igazi osztálycímke. A veszteségfüggvény ezután visszaadja a tényleges osztálycímke veszteségértékét és a döntési szabályunk értékét. Példa ennek a függvénynek a használatára - veszünk egy ismert osztályú almából, átadjuk az almát döntési szabályunk bemeneteként, megkapjuk az osztály becslését a döntési szabályból, ha az értékek egyeznek, akkor feltételezzük hogy az osztályozó nem tévedett és nincs veszteség, ha az értékek nem egyeznek, akkor a függvényünk a veszteség mértékét fogja mondani

Feltételes és bayesi kockázat

Most, hogy van egy veszteségfüggvényünk, és tudjuk, mennyit veszítünk az objektumok hibás besorolásából, jó lenne megérteni, mennyit veszítünk átlagosan sok objektum esetében. Ha ismerjük az értéket - annak a valószínűsége, hogy az alma ízletes lesz, figyelembe véve a mért szín- és méretértékeket, valamint az osztály valós értékét (például vegyünk egy almát az S mintából, lásd a cikk eleje), akkor bevezethetjük a feltételes kockázat fogalmát. A feltételes kockázat az eszköz veszteségeinek átlagos értéke a döntő szabály szempontjából:

Bináris besorolás esetén, amikor kiderül:

Fentebb leírtuk azt a döntési szabályt, amely a legnagyobb valószínűségi értékkel rendelkező osztályhoz rendel egy objektumot. Ez a szabály minimális veszteséget biztosít az átlagos veszteségeinkhez (Bayes-féle kockázat), ezért a Bayes-féle osztályozó a kockázati funkcionális szempontból optimális. bemutattuk. Ez azt jelenti, hogy a Bayes-féle osztályozó a lehető legkisebb osztályozási hibával rendelkezik.

Néhány tipikus veszteségfüggvény

Az egyik leggyakoribb veszteségfüggvény a szimmetrikus függvény, amikor az első és a második típusú hibákból származó veszteségek egyenértékűek. Például az 1-0 veszteségfüggvény (nulla-egy veszteség) a következőképpen definiálható:

Ekkor az a(x) = 1 feltételes kockázata egyszerűen annak a valószínűségnek az értéke lesz, hogy az objektumon 0 osztályt kapunk:

Hasonlóképpen a(x) = 0 esetén:

Az 1-0 veszteségfüggvény 1-et vesz fel, ha az osztályozó hibázik az objektumon, és 0-t, ha nem. Győződjön meg arról, hogy a hiba értéke nem 1, hanem egy másik Q függvényé, a döntési szabálytól és a valós osztálycímkétől függően:

Ekkor a feltételes kockázat a következőképpen írható fel:

Megjegyzések a jelöléshez

Az előző szöveg Duda és Hart könyvében elfogadott jelölés szerint íródott. Az eredeti könyvben V.N. Vapnik a következő folyamatot vette figyelembe: a természet a $p(x)$ eloszlás szerint kiválaszt egy objektumot, majd a $p(y|x)$ feltételes eloszlás szerint osztálycímkét rendel hozzá. Ekkor a kockázatot (veszteségvárakozást) úgy határozzuk meg

Hol van az a függvény, amellyel az ismeretlen függőséget közelíteni próbáljuk, az a veszteségfüggvény a valós értékre és a függvényünk értéke. Ez a jelölés egyértelműbb a következő fogalom – az empirikus kockázat – bevezetése érdekében.

Empirikus kockázat

Ebben a szakaszban már rájöttünk, hogy a logikai módszer nem megfelelő számunkra, mert nem elég rugalmas, és nem tudjuk használni a Bayes-osztályozót, ha sok jellemző van, de korlátozott számú képzési adat van, és nem tudja visszaállítani a valószínűséget. Azt is tudjuk, hogy a Bayes-féle osztályozó a lehető legkisebb osztályozási hibával rendelkezik. Mivel Bayes-féle osztályozót nem tudunk használni, használjunk valami egyszerűbbet. Javítsunk néhány paraméteres H függvénycsaládot, és válasszunk osztályozót ebből a családból.

Példa: legyen az űrlap összes függvényének halmaza

Ennek a halmaznak az összes függvénye csak együtthatókkal fog különbözni egymástól. Amikor egy ilyen családot választottunk, azt feltételeztük, hogy az 1. osztályú pontok és a 0. osztályú pontok közötti színméret-koordinátákban egy ilyen együtthatós egyenest húzhatunk. hogyan helyezkednek el a különböző osztályokkal rendelkező pontok különböző oldalak az egyenesből. Ismeretes, hogy egy ilyen típusú egyenesre az együtthatóvektor normális az egyenesre. Most ezt tesszük - vesszük az almánkat, megmérjük a színét és méretét, és a kapott koordinátákkal ábrázoljuk a pontot a grafikonon a színméret tengelyein. Ezután megmérjük a pont és a $w$ vektor közötti szöget. Észrevesszük, hogy pontunk az egyenes egyik vagy másik oldalán is elhelyezkedhet. Ekkor a pont és a pont közötti szög hegyes vagy tompaszögű, a skaláris szorzat pedig pozitív vagy negatív lesz. Ez a döntő szabályhoz vezet:

Miután rögzítettük a $H$ függvényosztályt, felvetődik a kérdés - hogyan válasszunk ki belőle egy függvényt a szükséges együtthatókkal? A válasz: válasszuk ki azt a függvényt, amely minimalizálja a Bayes-féle $R()$ kockázatunkat. Ismét az a probléma, hogy a bayesi kockázati értékek kiszámításához ismerni kell a $p(x,y)$ eloszlást, de ez nincs megadva nekünk, és nem mindig lehetséges visszaállítani. Egy másik ötlet az, hogy ne az összes lehetséges objektumon, hanem csak egy mintán minimalizáljuk a kockázatot. Azok. minimalizálás funkció:

Ezt a függvényt empirikus kockázatnak nevezzük. A következő kérdés az, hogy miért döntöttünk úgy, hogy az empirikus kockázat minimalizálásával minimalizáljuk a bayesi kockázatot is? Hadd emlékeztesselek arra, hogy gyakorlati feladatunk az, hogy minél kevesebb osztályozási hibát vessünk el. Minél kevesebb a hiba, annál kisebb a bayesi kockázat. A 70-es években két tudós – V. N. Vapnik és A. Chervonenkis – igazolta az empirikus kockázat konvergenciáját a bayesi kockázathoz.

Konvergencia garanciák. A legegyszerűbb eset

Tehát arra a következtetésre jutottunk, hogy a Bayes-féle osztályozó a lehető legkisebb hibát adja, de a legtöbb esetben nem tudjuk betanítani, és a hibát (kockázatot) sem tudjuk kiszámítani. Kiszámíthatunk azonban egy közelítést a Bayes-kockázathoz, amit empirikus kockázatnak nevezünk, és az empirikus kockázat ismeretében kiválaszthatunk egy olyan közelítő függvényt, amely minimalizálja az empirikus kockázatot. Nézzük meg azt a legegyszerűbb helyzetet, amikor az empirikus kockázat minimalizálása olyan osztályozót eredményez, amely a Bayes-kockázatot is minimalizálja. A legegyszerűbb esetben a gyakorlatban ritkán teljesülő, de később enyhíthető feltételezést kell tennünk. Rögzítsük a függvények végső osztályát, amelyből kiválasztjuk az osztályozónkat, és feltételezzük ezt valódi funkció amivel a természet ízekre jelöli almáinkat, abban van véges halmaz hipotézisek: . Az objektumok közötti eloszlásból kapott mintánk is van. Minden mintaobjektumot egyenlően, egymástól függetlenül elosztottnak tekintünk (iid). Akkor a következő igaz lesz

Tétel

Ha egy empirikus kockázatminimalizálást alkalmazó osztályból kiválasztunk egy függvényt, akkor garantáltan találunk olyat, amelynek bayesi kockázati értéke kicsi, ha a minta, amelyen a minimalizálást elvégezzük, megfelelő méretű.

Mit jelent a „kis érték” és „elégséges méret”, lásd az alábbi szakirodalmat.

A bizonyítási ötlet

A tétel feltételei szerint az eloszlásból mintát kapunk, azaz. a természetből származó tárgyak kiválasztásának folyamata véletlenszerű. Minden alkalommal, amikor mintát gyűjtünk, az ugyanabból az eloszlásból származik, de maguk az objektumok eltérőek lehetnek. Fő gondolat a bizonyíték az, hogy olyan rossz mintát kaphatunk, hogy az az algoritmus, amelyet ezen a mintán empirikus kockázatminimalizálással választunk, rossz lesz a Bayes-féle kockázat minimalizálására, ugyanakkor jó az empirikus kockázat minimalizálására, de az ilyen minta megszerzésének valószínűsége kicsi, és a minta mérete növeli, ez a valószínűség csökken. Hasonló tételek léteznek a reálisabb feltételezésekhez, de ezeket itt nem fogjuk figyelembe venni.

Gyakorlati eredmények

Ha bizonyítékunk van arra, hogy az empirikus kockázat minimalizálásával talált függvénynek nem lesz nagy hibája a korábban nem megfigyelt adatokon megfelelő méretű betanítási minta mellett, ezt az elvet a gyakorlatban például a következőképpen használhatjuk - a kifejezést vesszük:

És különböző veszteségfüggvényeket helyettesítünk a megoldandó problémától függően. Lineáris regresszióhoz:

A logisztikai regresszióhoz:

Bár a támogatási vektor gépek elsősorban geometriai indíttatásúak, empirikus kockázatminimalizálási problémaként is felfoghatók.

Következtetés

Számos felügyelt tanulási módszer tekinthető többek között a V. N. Vapnik és A. Ya Chervonenkis által kidolgozott elmélet speciális eseteinek. Ez az elmélet garanciákat ad a teszthalmaz hibájára, feltéve, hogy megfelelő méretű a betanító minta és bizonyos követelmények vannak a hipotézistérrel szemben, amelyben algoritmusunkat keressük.

Felhasznált irodalom

  • A statisztikai tanuláselmélet természete, Vladimir N. Vapnik
  • Mintaosztályozás, 2. kiadás, Richard O. Duda, Peter E. Hart, David G. Stork
  • A gépi tanulás megértése: az elmélettől az algoritmusig, Shai Shalev-Shwartz, Shai Ben-David
P.S. Az esetleges pontatlanságokról, gépelési hibákról személyes üzenetben írjon.

Címkék: Címkék hozzáadása

3. fejezet: A mintafelismerési és döntéshozatali módszerek elemző áttekintése

Mintafelismerési elmélet és vezérlésautomatizálás

Az adaptív mintafelismerés fő feladatai

A felismerés egy információs folyamat, amelyet valamilyen információátalakító (intelligens információs csatorna, felismerő rendszer) valósít meg, amelynek van bemenete és kimenete. A rendszer bemenete információ arról, hogy a bemutatott objektumok milyen jellemzőkkel rendelkeznek. A rendszerkimenet információkat jelenít meg arról, hogy a felismert objektumok mely osztályokhoz (általánosított képekhez) tartoznak.

Az automatizált mintafelismerő rendszer létrehozása és működtetése során számos probléma megoldódik. Tekintsük át röviden és egyszerűen ezeket a feladatokat. Megjegyzendő, hogy a különböző szerzők ugyanazokat a megfogalmazásokat fogalmazzák meg ezekről a problémákról, és maga a halmaz nem esik egybe, mivel bizonyos mértékig függ attól a konkrét matematikai modelltől, amelyen ez vagy az a felismerési rendszer alapul. Ezenkívül bizonyos felismerési modellekben bizonyos problémákra nincs megoldás, és ennek megfelelően nem is merülnek fel.

A tárgykör formalizálásának feladata

Ez a feladat lényegében egy kódolási feladat. A rendszer összeállítja az általánosított osztályok listáját, amelyekhez az objektumok konkrét megvalósításai tartozhatnak, valamint azoknak a jellemzőknek a listáját, amelyekkel ezek az objektumok elvileg rendelkezhetnek.

A képzési minta kialakításának feladata

A tanítókészlet egy adatbázis, amely az objektumok konkrét implementációinak leírását tartalmazza a jellemzők nyelvén, kiegészítve ezen objektumok bizonyos felismerési osztályokhoz való tartozására vonatkozó információkkal.

Felismerési rendszer képzési feladat

A betanítási mintát a felismerési osztályok általános képeinek kialakítására használják azon információk általánosítása alapján, hogy az ehhez az osztályhoz és más osztályokhoz tartozó képzési minta objektumai milyen jellemzőkkel rendelkeznek.

A jellemzőtér méretének csökkentésének problémája

A felismerési rendszer betanítása (statisztika beszerzése a jellemzők osztályonkénti gyakorisági eloszlásáról) után lehetővé válik az egyes jellemzők értékének meghatározása a felismerési probléma megoldásához. Ezt követően a legkevésbé értékes tulajdonságok eltávolíthatók a jellemzőrendszerből. Ezután a felismerő rendszert újra betanítani kell, hiszen egyes jellemzők eltávolítása következtében megváltozik a fennmaradó jellemzők osztályonkénti megoszlásának statisztikája. Ez a folyamat megismételhető, pl. legyen iteratív.

Felismerési feladat

A felismert minta objektumai felismerésre kerülnek, amelyek különösen egy objektumból állhatnak. A felismert minta a betanítóhoz hasonlóan jön létre, de nem tartalmaz információt az objektumok osztályokhoz való tartozásáról, mivel a felismerési folyamat során pontosan ezt határozzák meg. Az egyes objektumok felismerésének eredménye az összes felismerési osztály eloszlása ​​vagy listája a felismert objektum hozzájuk való hasonlóságának mértéke szerinti csökkenő sorrendben.

Felismerési minőség-ellenőrzési probléma

A felismerés után megállapítható a megfelelősége. A képzési minta objektumainál ez azonnal megtehető, mivel számukra egyszerűen ismert, hogy melyik osztályba tartoznak. Más objektumok esetében ezek az információk később szerezhetők be. Mindenesetre a tényleges átlagos valószínűség hibákat minden felismerési osztályra, valamint a hiba valószínűségét, amikor egy felismert objektumot egy adott osztályhoz rendelünk.

A felismerési eredményeket a felismerés minőségéről rendelkezésre álló információk figyelembevételével kell értelmezni.

Alkalmazkodási probléma

Ha a minőség-ellenőrzési eljárás eredményeként megállapítást nyer, hogy az nem kielégítő, akkor a hibásan felismert objektumok leírása átmásolható a felismert mintából a képzési mintába, kiegészítve megfelelő minősítési információval, és felhasználható a döntési szabályok újraformázásához. , azaz figyelembe vették. Sőt, ha ezek az objektumok nem tartoznak a meglévő felismerési osztályokba, ami hibás felismerésük oka lehet, akkor ez a lista bővíthető. Ennek eredményeként a felismerő rendszer alkalmazkodik, és elkezdi megfelelően osztályozni ezeket az objektumokat.

Inverz felismerési probléma

A felismerési feladat az, hogy egy adott objektumra az ismert jellemzői alapján a rendszer megállapítsa valamely korábban ismeretlen osztályhoz való tartozását. Ezzel szemben az inverz felismerési problémában egy adott felismerési osztály esetében a rendszer megállapítja, hogy mely tulajdonságok jellemzőek a legjellemzőbbek az osztály objektumaira, és melyek nem (vagy a betanító minta mely objektumai tartoznak ebbe az osztályba).

A klaszter és a konstruktív elemzés problémái

A klaszterek olyan objektumok, osztályok vagy jellemzők csoportjai, amelyek az egyes klasztereken belül a lehető leghasonlóbbak, a különböző klaszterek között pedig a lehető legkülönbözőbbek.

A konstrukció (ebben a részben tárgyalt szövegkörnyezetben) ellentétes klaszterek rendszere. Így bizonyos értelemben a konstrukciók a klaszterek klaszteranalízisének eredményei.

A klaszteranalízis során az objektumok (osztályok, jellemzők) közötti hasonlóság és különbség mértékét mennyiségileg mérik, és ezt az információt használják fel az osztályozáshoz. A klaszteranalízis eredménye az objektumok klaszterekbe sorolása. Ez a besorolás szemantikai hálózatok formájában is ábrázolható.

Kognitív elemzési feladat

A kognitív elemzésben az osztályok vagy jellemzők közötti hasonlóságokra és különbségekre vonatkozó információk önmagukban érdeklik a kutatót, és nem azért, hogy osztályozásra használhassa, mint a klaszter- és a konstruktív elemzésben.

Ha két felismerési osztályra ugyanaz a tulajdonság jellemző, akkor ez hozzájárul e két osztály hasonlóságához. Ha az egyik osztály számára ez a tulajdonság nem jellemző, akkor ez hozzájárul a különbséghez.

Ha két jellemző korrelál egymással, akkor bizonyos értelemben egy tulajdonságnak tekinthetők, ha pedig antikorrelálnak, akkor különbözőnek. Figyelembe véve ezt a körülményt, az eltérő tulajdonságok különböző osztályokban való jelenléte is bizonyos mértékben hozzájárul ezek hasonlóságához és különbségéhez.

A kognitív elemzés eredményeit kognitív diagramok formájában lehet bemutatni.

Mintafelismerési módszerek és jellemzőik

A mintafelismerő módszerek osztályozásának elvei

A mintafelismerés a valós vagy ideális világban lévő objektumok numerikus vagy szimbolikus reprezentációira formális műveletek megalkotásának és alkalmazásának problémáját jelenti, amelyek eredményei tükrözik ezen objektumok közötti ekvivalencia-viszonyokat. Az ekvivalenciarelációk kifejezik a kiértékelt objektumok bármely osztályhoz való tartozását, független szemantikai egységnek tekintve.

Felismerési algoritmusok konstruálásakor az ekvivalencia osztályokat a kutató adhatja meg, aki saját értelmes reprezentációit használja, vagy külsőt használ. további információk az objektumok hasonlóságairól és különbségeiről a megoldandó probléma kontextusában. Aztán a „tanárral való elismerésről” beszélnek. Ellenkező esetben, pl. Amikor egy automatizált rendszer külső képzési információ felhasználása nélkül old meg egy osztályozási problémát, akkor automatikus osztályozásról vagy „felügyelet nélküli felismerésről” beszélünk. A legtöbb mintafelismerő algoritmus igen jelentős számítási teljesítményt igényel, amit csak a nagy teljesítményű számítástechnika tud biztosítani.

Különféle szerzők (Yu.L. Barabash, V. I. Vasziljev, A. L. Gorelik, V. A. Skripkin, R. Duda, P. Hart, L. T. Kuzin, F. I. Peregudov, F. P. Tarasenko, F. E. Temnikov, J. Tu, R. Gonzalez, P. Winston K. Fu, Ya.Z. eltérő tipológia mintafelismerési módszerek. Egyes szerzők különbséget tesznek parametrikus, nem-parametrikus és heurisztikus módszerek között, mások módszercsoportokat azonosítanak a történetileg kialakult iskolák és irányzatok alapján ezen a területen. Például abban a munkában, amely a felismerési módszerek tudományos áttekintését adja, a mintafelismerési módszerek következő tipológiáját alkalmazzák:

  • elválasztási elven alapuló módszerek;
  • statisztikai módszerek;
  • „potenciális függvények” alapján felépített módszerek;
  • minősítések kiszámításának módszerei (szavazás);
  • tételszámításon alapuló módszerek, különösen a logikai algebra apparátusán.

Ez a besorolás a mintafelismerés formális módszereinek különbségén alapul, ezért figyelmen kívül hagyjuk a felismerés heurisztikus megközelítését, amely a szakértői rendszerekben teljes és megfelelő fejlesztést kapott. A heurisztikus megközelítés a kutató nehezen formalizálható tudásán és intuícióján alapul. Ebben az esetben a kutató maga határozza meg, hogy a rendszer milyen információkat és hogyan használja fel a kívánt felismerési hatás eléréséhez.

A felismerési módszerek hasonló tipológiája, változó részletességgel számos felismeréssel foglalkozó műben megtalálható. Ugyanakkor az ismert tipológiák nem vesznek figyelembe egy nagyon jelentős jellemzőt, amely a tudás bemutatásának módját tükrözi. tárgykör valamilyen formális mintafelismerő algoritmus segítségével.

D.A. Pospelov (1990) a tudás bemutatásának két fő módját azonosítja:

  • intenzionális, attribútumok (jellemzők) közötti kapcsolatok diagramja formájában.
  • extenzív, konkrét tények (objektumok, példák) segítségével.

Az intenzionális reprezentáció megragadja azokat a mintákat és összefüggéseket, amelyek megmagyarázzák az adatok szerkezetét. A diagnosztikai feladatokkal kapcsolatban az ilyen rögzítés az objektumok attribútumain (tulajdonságain) végzett műveletek meghatározásából áll, amelyek a kívánt diagnosztikai eredményhez vezetnek. Az intenzionális reprezentációk attribútumértékekkel végzett műveleteken keresztül valósulnak meg, és nem tartalmaznak konkrét információs tényeken (objektumokon) végzett műveleteket.

A tudás extenzív reprezentációi viszont a tárgyterület konkrét objektumainak leírásához és rögzítéséhez kapcsolódnak, és olyan műveletekben valósulnak meg, amelyek elemei objektumok, mint integrált rendszerek.

Analógia vonható a tudás intenzionális és extenzív reprezentációi, valamint az emberi agy bal és jobb féltekéjének működésének hátterében álló mechanizmusok között. Ha a jobb agyféltekét a környező világ holisztikus prototípus-ábrázolása jellemzi, akkor bal agyfélteke olyan mintákkal operál, amelyek tükrözik e világ attribútumai közötti összefüggéseket.

A tudásábrázolás fent leírt két alapvető módja lehetővé teszi számunkra, hogy a mintafelismerési módszerek következő osztályozását javasoljuk:

  • jellemzőkkel végzett műveleteken alapuló intenzionális módszerek.
  • objektumokkal végzett műveleteken alapuló kiterjesztési módszerek.

Külön hangsúlyozni kell, hogy a felismerési módszereknek pontosan ennek a két (és csak két) csoportjának, a jelekkel és a tárgyakkal operálóknak a létezése mélyen természetes. Ebből a szempontból e módszerek egyike sem teszi lehetővé, hogy a másiktól elkülönítve megfelelően tükrözzük a témakört. A szerzők szerint e módszerek között N. Bohr szerint komplementaritás áll fenn, ezért az ígéretes felismerési rendszereknek biztosítaniuk kell mindkét módszer megvalósítását, nem pedig bármelyiket.

Így a felismerési módszerek D. A. Pospelov által javasolt osztályozása az általános emberi megismerési mód alapjául szolgáló alapvető mintákon alapul, ami teljesen különleges (kiváltságos) helyzetbe hozza azt a többi osztályozáshoz képest, amelyek e háttérben könnyedebbnek tűnnek. mesterséges.

Intenzív módszerek

Az intenzionális módszerek sajátossága, hogy a mintafelismerő algoritmusok konstruálásakor és alkalmazásakor a jellemzők különböző jellemzőit és azok kapcsolatait műveletelemként használják fel. Ilyen elemek lehetnek egyedi értékek vagy jellemzőértékek intervallumai, átlagos értékek és eltérések, jellemző kapcsolati mátrixok stb., amelyeken műveleteket hajtanak végre, analitikus vagy konstruktív formában kifejezve. Ugyanakkor az objektumokat ezekben a módszerekben nem tekintjük integrált információs egységeknek, hanem indikátorként szolgálnak az attribútumok interakciójának és viselkedésének értékeléséhez.

A mintafelismerés intenzionális módszereinek csoportja kiterjedt, alosztályokra bontása bizonyos mértékig feltételes.

A jellemzőértékek eloszlási sűrűségének becslésén alapuló módszerek

Ezeket a mintafelismerő módszereket innen kölcsönöztük klasszikus elmélet statisztikai megoldások, amelyben a vizsgált objektumokat egy többdimenziós valószínűségi változó realizációinak tekintjük, amelyek valamilyen törvény szerint eloszlanak a jellemzők terében. Egy Bayes-féle döntéshozatali sémán alapulnak, amely egy adott felismerhető osztályba tartozó objektumok a priori valószínűségére és a jellemzővektorértékek feltételes eloszlási sűrűségére hivatkozik. Ezek a módszerek a valószínűségi arány meghatározásához vezetnek a többdimenziós jellemzőtér különböző területein.

A jellemzőértékek eloszlási sűrűségének becslésén alapuló módszerek egy csoportja közvetlenül kapcsolódik a diszkriminanciaanalízis módszereihez. A döntéshozatal Bayes-féle megközelítése a modern statisztika egyik legfejlettebb úgynevezett parametrikus módszere, amelyre az eloszlási törvény analitikus kifejezése ismertnek tekinthető (ebben az esetben normális törvény), és csak becsülni kell kis mennyiségben paraméterek (átlagértékek vektorai és kovarianciamátrixok).

E módszerek alkalmazásának fő nehézségét az jelenti, hogy meg kell emlékezni a teljes képzési mintára a helyi valószínűségi eloszlássűrűség becsléseinek kiszámításához és nagy érzékenység a képzési minta nem reprezentativitására.

A döntési függvények osztályára vonatkozó feltevéseken alapuló módszerek

Ebben a módszercsoportban a döntési függvény általános formáját ismertnek tekintjük, és a minőségi funkcióját is megadjuk. E függvény alapján a döntési függvény legjobb közelítését a betanítási szekvencia segítségével találjuk meg. A leggyakoribbak a döntési függvények lineáris és általánosított nemlineáris polinomok formájában történő megjelenítése. A döntési szabály minőségi funkciója általában osztályozási hibához kapcsolódik.

A döntési függvények osztályára vonatkozó feltevéseken alapuló módszerek fő előnye a felismerési probléma, mint szélsőségkeresési probléma matematikai megfogalmazásának egyértelműsége. Az ebbe a csoportba tartozó módszerek sokféleségét a döntési szabály minőségi funkcionálisok és az alkalmazott szélsőséges keresési algoritmusok széles köre magyarázza. A vizsgált algoritmusok általánosítása, amelyek közé tartozik különösen a Newton-algoritmus, a perceptron típusú algoritmusok stb., a sztochasztikus közelítés módszere.

Lehetőségek gradiens algoritmusok Az extrémum keresése, különösen a lineáris döntési szabályok csoportjában, meglehetősen jól tanulmányozott. Ezen algoritmusok konvergenciája csak abban az esetben igazolódott, amikor a felismert objektumosztályokat a jellemzőtérben kompakt geometriai struktúrák jelenítik meg.

A döntési szabály kellően magas minősége olyan algoritmusokkal érhető el, amelyeknek nincs szigorú szabálya matematikai bizonyítást a megoldás konvergenciája a globális szélsőséghez. Az ilyen algoritmusok a heurisztikus programozási eljárások nagy csoportját foglalják magukban, amelyek az evolúciós modellezés irányát képviselik. Az evolúciós modellezés a természettől kölcsönzött bionikus módszer. Az ismert evolúciós mechanizmusok használatán alapul, hogy egy összetett objektum értelmes modellezésének folyamatát felváltsa az evolúció fenomenológiai modellezésével. Az evolúciós modellezés jól ismert képviselője a mintafelismerésben az argumentumok csoportos elszámolásának módszere (MGUA). A GMDH alapja az önszerveződés elve, a GMDH algoritmusok pedig a tömegszelekció sémáját reprodukálják.

A gyakorlati célok elérése azonban ebben az esetben nem jár együtt a felismert tárgyak természetére vonatkozó új ismeretek kinyerésével. Ezen ismeretek, különösen az attribútumok (jellemzők) kölcsönhatási mechanizmusaira vonatkozó ismeretek kinyerésének lehetőségét itt alapvetően korlátozza az ilyen interakció adott, a döntési funkciók kiválasztott formájában rögzített struktúrája.

Boole-módszerek

A mintázatfelismerés logikai módszerei a logikai algebra apparátusán alapulnak, és lehetővé teszik, hogy ne csak az egyes jellemzőkben, hanem a jellemzőértékek kombinációiban is szereplő információkkal dolgozzunk. Ezekben a módszerekben bármely attribútum értéke elemi eseménynek számít.

A nagyon általános nézet A logikai módszerek egyfajta keresésként jellemezhetők a logikai minták képzési mintáján és valamilyen logikai döntési szabályrendszer kialakításán keresztül (például elemi események konjunkciói formájában), amelyek mindegyikének megvan a maga súlya. A logikai módszerek csoportja változatos, és különböző összetettségű és mélységű elemzési módszereket foglal magában. A dichotóm (Boole-féle) jellemzők esetében népszerűek az úgynevezett faszerű osztályozók, a zsákutcás vizsgálati módszer, a „Bark” algoritmus stb.

A „Kora” algoritmus a mintafelismerés más logikai módszereihez hasonlóan meglehetősen számításigényes, mivel a kötőszók kiválasztásakor teljes keresésre van szükség. Ezért a logikai módszerek alkalmazásakor magas követelményeket támasztanak a számítási folyamat hatékony megszervezésével szemben, és ezek a módszerek viszonylag kis jellemzőtérrel és csak nagy teljesítményű számítógépeken működnek jól.

Nyelvi (strukturális) módszerek

A mintafelismerés nyelvi módszerei speciális nyelvtanok használatán alapulnak, amelyek olyan nyelveket generálnak, amelyek segítségével leírhatók a felismert objektumok tulajdonságai.

Az objektumok különböző osztályaihoz azonosítják a nem származtatott (atomi) elemeket (alképeket, attribútumokat) és a köztük lévő lehetséges kapcsolatokat. A nyelvtan az objektumok ezekből a nem származtatott elemekből való felépítésének szabályaira utal.

Így minden tárgy nem származékos elemek gyűjteménye, amelyek így vagy úgy „kapcsolódnak” egymáshoz, vagy más szóval valamilyen „nyelv” „mondatával”. Külön szeretném hangsúlyozni e gondolat igen jelentős ideológiai értékét.

Egy „mondat” szintaktikai elemzésével (grammatikai elemzésével) meghatározzuk annak szintaktikai „helyességét”, vagy ezzel egyenértékűen azt, hogy egy osztályt leíró rögzített nyelvtan képes-e létrehozni egy objektum meglévő leírását.

Nehéz azonban formalizálni azt a feladatot, hogy egy bizonyos utasításhalmazból (mondatokból - objektumleírásokból) rekonstruáljanak (definiáljanak) a nyelvtanokat, amelyek egy adott nyelvet generálnak.

Kiterjesztési módszerek

Ennek a csoportnak a módszereiben az intenzionális iránytól eltérően minden vizsgált objektum kisebb-nagyobb mértékben önálló diagnosztikai jelentőséget kap. Ezek a módszerek lényegükben közel állnak a klinikai megközelítéshez, amely az embert nem objektumok láncolatának tekinti, amelyeket egyik vagy másik indikátor rangsorol, hanem integrált rendszerként, amelyek mindegyike egyedi és különleges diagnosztikai értékkel bír. A kutatás tárgyaihoz való ilyen körültekintő hozzáállás nem teszi lehetővé az egyes objektumok információinak kizárását vagy elvesztését, ami akkor történik, ha olyan intenzív iránymódszereket használnak, amelyek az objektumokat csak tulajdonságaik viselkedési mintáinak észlelésére és rögzítésére használják.

A tárgyalt módszerekkel végzett mintafelismerés fő műveletei az objektumok hasonlóságának és különbségének meghatározására szolgáló műveletek. A meghatározott módszercsoportba tartozó objektumok diagnosztikai precedensek szerepét töltik be. Sőt, egy-egy konkrét feladat körülményeitől függően az egyéni precedens szerepe a legtágabb határokon belül változhat: a fő és meghatározó szereptől az elismerési folyamatban való nagyon közvetett részvételig. Viszont a probléma feltételei megkövetelhetik a részvételt különféle mennyiségben diagnosztikai precedensek: minden felismert osztályban egytől a teljes mintaméretig, valamint az objektumok közötti hasonlóság és különbség mértékének kiszámításának különböző módjai. Ezek a követelmények magyarázatot adnak a kiterjesztési módszerek további alosztályokra való felosztására.

Prototípussal való összehasonlítás módszere

Ez a legegyszerűbb kiterjesztési felismerési módszer. Használható például abban az esetben, ha a felismert osztályok kompakt geometriai csoportosítással jelennek meg a jellemzőtérben. Ebben az esetben általában az osztály geometriai csoportosításának középpontját (vagy a középponthoz legközelebb eső objektumot) választják ki prototípuspontként.

Egy ismeretlen objektum osztályozásához meg kell találni a legközelebbi prototípust, és az objektum ugyanabba az osztályba tartozik, mint ez a prototípus. Nyilvánvaló, hogy ezzel a módszerrel nem generálnak általánosított osztályképeket.

Különféle távolságok használhatók a közelség mérésére. A dichotóm jellemzők esetében gyakran a Hamming-távolságot használják, amely ebben az esetben egyenlő az euklideszi távolság négyzetével. Ebben az esetben az objektumok osztályozásának döntési szabálya egyenértékű a lineáris döntési függvénnyel.

Ezt a tényt különösen meg kell jegyezni. Világosan szemlélteti a kapcsolatot a prototípus és az adatok szerkezetére vonatkozó információ attribútum-reprezentációja között. A fenti ábrázolás segítségével például bármilyen hagyományos mérési skála, amely a dichotóm jellemzők értékeinek lineáris függvénye, tekinthető hipotetikus diagnosztikai prototípusnak. Ha viszont a felismert osztályok térszerkezetének elemzése lehetővé teszi, hogy következtetést vonjunk le geometriai tömörségükről, akkor elegendő ezen osztályok mindegyikét egy prototípussal helyettesíteni, amely valójában egy lineáris diagnosztikai modellel egyenértékű.

A gyakorlatban persze sokszor eltér a helyzet a leírt idealizált példától. Nehéz problémákkal néz szembe az a kutató, aki prototípus diagnosztikai osztályokkal való összehasonlításon alapuló felismerési módszert kíván alkalmazni.

Először is, ez a közelségi mérték (metrika) megválasztása, amely jelentősen megváltoztathatja az objektumok eloszlásának térbeli konfigurációját. Másodszor, önálló probléma a kísérleti adatok többdimenziós struktúráinak elemzése. Mindkét probléma különösen akut a kutató számára a jellemzőtér nagy dimenziós körülményei között, ami a valós problémákra jellemző.

k legközelebbi szomszédok módszere

A diszkriminanciaelemzési problémák megoldására szolgáló k-legközelebbi szomszéd módszert először 1952-ben javasolták. Ez a következő.

Egy ismeretlen objektum besorolásakor egy adott számú (k) számot találunk a hozzá geometriailag legközelebb eső objektumok jellemzőinek terében (legközelebbi szomszédok), amelyek már ismertek a felismert osztályokhoz. A döntés egy ismeretlen objektum egy adott diagnosztikai osztályhoz való hozzárendeléséről a legközelebbi szomszédok ismert hovatartozására vonatkozó információk elemzésével történik, például egy egyszerű szavazatszámlálás segítségével.

Kezdetben a k-legközelebbi szomszédok módszerét nem paraméteres módszernek tekintették a valószínűségi arány becslésére. Ehhez a módszerhez elméleti becsléseket kaptunk a hatékonyságáról az optimális Bayes-osztályozóval összehasonlítva. Bebizonyosodott, hogy a k-legközelebbi szomszédok módszerének aszimptotikus hibavalószínűsége legfeljebb kétszer haladja meg a Bayes-szabály hibáit.

Amikor a k-legközelebbi szomszédok módszerét alkalmazzuk a mintafelismerésre, a kutatónak kell döntenie összetett probléma mérőszám kiválasztása a diagnosztizált objektumok közelségének meghatározásához. Ez a probléma a jellemzőtér nagy dimenziójú körülményei között a kellő összetettség miatt rendkívül súlyosbodik ezt a módszert, ami még a nagy teljesítményű számítógépek esetében is jelentőssé válik. Ezért itt is, csakúgy, mint a prototípussal való összehasonlításnál, meg kell oldani a kísérleti adatok többdimenziós szerkezetének elemzésének kreatív problémáját, hogy minimalizáljuk a diagnosztikai osztályokat reprezentáló objektumok számát.

Ennek a módszernek a hátránya, hogy csökkenteni kell a betanítási mintában lévő objektumok számát (diagnosztikai precedensek), mivel csökkenti a betanítási minta reprezentativitását.

Az értékelések kiszámításának algoritmusai („szavazás”)

Az értékelési számítási algoritmusok (ABO) működési elve, hogy a felismert és referenciaobjektumok „közelségét” jellemző prioritásokat (hasonlósági pontszámokat) a jellemzőegyüttesek rendszere szerint számítják ki, amely egy adott jellemzőkészlet részhalmazainak rendszere. .

Az összes korábban tárgyalt módszertől eltérően a becslések kiszámítására szolgáló algoritmusok alapvetően új módon működnek az objektumleírásokkal. Ezeknél az algoritmusoknál az objektumok egyidejűleg léteznek a jellemzőtér nagyon különböző altereiben. Az ABO osztály a jellemzők használatának gondolatát a logikus következtetésre viszi: mivel nem mindig ismert, hogy a jellemzők melyik kombinációja a leginformatívabb, ezért az ABO-ban az objektumok hasonlóságának mértékét az összes lehetséges vagy konkrét kombináció összehasonlításával számítják ki. a tárgyak leírásában szereplő jellemzők.

A szerzők a jellemzők (alterek) használt kombinációit támogató halmazoknak vagy objektumok részleírásainak halmazainak nevezik. Bevezetésre kerül az általánosított közelség fogalma a felismert objektum és a betanítási minta objektumai között (ismert osztályozással), amelyeket referencia objektumoknak nevezünk. Ezt a közelséget a felismert objektum és a referenciaobjektum közelségének kombinációja jelenti, amelyet részleírások halmazai alapján számítanak ki. Így az ABO a k-legközelebbi szomszédok módszer kiterjesztése, amelyben az objektumok közelségét csak egy adott jellemzőtérben veszik figyelembe.

Az ABO további kiterjesztése, hogy ezekben az algoritmusokban az objektumok hasonlóságának és különbségének meghatározásának feladata parametrikusan van megfogalmazva, és ki van emelve az ABO képzési halmaz alapján történő beállításának szakasza, amelynél a beírt optimális értékei. paraméterek vannak kiválasztva. A minőségi kritérium a felismerési hiba, és szó szerint minden paraméterezett:

  • az objektumok közelségének egyéni jellemzők alapján történő kiszámításának szabályai;
  • a jellemző alterekben lévő objektumok közelségének kiszámítására vonatkozó szabályok;
  • egy adott referenciaobjektum, mint diagnosztikai precedens fontosságának mértéke;
  • a jellemzők egyes referenciakészletei hozzájárulásának jelentősége a felismert objektum bármely diagnosztikai osztályhoz való hasonlóságának végső értékeléséhez.

Az ABO paraméterek küszöbértékek formájában és (vagy) a megadott komponensek súlyaként vannak megadva.

Az AVO elméleti képességei legalábbis semmivel sem alacsonyabbak bármely más mintafelismerő algoritmusnál, hiszen az AVO segítségével minden elképzelhető művelet megvalósítható a vizsgált objektumokkal.

De ahogy az lenni szokott, a potenciális képességek bővítése nagy nehézségekbe ütközik gyakorlati megvalósításuk során, különösen az ilyen típusú algoritmusok felépítésének (hangolásának) szakaszában.

Korábban a k-legközelebbi szomszédok módszerének tárgyalása során felmerült néhány nehézség, amely az ABO csonka változataként értelmezhető. Paraméteres formában is megfontolható, és a problémát a kiválasztott típusú súlyozott metrika megtalálására redukálhatjuk. Ugyanakkor már itt is a nagydimenziós problémáknál összetett elméleti kérdések, problémák merülnek fel a hatékony számítási folyamat megszervezésével kapcsolatban.

Az AVO esetében, ha megpróbálja a lehető legteljesebb mértékben kihasználni ezen algoritmusok képességeit, ezek a nehézségek sokszorosára nőnek.

A feljegyzett problémák magyarázatot adnak arra, hogy a gyakorlatban az ABO használata nagydimenziós problémák megoldására néhány heurisztikus megszorítás és feltételezés bevezetésével párosul. Különösen ismert példa az ABO pszichodiagnosztikában való alkalmazására, amelyben az ABO egy típusát tesztelték, amely valójában egyenértékű a k-legközelebbi szomszédok módszerével.

Döntési szabály Kollektívák

A mintafelismerési módszerek áttekintésének befejezéséhez nézzünk meg még egy megközelítést. Ezek az úgynevezett döntési szabály-kollektívák (DRG).

Mivel a különböző felismerési algoritmusok eltérően jelennek meg ugyanazon az objektummintán, természetesen felmerül egy olyan szintetikus döntési szabály kérdése, amely adaptívan használja ezen algoritmusok erősségeit. A szintetikus döntési szabály kétszintű felismerési sémát használ. Az első szinten privát felismerő algoritmusok működnek, amelyek eredményeit a második szinten kombinálják a szintézis blokkban. Az ilyen egységesítés leggyakoribb módszerei egy adott algoritmus kompetenciaterületeinek azonosításán alapulnak. A kompetenciaterületek megtalálásának legegyszerűbb módja az attribútumok terének előzetes felosztása egy adott tudomány szakmai szempontjai alapján (például a minta rétegezése egy adott attribútum szerint). Ezután minden kiválasztott területhez saját felismerési algoritmus épül fel. Egy másik módszer a formális elemzésen alapul, hogy meghatározza a jellemzőtér helyi területeit olyan felismert objektumok szomszédságaként, amelyekre bármely felismerési algoritmus sikeressége bizonyított.

Legtöbb általános megközelítés szintézis blokk felépítéséhez a privát algoritmusok eredő mutatóit tekinti kezdeti előjelnek egy új általánosított döntési szabály megalkotásához. Ebben az esetben a mintafelismerésben a fenti intenzációs és kiterjesztési irányok mindegyike használható. A döntési szabálycsoport létrehozásának problémájának megoldására hatékonyak a „Kora” típusú logikai algoritmusok és a becslések kiszámítására szolgáló algoritmusok (ABO), amelyek az úgynevezett algebrai megközelítés alapját képezik, amely tanulmányozza és konstruktív leírását adja felismerési algoritmusok, amelyek keretébe minden létező típusú algoritmus belefér.

Mintafelismerő módszerek összehasonlító elemzése

Hasonlítsuk össze a fent ismertetett mintafelismerési módszereket, és értékeljük, hogy mennyire felelnek meg a 3.3.3. szakaszban az SDA modelleknél megfogalmazott követelményeknek komplex rendszerek adaptív automatizált vezérlőrendszereihez.

Az intenzionális irány módszerei közül valós problémák megoldásához gyakorlati értékűek a parametrikus módszerek és a döntési függvények formájára vonatkozó javaslatokon alapuló módszerek. Paraméteres módszerek az indikátorok felépítésének hagyományos módszertana. Ezeknek a módszereknek a valós problémákban való alkalmazása az adatszerkezetre vonatkozó erős korlátozásokkal jár, amelyek lineáris diagnosztikai modellekhez vezetnek, amelyek paramétereik nagyon durva becslését teszik lehetővé. A döntési függvények formájára vonatkozó feltételezéseken alapuló módszerek alkalmazásakor a kutató kénytelen a lineáris modellek felé fordulni. Ennek oka a jellemzőtér valós problémákra jellemző nagy dimenziója, amely a polinomiális döntési függvény növekvő mértékével a tagok számának jelentős növekedését eredményezi, és ezzel párhuzamosan a felismerés minősége is problémás. Így az intenzionális felismerési módszerek lehetséges alkalmazási területét valós problémákra vetítve olyan képet kapunk, amely megfelel a lineáris diagnosztikai modellek jól kidolgozott hagyományos módszertanának.

Jól tanulmányozták azon lineáris diagnosztikai modellek tulajdonságait, amelyekben a diagnosztikai indikátort a kezdeti jellemzők súlyozott összege képviseli. Ezeknek a modelleknek az eredményei (megfelelő normalizálással) a vizsgált objektumok és a jellemzőtér valamely hipersík közötti távolságaként, vagy ennek megfelelő módon objektumok vetületeiként ebben a térben valamilyen egyenesre értelmezhetők. Ezért a lineáris modellek csak a jellemzőtér azon területeinek egyszerű geometriai konfigurációihoz megfelelőek, amelyekbe különböző diagnosztikai osztályokba tartozó objektumok vannak leképezve. Bonyolultabb eloszlás esetén ezek a modellek alapvetően nem tükrözik a kísérleti adatok szerkezetének számos jellemzőjét. Ugyanakkor az ilyen funkciók értékes diagnosztikai információkat szolgáltathatnak.

Ugyanakkor az egyszerű többdimenziós struktúrák (különösen a többdimenziós normális eloszlások) minden valós problémában való megjelenését inkább kivételnek, semmint szabálynak kell tekinteni. Gyakran a diagnosztikai osztályokat komplex alapján alakítják ki külső kritériumok, ami automatikusan magával vonja ezen osztályok geometriai heterogenitását a jellemzőtérben. Ez különösen igaz a gyakorlatban leggyakrabban előforduló „létfontosságú” kritériumokra. Ilyen körülmények között a használat lineáris modellek csak a kísérleti információk legdurvább mintáit rögzíti.

A kiterjesztési módszerek használata nem jár semmilyen feltételezéssel a kísérleti információ szerkezetére vonatkozóan, kivéve, hogy a felismert osztályokon belül kell lennie egy vagy több hasonló objektumcsoportnak, és a különböző osztályok objektumainak némileg különbözniük kell egymástól. Nyilvánvalóan a betanítási minta bármely véges méreténél (és nem lehet más) ez a követelmény mindig teljesül, pusztán azért, mert véletlenszerű különbségek vannak az objektumok között. Hasonlósági mértékként a jellemzőtérben lévő objektumok közelségének (távolságának) különböző mértékeit használják. azért hatékony használat A mintafelismerés extenzív módszerei attól függnek, hogy a megadott közelségi mérőszámok mennyire vannak meghatározva, valamint attól, hogy a betanítási minta mely objektumai (ismert osztályozású objektumok) szolgálnak diagnosztikai precedensként. Ezeknek a problémáknak a sikeres megoldása a felismerési hatékonyság elméletileg elérhető határait megközelítő eredményeket ad.

Az extenzív mintafelismerési módszerek előnyeit elsősorban gyakorlati megvalósításuk nagy technikai bonyolultsága ellensúlyozza. A nagy dimenziójú jellemzőterek esetében komoly problémát jelent az egyszerűnek tűnő feladat a legközelebbi pontok párjainak megtalálása. Sok szerző problémaként említi azt is, hogy kellően sok felismert osztályokat képviselő objektumra kell emlékezni.

Ez önmagában nem jelent problémát, de problémaként érzékelik (például a k-legközelebbi szomszédok metódusában) abból az okból, hogy minden egyes objektum felismerésekor a betanító halmazban lévő összes objektum teljes keresése megtörténik.

Ezért célszerű olyan felismerési rendszermodellt alkalmazni, amelyben a felismerés során megszűnik az objektumok teljes felsorolásának problémája a betanítási mintában, mivel ezt csak egyszer hajtják végre a felismerési osztályok általánosított képeinek generálásakor. Maga a felismerés során az azonosított objektumot csak a felismerési osztályok általánosított képeivel hasonlítják össze, amelyek száma rögzített és teljesen független a betanítási minta méretétől. Ez a megközelítés lehetővé teszi a betanítási minta méretének növelését addig, amíg el nem éri az általánosított képek szükséges jó minőségét, anélkül, hogy félne attól, hogy ez a felismerési idő elfogadhatatlan növekedéséhez vezethet (mivel a felismerési idő ebben a modellben egyáltalán nem függ a képzési minta mérete) .

Az extenzív felismerési módszerek alkalmazásának elméleti problémái az informatív jellemzőcsoportok keresésének, az objektumok hasonlóságának és különbségének mérésére optimális mérőszámok megtalálásának, valamint a kísérleti információk szerkezetének elemzésének problémáival függnek össze. Ugyanakkor ezeknek a problémáknak a sikeres megoldása nemcsak hatékony felismerési algoritmusok megalkotását teszi lehetővé, hanem az empirikus tények extenzionális ismeretétől a szerkezetük mintázataira vonatkozó intenzionális tudás felé való átmenetet is.

Az extenzív tudásról az intenzionális tudásra való átmenet abban a szakaszban történik, amikor a formális felismerési algoritmus már elkészült, és annak hatékonysága bizonyított. Ezután tanulmányozzák azokat a mechanizmusokat, amelyekkel az eredményül kapott hatékonyság érhető el. Egy ilyen, az adatok geometriai struktúrájának elemzésével összefüggő vizsgálat például arra a következtetésre vezethet, hogy az adott diagnosztikai osztályt képviselő objektumokat elegendő egy tipikus képviselővel (prototípussal) helyettesíteni. Ez egyenértékű a hagyományos lineáris diagnosztikai skála meghatározásával, mint fentebb megjegyeztük. Az is előfordulhat, hogy elegendő minden diagnosztikai osztályt több objektummal helyettesíteni, amelyeket egyes alosztályok tipikus képviselőiként értelmeznek, ami egyenértékű a lineáris skálák rajongójának felépítésével. Vannak más lehetőségek is, amelyeket az alábbiakban tárgyalunk.

Így a felismerési módszerek áttekintése azt mutatja, hogy jelenleg elméletileg fejlett egy egész sorozat különféle módszerek minta felismerés. A szakirodalom részletes osztályozást ad ezekről. A legtöbb ilyen módszernél azonban nincs szoftveres implementáció, és ez mélyen természetes, akár maguknak a felismerési módszereknek a sajátosságai által is „előre meghatározott”. Ezt abból a tényből lehet megítélni, hogy az ilyen rendszereket a szakirodalom és más információforrások ritkán említik.

Ebből következően a gyakorlati alkalmazhatóság kérdése bizonyos elméleti módszerek elismerés a megoldásért gyakorlati problémák valós (azaz elég jelentős) adatdimenziókkal és valódi modern számítógépeken.

A fent említett körülmény érthető, ha felidézzük, hogy a matematikai modell összetettsége exponenciálisan növeli a rendszer szoftveres megvalósításának összetettségét, és ugyanilyen mértékben csökkenti annak esélyét, hogy ez a rendszer gyakorlatilag működni fog. Ez azt jelenti, hogy a valóságban csak olyan szoftverrendszerek valósíthatók meg a piacon, amelyek meglehetősen egyszerű és „átlátható” matematikai modelleken alapulnak. Ezért a szoftvertermékének replikálásában érdekelt fejlesztő nem közelíti meg a matematikai modell kiválasztásának kérdését tisztán tudományos szempont vízió, hanem pragmatikusként, a szoftveres megvalósítás lehetőségeit figyelembe véve. Véleménye szerint a modellnek a lehető legegyszerűbbnek kell lennie, vagyis alacsonyabb költséggel és jobb minőségben kell megvalósítani, és működnie is kell (gyakorlatilag hatékonynak kell lennie).

Ebben a tekintetben különösen fontosnak tűnik az a feladat, hogy a felismerő rendszerekben egy olyan mechanizmust implementáljanak, amely az azonos osztályba tartozó objektumok leírását általánosítja, pl. kompakt általánosított képek kialakításának mechanizmusa. Nyilvánvaló, hogy egy ilyen általánosító mechanizmus lehetővé teszi bármely dimenziójú betanítási minta „tömörítését” a dimenziónként előre ismert általánosított képek adatbázisába. Ez lehetővé teszi számos olyan probléma felvetését és megoldását is, amelyeket olyan felismerési módszerekben nem is lehet megfogalmazni, mint a prototípussal való összehasonlítás módszere, a k-legközelebbi szomszédok módszere és az ABO.

Ezek a feladatok:

  • a jellemzők információs hozzájárulásának meghatározása egy általánosított kép információs portréjához;
  • általánosított képek klaszter-konstruktív elemzése;
  • egy jellemző szemantikai terhelésének meghatározása;
  • jellemzők szemantikai klaszter-konstruktív elemzése;
  • osztályok általánosított képeinek és jellemzőinek értelmes összehasonlítása egymással (kognitív diagramok, köztük Merlin-diagramok).

Az a módszer, amely lehetővé tette e problémák megoldását, az erre épülő ígéretes rendszert is megkülönbözteti a többi rendszertől, ahogy a fordítók is különböznek az interpretátoroktól, hiszen az általánosított képek kialakításának köszönhetően ebben az ígéretes rendszerben a felismerési idő függetlensége a képzési minta méretét elérjük. Köztudott, hogy ennek a függőségnek a megléte vezet gyakorlatilag elfogadhatatlan számítógépes időköltségekhez a felismeréshez olyan módszereknél, mint a k-legközelebbi szomszédok módszere, ABO és KRP a képzési minta olyan dimenzióinál, amikor elegendő statisztikáról beszélhetünk. .

A felismerési módszerek rövid áttekintéseként a fentiek lényegét mutatjuk be egy összefoglaló táblázatban (3.1. táblázat), amely tartalmazza rövid leírás különféle képfelismerési módszerek a következő paraméterek alapján:

  • felismerési módszerek osztályozása;
  • felismerési módszerek alkalmazási területei;
  • a felismerési módszerek korlátainak osztályozása.
A felismerési módszerek osztályozása Alkalmazási kör Korlátozások (hátrányok)
Intenzív felismerési módszerek A jellemzőértékek (vagy az objektumok hasonlóságai és különbségei) eloszlási sűrűségének becslésén alapuló módszerek Az ismert eloszlású, általában normál eloszlású problémák nagy statisztikai gyűjteményt igényelnek A teljes képzési minta számbavételének szükségessége a felismerés során, nagy érzékenység a képzési minta nem reprezentativitására és a műtermékekre
A döntési függvények osztályára vonatkozó feltevéseken alapuló módszerek Az osztályoknak jól elkülöníthetőnek, a jellemzőrendszernek ortonormálisnak kell lenniük A döntési függvény típusát előre ismerni kell. Képtelenség figyelembe venni az új ismereteket a tulajdonságok közötti összefüggésekről
Boole-módszerek A logikai döntési szabályok (kötőszavak) kiválasztásakor teljes keresés szükséges. Magas számítási komplexitás
Nyelvi (strukturális) módszerek A jellemzőtér kis méretének problémái A nyelvtan rekonstrukciója (definiálása) bizonyos állítások (objektumleírások) halmazából nehezen formalizálható. Megoldatlan elméleti problémák
Kiterjesztéses felismerési módszerek Prototípussal való összehasonlítás módszere A jellemzőtér kis méretének problémái Az osztályozási eredmények nagymértékben függenek a távolságmértéktől (metrikus). Ismeretlen optimális mérőszám
k legközelebbi szomszédok módszere Az osztályozási eredmények nagymértékben függenek a távolságmértéktől (metrikus). A képzési minta teljes számbavételének szükségessége a felismerés során. Számítási erőfeszítés
Algoritmusok az AVO minősítések (szavazás) kiszámításához Kis dimenziójú problémák az osztályok számát és jellemzőit illetően Az osztályozási eredmények függése a távolságmértéktől (metrikus). A képzési minta teljes számbavételének szükségessége a felismerés során. A módszer magas műszaki összetettsége
Döntési szabály kollektívák (DRC) Kis dimenziójú problémák az osztályok számát és jellemzőit illetően A módszer rendkívül magas technikai bonyolultsága, megoldatlan elméleti problémák száma, mind a privát módszerek kompetenciaterületeinek meghatározásában, mind magukban a magánmódszerekben

3.1. táblázat – Összefoglaló táblázat a felismerési módszerek osztályozásáról, alkalmazási területeik és korlátaik összehasonlításáról

A mintafelismerés szerepe és helye a komplex rendszerek vezérlésének automatizálásában

Az automatizált vezérlőrendszer két fő részből áll: egy vezérlőobjektumból és egy vezérlőrendszerből.

A vezérlőrendszer a következő funkciókat látja el:

  • a vezérlő objektum állapotának azonosítása;
  • irányítási célokon alapuló irányítási cselekvés kialakítása, figyelembe véve az irányítási objektum és a környezet állapotát;
  • vezérlő befolyást biztosít a vezérlőobjektumra.

A mintafelismerés nem más, mint valamely tárgy állapotának azonosítása.

Következésképpen a mintafelismerő rendszer használatának lehetősége a vezérlőobjektum állapotának azonosításának szakaszában meglehetősen kézenfekvőnek és természetesnek tűnik. Ez azonban nem feltétlenül szükséges. Felmerül tehát a kérdés, hogy mely esetekben célszerű felismerő rendszert alkalmazni egy automatizált vezérlőrendszerben, és melyikben nem.

A szakirodalom szerint számos korábban kifejlesztett és modern automatizált vezérlőrendszer a vezérlőobjektum állapotának azonosítására és a vezérlési műveletek fejlesztésére szolgáló alrendszerekben a „közvetlen számítás” determinisztikus matematikai modelljeit használja, amelyek egyértelműen és egyszerűen meghatározzák, hogy mit kell tenni a vezérléssel. objektum, ha rendelkezik bizonyos külső paraméterekkel.

Ugyanakkor az a kérdés, hogy ezek a paraméterek hogyan kapcsolódnak a vezérlőobjektum egyes állapotaihoz, nem vetődik fel és nem oldódik meg. Ez az álláspont megfelel annak az álláspontnak, hogy „alapértelmezés szerint” az egy-egy kapcsolatukat elfogadják. Ezért a „vezérlőobjektum paraméterei” és a „vezérlőobjektum állapota” kifejezések szinonimáknak minősülnek, és a „vezérlőobjektum állapota” fogalmát egyáltalán nem vezetik be kifejezetten. Nyilvánvaló azonban, hogy be általános eset a vezérlőobjektum megfigyelt paraméterei és állapota közötti kapcsolat dinamikus és valószínűségi jellegű.

Így a hagyományos automatizált vezérlőrendszerek alapvetően parametrikus vezérlőrendszerek, azaz. olyan rendszerek, amelyek nem a vezérlőobjektum állapotait, hanem csak a megfigyelhető paramétereit kezelik. Az irányítási műveletről az ilyen rendszerekben a döntés „vakon”, azaz „vakon” történik. anélkül, hogy holisztikus képet alkotna a vezérlőobjektumról és környezet jelenlegi állapotukban, valamint anélkül, hogy előre jeleznék a környezet fejlődését és az irányítási objektum reakcióját az azt érő bizonyos szabályozási hatásokra, a környezet előre jelzett hatásával egyidejűleg hatnak.

A jelen munkában kidolgozott szemszögből a mai értelemben vett „döntéshozatal” kifejezés aligha alkalmazható teljes mértékben a hagyományos automatizált vezérlőrendszerekre. A tény az, hogy a „döntéshozatal” legalább egy holisztikus látásmódot feltételez a környezetben lévő objektumról, nem csak a jelenlegi állapotában, hanem dinamikában is, és mind az egymással, mind a vezérlőrendszerrel kölcsönhatásban. különböző alternatív lehetőségek mérlegelése ennek a teljes rendszernek a fejlesztésére, valamint ezen alternatívák diverzitásának szűkítése (csökkentése) bizonyos célkritériumok alapján. A hagyományos automatizált vezérlőrendszerekben nyilvánvalóan ezek egyike sem található meg, vagy létezik, csak leegyszerűsített formában.

Természetesen a hagyományos módszer megfelelő, és alkalmazása meglehetősen helyes és indokolt olyan esetekben, amikor az irányítási objektum valóban stabil és szigorúan meghatározott rendszer, és a környezet rá gyakorolt ​​hatása elhanyagolható.

Más esetekben azonban ez a módszer hatástalan.

Ha a vezérlési objektum dinamikus, akkor a vezérlési algoritmusok alapjául szolgáló modellek gyorsan inadekváttá válnak, mivel a bemeneti és kimeneti paraméterek közötti kapcsolatok, valamint maga a lényeges paraméterek halmaza megváltozik. Ez lényegében azt jelenti, hogy a hagyományos automatizált vezérlőrendszerek csak az egyensúlyi pont közelében képesek a vezérlőobjektum állapotát a rajta végrehajtott gyenge vezérlési akciókon keresztül szabályozni, pl. kis perturbációk módszerével. Az egyensúlyi állapottól távol, a hagyományos nézőpontból a vezérlő objektum viselkedése kiszámíthatatlannak és ellenőrizhetetlennek tűnik.

Ha nincs egyértelmű kapcsolat a vezérlőobjektum bemeneti és kimeneti paraméterei között (azaz a bemeneti paraméterek és az objektum állapota között), más szóval, ha ennek a kapcsolatnak kifejezett valószínűségi természete van, akkor determinisztikus modellek, amelyekben ez Feltételezve, hogy egy bizonyos paraméter mérésének eredménye egyszerűen szám, kezdetben nem alkalmazható. Emellett előfordulhat, hogy ennek a kapcsolatnak a típusa egyszerűen ismeretlen, és akkor a legáltalánosabb feltevésből kell kiindulni: valószínűségi vagy egyáltalán nem definiált.

Beépített automata vezérlőrendszer hagyományos elvek, csak olyan paraméterek alapján tud működni, amelyek kapcsolódási mintái már ismertek, tanulmányozottak és matematikai modellben tükröződnek, a feladat olyan automatizált vezérlőrendszerek tervezésének kidolgozása, amelyek lehetővé teszik egy azonosításra képes rendszerek létrehozását; a legjelentősebb paraméterek halmaza, valamint a köztük lévő kapcsolatok és a vezérlőobjektum állapotainak meghatározása.

Ebben az esetben a valós helyzetnek megfelelő, fejlettebb mérési módszereket kell alkalmazni:

  • képek osztályozása vagy felismerése (tanulás egy betanítási mintán, felismerési algoritmusok adaptálhatósága, a vizsgált osztály- és paraméterkészletek adaptálhatósága, a legjelentősebb paraméterek kiválasztása és a leírási dimenzió csökkentése egy adott redundancia megtartása mellett stb.);
  • statisztikai mérések, amikor egy bizonyos paraméter mérésének eredménye nem egyetlen szám, hanem valószínűségi eloszlás: egy statisztikai változó változása nem önmagában értékének változását jelenti, hanem értékei valószínűségi eloszlásának jellemzőinek változását.

Ennek eredményeként a hagyományos determinisztikus megközelítésen alapuló automatizált vezérlőrendszerek gyakorlatilag nem működnek összetett dinamikus többparaméteres gyengén determinisztikus vezérlőobjektumokkal, mint például makro- és mikro-társadalmi-gazdasági rendszerekkel egy dinamikus gazdaságban. átmeneti időszak”, hierarchikus elit ill etnikai csoportok, társadalom és választópolgárok, emberi fiziológia és psziché, természetes és mesterséges ökoszisztémák és még sok más.

Nagyon jelentős, hogy a 80-as évek közepén I. Prigogine iskolája kidolgozott egy olyan megközelítést, amely szerint bármely rendszer (beleértve az embert is) fejlődése váltakozik olyan periódusokkal, amelyek során a rendszer vagy „többnyire determinisztikusan”, vagy „többnyire véletlenszerűen” viselkedik. Természetesen egy valódi vezérlőrendszernek nemcsak történetének „determinisztikus” szakaszaiban kell stabilan irányítania a vezérlőobjektumot, hanem olyan pontokon is, amikor további viselkedése erősen bizonytalanná válik. Ez önmagában azt jelenti, hogy megközelítéseket kell kidolgozni olyan rendszerek kezelésére, amelyek viselkedése az nagy elem véletlenszerűség (vagy amit jelenleg matematikailag "véletlenségnek" neveznek).

Ezért az ígéretes automatizált vezérlőrendszerek, amelyek összetett dinamikus többparaméteres gyengén determinisztikus rendszerek vezérlését biztosítják, nyilvánvalóan tartalmazni fognak a környezet és a vezérlőobjektum állapotának azonosítására és előrejelzésére szolgáló alrendszereket, amelyek mesterséges intelligencia módszereken (elsősorban mintafelismerés) alapulnak, támogató módszerek döntését. készítés és információelmélet.

Tekintsük röviden a képfelismerő rendszerek felhasználásának kérdését a vezérlési műveletekkel kapcsolatos döntések meghozatalához (erről a kérdésről később részletesebben lesz szó, mivel ez kulcsfontosságú ebben a munkában). Ha felismerési osztálynak vesszük a vezérlőobjektum cél- és egyéb állapotait, jellemzőknek pedig az azt befolyásoló tényezőket, akkor a mintafelismerő modellben a faktorok és állapotok kapcsolatának mértéke képezhető. Ez lehetővé teszi, hogy egy vezérlőobjektum adott állapotára vonatkozóan információt szerezzünk azokról a tényezőkről, amelyek elősegítik vagy akadályozzák az ebbe az állapotba való átmenetet, és ennek alapján döntést hozhatunk a vezérlési műveletről.

A tényezők a következő csoportokra oszthatók:

  • a vezérlőobjektum történetének jellemzése;
  • a vezérlőobjektum aktuális állapotának jellemzése;
  • környezeti tényezők;
  • technológiai (szabályozható) tényezők.

Így a mintafelismerő rendszerek az automatizált vezérlőrendszerek részeként használhatók: alrendszerekben egy vezérlőobjektum állapotának azonosítására és vezérlési műveletek fejlesztésére.

Ez akkor célszerű, ha a vezérlőobjektum egy összetett rendszer.

Döntés meghozatala a vezérlési műveletről az automatizált vezérlőrendszerben

Ez a munka az adaptív automatizált vezérlőrendszerek komplex rendszerekkel történő szintetizálásának problémájának megoldását vizsgálja, figyelembe véve a mintafelismerés és a döntéshozatal módszerei közötti számos és mély analógiát.

Egyrészt a mintafelismerés problémája annak eldöntése, hogy a felismert objektum egy bizonyos felismerési osztályba tartozik-e.

Másrészt a szerzők azt javasolják, hogy a döntéshozatali problémát inverz dekódolási problémának vagy inverz mintafelismerési problémának tekintsük (lásd 2.2.2. fejezet).

A mintafelismerés és a döntéshozatal módszereinek alapjául szolgáló alapgondolatok közössége különösen akkor válik szembetűnővé, ha információelméleti szempontból vizsgáljuk őket.

Sokféle döntési probléma

Döntéshozatal, mint cél megvalósítása

Definíció: a döntéshozatal („választás”) az alternatívák halmaza feletti cselekvés, amelynek eredményeként az alternatívák kezdeti halmaza leszűkül, azaz. csökkenése következik be.

A választás az a cselekvés, amely minden tevékenységnek célt ad. A választási aktusok révén valósul meg minden tevékenység alárendeltsége konkrét cél vagy egymással összefüggő célok összessége.

Tehát ahhoz, hogy a választási aktus lehetővé váljon, a következőkre van szükség:

  • olyan alternatívák létrehozása vagy felfedezése, amelyek alapján választani kell;
  • azon célok meghatározása, amelyek érdekében a választás történik;
  • alternatívák egymással való összehasonlítására szolgáló módszer kidolgozása és alkalmazása, pl. Az egyes alternatívák preferenciális besorolása bizonyos kritériumok alapján, amely lehetővé teszi közvetett módon annak felmérését, hogy az egyes alternatívák mennyire felelnek meg a célnak.

A döntéstámogatás területén végzett modern munka egy jellegzetes helyzetet tárt fel, miszerint a legjobb (bizonyos értelemben) megoldás megtalálásának teljes formalizálása csak jól áttanulmányozott, viszonylag egyszerű problémák esetén lehetséges, míg a gyakorlatban a gyengén strukturált problémák a legmegfelelőbbek. gyakrabban találkozunk, amelyekre egyáltalán nem dolgoztak ki formalizált algoritmusokat (kivéve a kimerítő keresést és a próba-hibát). A tapasztalt, hozzáértő és hozzáértő szakemberek azonban gyakran olyan döntéseket hoznak, amelyek egészen jónak bizonyulnak. Ezért a természetes helyzetekben történő döntéshozatal modern irányzata az, hogy az ember informális problémák megoldásának képességét egyesítsék a formális módszerek és a számítógépes modellezés képességeivel: interaktív döntéstámogató rendszerek, szakértői rendszerek, adaptív ember-gép. automatizált rendszerek vezérlés, neurális hálózatok és kognitív rendszerek.

Döntéshozatal, mint a bizonytalanság megszüntetése (információs megközelítés)

Az információszerzés folyamata a jel vételéből adódó bizonytalanság csökkenésének, az információ mennyisége pedig a bizonytalanság eltávolítás mértékének kvantitatív mérőszámának tekinthető.

De az alternatívák egy bizonyos részhalmazának a halmazból történő kiválasztásának eredményeképpen, pl. a döntéshozatal eredményeként ugyanez történik (a bizonytalanság csökkentése). Ez azt jelenti, hogy minden választás, minden döntés bizonyos mennyiségű információt generál, ezért információelméletileg leírható.

A döntéshozatali problémák osztályozása

A döntési feladatok sokrétűsége abból adódik, hogy a döntéshozatali szituáció egyes összetevői minőségileg eltérő lehetőségekben valósíthatók meg.

Soroljunk fel néhányat a lehetőségek közül:

  • az alternatívák halmaza egyrészt lehet véges, megszámlálható vagy folytonos, másrészt zárt (azaz teljesen ismert) vagy nyitott (ismeretlen elemeket is beleértve);
  • az alternatívák értékelése egy vagy több kritérium alapján is elvégezhető, amelyek viszont lehetnek mennyiségi vagy minőségi jellegűek;
  • A kiválasztási mód lehet egyszeri (egyszeri), vagy többszörös, ismétlődő, beleértve a visszajelzést a választás eredményéről, pl. a döntéshozatali algoritmusok képzésének lehetővé tétele az előző választások következményeinek figyelembevételével;
  • az egyes alternatívák választásának következményei előre pontosan ismertek (a választás bizonyossági feltételek mellett), valószínűségi jellegűek, ha a valószínűségek ismertek lehetséges eredményeket döntés meghozatala után (választás kockázat alatt), vagy ismeretlen valószínűséggel kétértelmű kimenetelű (választás bizonytalanság alatt);
  • a választás felelőssége hiányozhat, egyéni vagy csoportos lehet;
  • a csoportválasztásban a célok konzisztenciájának mértéke a felek érdekeinek teljes egybeesésétől (együttműködő választás) az ellenkezőjéig (konfliktushelyzetben történő választás) változhat. Köztes lehetőségek is lehetségesek: kompromisszum, koalíció, növekvő vagy elhalványuló konfliktus.

Ezen lehetőségek különféle kombinációi számos döntéshozatali problémához vezetnek, amelyeket különböző mértékben tanulmányoztak.

Nyelvek a döntéshozatali módszerek leírására

Ugyanarról a jelenségről beszélhetünk különböző nyelveken, eltérő általánossággal és megfelelőséggel. A mai napig három fő nyelv alakult ki a választás leírására.

A legegyszerűbb, legfejlettebb és legnépszerűbb a kritériumnyelv.

Kritériumok nyelve

Ennek a nyelvnek a nevéhez az az alapfeltevés társul, hogy minden egyes alternatíva valamilyen meghatározott (egy) számmal értékelhető, ami után az alternatívák összehasonlítása a megfelelő számok összehasonlítására redukálódik.

Legyen például (X) alternatívák halmaza, x pedig valami ehhez a halmazhoz tartozó konkrét alternatíva: x∈X. Ekkor úgy gondoljuk, hogy minden x-re megadható egy q(x) függvény, amit kritériumnak nevezünk (minőségi kritérium, célfüggvény, preferenciafüggvény, hasznossági függvény stb.), amelynek az a tulajdonsága, hogy ha az x 1 alternatíva előnyösebb. x 2-re (jelölése: x 1 > x 2), majd q(x 1) > q(x 2).

Ebben az esetben a választás a kritériumfüggvény legmagasabb értékével rendelkező alternatíva keresésén múlik.

A gyakorlatban azonban indokolatlan egyszerűsítésnek bizonyul, ha csak egy kritériumot használunk az alternatívák preferáltsági fokának összehasonlítására, mivel az alternatívák részletesebb mérlegelése azt eredményezi, hogy nem egy, hanem több szempont alapján kell értékelni őket, ami eltérő természetűek és minőségileg különböznek egymástól.

Például az utasok és az üzemeltető szervezet számára legelfogadhatóbb repülőgéptípus kiválasztásakor bizonyos típusok az útvonalakat egyidejűleg sok szempontcsoport szerint hasonlítják össze: műszaki, technológiai, gazdasági, társadalmi, ergonómiai stb.

A többszempontú problémáknak nincs egyedi általános megoldása. Ezért számos módot javasolnak arra, hogy egy többkritériumú problémát olyan konkrét formába adjunk, amely egyetlen általános megoldást tesz lehetővé. Természetesen ezek a megoldások a különböző módszereknél általában eltérőek. Ezért egy többkritériumú probléma megoldásában talán a legfontosabb az ilyen típusú megfogalmazás indokoltsága.

Különféle lehetőségeket használnak a többszempontú kiválasztási probléma egyszerűsítésére. Soroljunk fel néhányat közülük.

  1. Feltételes maximalizálás (nem az integrálkritérium globális szélsőértéke található, hanem a főkritérium lokális szélsőértéke).
  2. Keressen alternatívát megadott tulajdonságokkal.
  3. A Pareto halmaz megtalálása.
  4. Többszempontú probléma redukálása egykritériumú problémává integrálkritérium bevezetésével.

Tekintsük részletesebben annak a módszernek a formális megfogalmazását, amellyel egy többszempontú probléma egykritérikusra redukálható.

Vezessük be a q 0 (x) integrálkritériumot a vektor argumentum skaláris függvényeként:

q 0 (x) = q 0 ((q 1 (x), q 2 (x), ..., q n (x)).

Az integrál kritérium lehetővé teszi az alternatívák q 0 értékének megfelelő sorrendbe állítását, ezzel kiemelve a legjobbat (e kritérium értelmében). A q 0 függvény alakját az határozza meg, hogy mennyire konkrétan képzeljük el az egyes kritériumok hozzájárulását az integrálkritériumhoz. Általában additív és multiplikatív függvényeket használnak:

q 0 = ∑a i ⋅q i /s i

1 - q 0 = ∏(1 - b i ⋅q i /s i)

Az általam biztosított együtthatók:

  1. A dimenziómentesség vagy az a i ⋅q i /s i szám egyetlen dimenziója (a különböző részkritériumok különböző dimenziókkal rendelkezhetnek, és akkor nem lehet rajtuk aritmetikai műveleteket végrehajtani és integrálkritériumra redukálni).
  2. Normalizálás, azaz. feltétel biztosítása: b i ⋅q i /s i<1.

Az a i és b i együtthatók a q i részkritériumok relatív hozzájárulását tükrözik az integrálkritériumhoz.

Tehát egy többszempontú megfogalmazásban az egyik alternatíva kiválasztásával kapcsolatos döntés meghozatalának problémája az integrál kritérium maximalizálásához vezet:

x * = arg max(q 0 (q 1 (x), q 2 (x), ..., q n (x)))

A döntési probléma többszempontú megfogalmazásánál a fő probléma az, hogy az a i és b i együtthatók olyan analitikus formáját kell megtalálni, amely a modell alábbi tulajdonságait biztosítaná:

  • a témakörnek és a szakértői szempontoknak való magas fokú megfelelőség;
  • minimális számítási nehézségek az integrálkritérium maximalizálásában, pl. számítása különböző alternatívákra;
  • az integrálkritérium maximalizálásának eredményeinek stabilitása a kezdeti adatok kis zavaraiból.
  • A megoldás stabilitása azt jelenti, hogy a kezdeti adatok kis változtatása az integrálkritérium értékének kismértékű változásához, ennek megfelelően a meghozott döntés kismértékű változásához vezet. Így, ha a kiindulási adatok gyakorlatilag megegyeznek, akkor vagy azonos vagy nagyon közeli döntést kell hozni.

Szekvenciális bináris választási nyelv

A bináris relációk nyelve egy többkritériumú nyelv általánosítása, és azon alapul, hogy figyelembe vesszük, hogy amikor egy alternatívát értékelünk, ez az értékelés mindig relatív, azaz. kifejezetten vagy gyakrabban implicit módon a vizsgált halmazból vagy az általános populációból származó egyéb alternatívákat használnak összehasonlítási alapként vagy referenciakeretként. Az emberi gondolkodás az ellentétek (konstrukciók) keresésén és elemzésén alapul, így mindig könnyebben választhatunk két ellentétes lehetőség közül egyet, mint egyet egy nagy és semmiképpen sem rendezett halmazból.

Így ennek a nyelvnek az alapvető feltevései a következők:

  • külön alternatívát nem értékelnek, i.e. a kritériumfüggvény nincs bevezetve;
  • minden alternatívapár esetében valamilyen módon megállapítható, hogy az egyik előnyösebb a másiknál, vagy egyenértékűek vagy összehasonlíthatatlanok;
  • a preferencia reláció egyetlen alternatívapárban sem függ a választásra bemutatott többi alternatívától.

A bináris relációk megadásának többféle módja van: közvetlen, mátrix, preferenciagráfok, szakaszmódszer stb.

Az egy pár alternatívái közötti kapcsolatokat az ekvivalencia, a sorrend és a dominancia fogalmai fejezik ki.

Általános kiválasztási funkció nyelve

A választási függvény nyelve a halmazelméleten alapul, és lehetővé teszi, hogy leképezéseket hajtson végre a halmazokból a különböző választási lehetőségeknek megfelelő részhalmazakra anélkül, hogy fel kellene sorolnia az elemeket. Ez a nyelv nagyon általános, és bármilyen választást leírhat. Az általánosított szelekciós függvények matematikai apparátusát azonban jelenleg még csak fejlesztik és főként olyan problémákon tesztelik, amelyeket kritérium alapú vagy bináris megközelítéssel már megoldottak.

Csoportválasztás

Legyen olyan embercsoport, akinek joga van részt venni a kollektív döntéshozatalban. Tételezzük fel, hogy ez a csoport egy bizonyos alternatívát mérlegel, és a csoport minden tagja saját maga választ. A feladat egy olyan megoldás kidolgozása, amely bizonyos módon összehangolja az egyéni választásokat, és bizonyos értelemben kifejezi a csoport „általános véleményét”, pl. csoportválasztásként fogadták el.

Természetesen az egyéni döntések összehangolásának más-más elvei megfelelnek a különböző csoportdöntéseknek.

A csoportválasztás során az egyéni döntések összehangolására vonatkozó szabályokat szavazási szabályoknak nevezzük. A legelterjedtebb a „többségi szabály”, amelyben a legtöbb szavazatot kapott alternatívát fogadják el csoportdöntésnek.

Meg kell érteni, hogy egy ilyen döntés csak a különböző nézőpontok csoporton belüli elterjedését tükrözi, nem pedig az igazán optimális lehetőséget, amelyre egyáltalán nem szavazhat senki. "Az igazságot nem szavazás határozza meg."

Emellett léteznek úgynevezett „szavazási paradoxonok”, amelyek közül a leghíresebb Arrow paradoxona.

Ezek a paradoxonok a szavazási eljárás nagyon kellemetlen sajátosságaihoz vezethetnek, és néha vezetnek is: például vannak olyan esetek, amikor a csoport egyáltalán nem tud egyetlen döntést hozni (nincs határozatképes, vagy mindenki a saját egyedi választására szavaz stb. .), és néha (többlépcsős szavazással) a kisebbség rákényszerítheti akaratát a többségre.

Választás a bizonytalanság körülményei között

A bizonyosság a bizonytalanság speciális esete, nevezetesen: a nullához közeli bizonytalanság.

A modern választáselméletben úgy vélik, hogy a döntéshozatali problémákban a bizonytalanság három fő típusa van:

  1. A kiinduló adatok információs (statisztikai) bizonytalansága a döntéshozatalhoz.
  2. A döntéshozatal (választás) következményeinek bizonytalansága.
  3. Homályosság a döntéshozatali folyamat összetevőinek leírásában.

Nézzük őket sorban.

Információs (statisztikai) bizonytalanság a forrásadatokban

A tárgykörről szerzett adatok nem tekinthetők teljesen pontosnak. Ráadásul ezek az adatok nyilvánvalóan nem önmagukban érdekelnek bennünket, hanem csak jelekként, amelyek bizonyos információkat hordozhatnak arról, hogy mi is érdekel minket. Így reálisabb azt gondolni, hogy nemcsak zajos és pontatlan, hanem közvetett, esetleg hiányos adatokkal is van dolgunk. Ráadásul ezek az adatok nem a teljes vizsgált populációra vonatkoznak, hanem annak csak egy bizonyos részhalmazára, amelyről ténylegesen tudtunk adatokat gyűjteni, ugyanakkor a teljes populációra szeretnénk következtetéseket levonni, illetve szeretné tudni, hogy ezek a következtetések mekkora megbízhatóságúak.

Ilyen körülmények között a statisztikai döntések elméletét alkalmazzák.

Ebben az elméletben két fő bizonytalansági forrás van. Először is nem ismert, hogy az eredeti adatok milyen eloszlást követnek. Másodszor, nem ismert, hogy milyen eloszlása ​​van annak a halmaznak (általános sokaság), amelyre vonatkozóan a kiindulási adatokat képező részhalmazából kívánunk következtetéseket levonni.

A statisztikai eljárások olyan döntéshozatali eljárások, amelyek mindkét típusú bizonytalanságot megszüntetik.

Meg kell jegyezni, hogy számos oka van a statisztikai módszerek helytelen alkalmazásának:

  • A statisztikai következtetéseknek, mint minden másnak, mindig van bizonyos megbízhatósága vagy érvényessége. De sok más esettől eltérően a statisztikai következtetések megbízhatósága ismert és a statisztikai vizsgálat során meghatározott;
  • a statisztikai eljárás alkalmazásával kapott megoldás minősége a forrásadatok minőségétől függ;
  • a nem statisztikai jellegű adatokat nem szabad statisztikai feldolgozásnak alávetni;
  • statisztikai eljárásokat kell alkalmazni, amelyek megfelelnek a vizsgált sokaságra vonatkozó a priori információk szintjének (például az ANOVA-módszereket nem szabad nem Gauss-féle adatokra alkalmazni). Ha a kiindulási adatok eloszlása ​​nem ismert, akkor vagy meg kell határozni, vagy több különböző módszert kell alkalmazni és az eredményeket összehasonlítani. Ha nagyon eltérnek egymástól, az egyes alkalmazott eljárások alkalmatlanságát jelzi.

A következmények bizonytalansága

Ha az egyik vagy másik alternatíva választásának következményeit egyértelműen maga az alternatíva határozza meg, akkor nem tudunk különbséget tenni az alternatíva és annak következményei között, természetesnek vesszük, hogy az alternatíva választásával valójában annak következményeit választjuk.

A gyakorlatban azonban gyakran bonyolultabb helyzettel kell megküzdenie, amikor az egyik vagy másik alternatíva választása félreérthetően meghatározza a meghozott választás következményeit.

Az alternatívák és az általuk választott kimenetek diszkrét halmaza esetén, feltéve, hogy maga a lehetséges kimenetelek halmaza minden alternatívára közös, feltételezhetjük, hogy a különböző alternatívák az eredmények valószínűségi eloszlásában különböznek egymástól. Ezek a valószínűségi eloszlások általános esetben függhetnek az alternatívák kiválasztásának eredményétől és a tényleges eredményektől. A legegyszerűbb esetben az eredmények egyformán valószínűek. Maguk az eredmények általában nyereséget vagy veszteséget jelentenek, és mennyiségileg fejeződnek ki.

Ha az eredmények minden alternatíva esetében azonosak, akkor nincs mit választani. Ha különböznek, akkor összehasonlíthatja az alternatívákat bizonyos mennyiségi becslések bevezetésével. A játékelméleti problémák sokfélesége összefügg az alternatívák megválasztásából adódó veszteségek és nyereségek számszerű jellemzőinek eltérő megválasztásával, az alternatívát választó felek közötti különböző fokú konfliktusokkal stb.

Tekintse ezt a fajta bizonytalanságot homályos bizonytalanságnak

Bármilyen választási feladat az alternatívák halmazának célzott szűkítése. Mind az alternatívák formális leírása (maga listája, jellemzőik vagy paramétereik listája), mind az összehasonlításukra vonatkozó szabályok (kritériumok, összefüggések) leírása mindig egy vagy másik mérési skála szerint van megadva (még akkor is, ha az aki ezt csinálja, az nem tud erről).

Ismeretes, hogy minden skála elmosódott, de eltérő mértékben. Az „elmosódás” kifejezés a skálák tulajdonságára utal, ami abban áll, hogy mindig lehetséges két megkülönböztethető alternatíva bemutatása, pl. azonos skálán különbözőek és megkülönböztethetetlenek, i.e. azonos, a másikban - elmosódottabb. Minél kevesebb az átmenet egy adott skálán, annál elmosódottabb.

Így jól láthatjuk az alternatívákat és egyben homályosan osztályozhatjuk is, i.e. bizonytalanok abban, hogy melyik osztályba tartoznak.

Bellman és Zadeh már a homályos helyzetekben történő döntéshozatalról szóló első munkájukban felvetette azt az elképzelést, hogy mind a célokat, mind a korlátokat homályos halmazokként kell ábrázolni az alternatívák halmazán.

Az optimalizálási megközelítés néhány korlátjáról

Valamennyi fent tárgyalt kiválasztási problémánál és döntési módszernél az volt a probléma, hogy adott feltételek mellett megtaláljuk a legjobbakat az eredeti halmazban, pl. bizonyos értelemben optimális alternatívák.

Az optimalitás gondolata a kibernetika központi gondolata, és szilárdan meghonosodott a műszaki rendszerek tervezésének és üzemeltetésének gyakorlatában. Ugyanakkor ez a gondolat gondos kezelést igényel, amikor megpróbáljuk átvinni az összetett, nagy és gyengén meghatározott rendszerek, például a társadalmi-gazdasági rendszerek menedzselésének területére.

Ennek a következtetésnek elég jó okai vannak. Nézzünk ezek közül néhányat:

  1. Az optimális megoldás gyakran bizonyul instabilnak, pl. a problémakörülmények, inputok vagy korlátok kisebb változásai jelentősen eltérő alternatívák kiválasztásához vezethetnek.
  2. Az optimalizálási modelleket csak a meglehetősen egyszerű problémák szűk osztályaira fejlesztették ki, amelyek nem mindig tükrözik megfelelően és szisztematikusan a valós vezérlőobjektumokat. Az optimalizálási módszerek leggyakrabban csak néhány nagy és összetett rendszer meglehetősen egyszerű és formálisan jól leírt alrendszereinek optimalizálását teszik lehetővé, pl. csak helyi optimalizálást engedélyez. Ha azonban egy nagy rendszer minden alrendszere optimálisan működik, ez egyáltalán nem jelenti azt, hogy a rendszer egésze optimálisan fog működni. Ezért egy alrendszer optimalizálása nem feltétlenül vezet ahhoz a viselkedéshez, amely a rendszer egészének optimalizálásakor megköveteli tőle. Ezenkívül a helyi optimalizálás néha negatív következményekkel járhat a rendszer egészére nézve. Ezért az alrendszerek és a rendszer egészének optimalizálásakor meg kell határozni a célok és részcélok fáját és azok prioritását.
  3. Gyakran egy optimalizálási feltétel maximalizálását valamilyen matematikai modell szerint tekintik az optimalizálás céljának, de a valóságban a vezérlőobjektum optimalizálása a cél. Az optimalizálási kritériumok és a matematikai modellek mindig csak közvetetten kapcsolódnak a célhoz, pl. többé-kevésbé megfelelően, de mindig hozzávetőlegesen.

Tehát a matematikailag megfelelően formalizálható rendszerek számára rendkívül gyümölcsöző optimalitás gondolatát óvatosan kell átvinni a komplex rendszerekre. Természetesen az ilyen rendszerekre olykor javasolható matematikai modellek optimalizálhatók. Figyelembe kell venni azonban ezen modellek erőteljes egyszerűsítését, ami összetett rendszerek esetében már nem elhanyagolható, valamint azt, hogy ezeknek a modelleknek a megfelelőségi foka összetett rendszerek esetén gyakorlatilag ismeretlen. . Ezért nem ismert, hogy ennek az optimalizálásnak milyen pusztán gyakorlati jelentősége van. A műszaki rendszerekben az optimalizálás nagy gyakorlatiassága nem keltheti azt az illúziót, hogy az összetett rendszerek optimalizálásakor is ugyanolyan hatékony lesz. Az összetett rendszerek értelmes matematikai modellezése nagyon nehéz, közelítő és pontatlan. Minél összetettebb a rendszer, annál körültekintőbben kell optimalizálnia.

Ezért a bonyolult, nagy, gyengén determinisztikus rendszerek vezérlésére szolgáló módszerek kidolgozásakor a szerzők nem csupán a választott megközelítés formális matematikai szempontból való optimalitását tartják a legfontosabbnak, hanem a célnak való megfelelőségét és a rendszer természetét is. vezérlő objektum.

Szakértői kiválasztási módszerek

Az összetett rendszerek tanulmányozása során gyakran olyan problémák merülnek fel, amelyek különböző okok miatt nem fogalmazhatók meg és nem oldhatók meg szigorúan a jelenleg kifejlesztett matematikai apparátussal. Ezekben az esetekben szakértők (rendszerelemzők) szolgáltatásait veszik igénybe, akiknek tapasztalata és intuíciója segít csökkenteni a probléma összetettségét.

Figyelembe kell azonban venni, hogy a szakértők maguk is rendkívül összetett rendszerek, és tevékenységük számos külső és belső körülménytől is függ. Ezért a szakértői értékelések megszervezésének módszereiben nagy figyelmet fordítanak a szakértői munka kedvező külső és pszichológiai feltételeinek megteremtésére.

A szakértő munkáját a következő tényezők befolyásolják:

  • felelősség a vizsgálati eredmények felhasználásáért;
  • annak ismerete, hogy más szakértők is részt vesznek;
  • a szakértők közötti információs kapcsolat elérhetősége;
  • a szakértők interperszonális kapcsolatai (ha van köztük információs kapcsolat);
  • a szakértő személyes érdeklődése az értékelés eredményei iránt;
  • a szakértők személyes tulajdonságai (önhittség, konformitás, akarat stb.)

A szakértők közötti interakció serkentheti és elnyomhatja tevékenységüket. Ezért különböző esetekben különböző vizsgálati módszereket alkalmaznak, amelyek a szakértők egymás közötti interakciójának jellegében különböznek: anonim és nyílt felmérések és kérdőívek, találkozók, megbeszélések, üzleti játékok, ötletbörze stb.

A szakértői vélemények matematikai feldolgozására többféle módszer létezik. A szakértőket arra kérik, hogy értékeljék a különböző alternatívákat akár egy, akár egy mutatórendszer segítségével. Ezen túlmenően felkérik őket, hogy értékeljék az egyes mutatók fontossági fokát („súlyukat” vagy „hozzájárulásukat”). Maguk a szakértők is hozzá vannak rendelve egy olyan kompetenciaszinthez, amely megfelel mindegyiküknek a csoport véleményéhez való hozzájárulásának.

A szakértőkkel való együttműködés kidolgozott módszertana a Delphi módszer. Ennek a módszernek az a lényege, hogy a kritika és az érvelés jótékony hatással van a szakértőre, ha büszkeségét nem érinti, és olyan feltételeket biztosítanak, amelyek kizárják a személyes konfrontációt.

Külön hangsúlyozni kell, hogy alapvető különbség van a szakértői módszerek szakértői rendszerekben és a döntéstámogatásban való alkalmazásának jellegében. Ha az első esetben a szakértők kötelesek formalizálni a döntéshozatali módszereket, akkor a második esetben csak magát a döntést, mint olyat.

Mivel a szakemberek pontosan azon funkciók megvalósításában vesznek részt, amelyeket jelenleg vagy egyáltalán nem biztosítanak az automatizált rendszerek, vagy azokat rosszabbul látják el, mint az emberek, az automatizált rendszerek fejlesztésének ígéretes iránya ezen funkciók maximális automatizálása.

Automatizált döntéstámogató rendszerek

Az ember mindig is asszisztenseket használt a döntések meghozatalakor: ezek pusztán információszolgáltatók voltak a menedzsment tárgyáról, és tanácsadók (tanácsadók), akik döntési lehetőségeket kínáltak fel és elemezték azok következményeit. A döntéshozó mindig is egy bizonyos információs környezetben hozta meg azokat: a katonai vezetőnek a parancsnokság, a rektornak a tudományos tanács, a miniszternek a kollégium.

Napjainkban a döntéshozatal információs infrastruktúrája elképzelhetetlen a döntések interaktív értékelésére szolgáló automatizált rendszerek és különösen a döntéstámogató rendszerek (DDS - Decision Support Systems), azaz a döntéstámogató rendszerek nélkül. automatizált rendszerek, amelyeket kifejezetten arra terveztek, hogy előkészítsék azokat az információkat, amelyekre egy személynek szüksége van egy döntés meghozatalához. A döntéstámogató rendszerek fejlesztése különösen a laxenburgi (Ausztria) International Institute for Applied Systems Analysis égisze alatt megvalósuló nemzetközi projekt keretében valósul meg.

A valós élethelyzetekben történő döntéshozatalhoz számos műveletre van szükség, amelyek közül néhányat az emberek, másokat pedig a gépek hajtanak végre hatékonyabban. Előnyeik hatékony kombinációja és hiányosságaik kompenzálása az automatizált döntéstámogató rendszerekben testesül meg.

Az ember a bizonytalanság körülményei között jobban hoz döntéseket, mint egy gép, de a helyes döntéshez a témakört jellemző megfelelő (teljes és megbízható) információkra is szüksége van. Köztudott azonban, hogy az ember nem birkózik meg jól a nagy mennyiségű „nyers” feldolgozatlan információval. A döntéstámogató gép szerepe tehát az lehet, hogy előzetes információ-előkészítést végez a vezérlő objektumról és a nem kontrollálható tényezőkről (környezet), segít átlátni bizonyos döntések következményeit, és mindezt vizuálisan bemutatja. és kényelmes módja a döntéshozatalnak.

Így az automatizált döntéstámogató rendszerek kompenzálják az ember gyengeségeit, megszabadítva őt a rutin előzetes információfeldolgozástól, és kényelmes információs környezetet biztosítanak számára, amelyben jobban ki tudja mutatni erősségeit. Ezeknek a rendszereknek nem az a célja, hogy automatizálják a döntéshozó funkcióit (és ennek következtében elidegenítsék tőle ezeket a funkciókat, és ezáltal a meghozott döntésekért való felelősséget, ami gyakran általában elfogadhatatlan), hanem az, hogy segítséget nyújtsanak neki a jó megtalálásában. megoldás.

17. sz. előadás.MINTÁZÁSI MÓDSZEREK

A felismerési módszerek következő csoportjait különböztetjük meg:

Proximity Function Methods

Diszkrimináns függvénymódszerek

Statisztikai felismerési módszerek.

Nyelvi módszerek

Heurisztikus módszerek.

A módszerek első három csoportja a számokkal vagy vektorokkal kifejezett jellemzők numerikus összetevőkkel történő elemzésére összpontosít.

A nyelvészeti módszerek egy csoportja a mintafelismerést a megfelelő szerkezeti jellemzők és a köztük lévő kapcsolatok által leírt szerkezet elemzése alapján biztosítja.

A heurisztikus módszerek csoportja az emberek által a mintafelismerésben használt jellegzetes technikákat és logikai eljárásokat ötvözi.

Proximity Function Methods

Ennek a csoportnak a módszerei olyan függvények használatán alapulnak, amelyek megbecsülik a felismert kép és a vektor közelségét. x* = (x* 1 ,….,x*n), és különböző osztályok referenciaképei, amelyeket vektorok ábrázolnak x i = (x i 1 ,…, x i n), i= 1,…,N, Hol én – kép osztályszáma.

Az e módszer szerinti felismerési eljárás abból áll, hogy kiszámítjuk a felismert kép pontja és a referenciaképet reprezentáló egyes pontok közötti távolságot, pl. az összes érték kiszámításánál d i , i= 1,…,N. A kép egy osztályhoz tartozik, amelyhez az érték d i a legkisebb jelentősége van az összes közül i= 1,…,N .

Egy függvény, amely hozzárendeli az egyes vektorpárokat x i, x* valós szám, mint közelségük mértéke, azaz. a köztük lévő távolság meghatározása meglehetősen tetszőleges lehet. A matematikában egy ilyen függvényt a tér metrikájának neveznek. Meg kell felelnie a következő axiómáknak:

r(x,y)=r(y,x);

r(x,y) > 0, ha x nem egyenlő yÉs r(x,y)=0 ha x=y;

r(x,y) <=r(x,z)+r(z,y)

A felsorolt ​​axiómákat különösen a következő függvények teljesítik

a i= 1/2 , j=1,2,…n.

b i=összeg, j=1,2,…n.

c i=max abs ( x ix j *), j=1,2,…n.

Az elsőt a vektortér euklideszi normájának nevezik. Ennek megfelelően azokat a tereket, amelyekben a megadott függvényt metrikaként használjuk, euklideszi térnek nevezzük.

Gyakran a felismert kép koordinátáinak négyzetgyökér különbségét a közelség függvényében választják ki x*és szabványos x i, azaz funkció

d i = (1/n) összeg( x i jx j *) 2 , j=1,2,…n.

Nagyságrend d i geometriailag a jellemzőtérben lévő pontok közötti távolság négyzeteként értelmezve, a tér dimenziójához kapcsolódóan.

Gyakran kiderül, hogy a különböző tulajdonságok nem egyformán fontosak a felismerésben. Annak érdekében, hogy a közelségi függvények számításánál ezt a körülményt figyelembe vegyük, a fontosabb jellemzőknek megfelelő koordináta-különbségeket nagy együtthatókkal, a kevésbé fontosaknak pedig kisebbekkel szorozzuk.

Abban az esetben d i = (1/n) összege w j (x i jx j *) 2 , j=1,2,…n,

Ahol w j– súlyozási együtthatók.

A súlyozási együtthatók bevezetése egyenértékű a jellemzőtér tengelyeinek skálázásával, és ennek megfelelően a tér bizonyos irányú nyújtásával vagy összenyomásával.

A jellemzőtér jelzett deformációi azt a célt szolgálják, hogy a referenciaképek pontjait úgy helyezzék el, hogy az a legmegbízhatóbb felismerésnek feleljen meg az egyes osztályok képeinek jelentős szóródása esetén a referenciakép pontjának közelében. .

A jellemzőtérben egymáshoz közel álló képpontok csoportjait (képcsoportokat) klasztereknek, az ilyen csoportok azonosításának feladatát pedig klaszterezési problémának nevezzük.

A klaszterek azonosításának feladatát a nem felügyelt mintafelismerési feladatok közé soroljuk, i.e. felismerési problémákra a helyes felismerésre példa hiányában.

Diszkrimináns függvénymódszerek

E csoport módszereinek gondolata az, hogy olyan függvényeket hozzunk létre, amelyek határokat határoznak meg a képek terében, amelyek a teret a képosztályoknak megfelelő területekre osztják fel. A legegyszerűbb és leggyakrabban használt ilyen típusú függvények olyan függvények, amelyek lineárisan függenek a jellemzők értékétől. A jellemzőtérben elválasztó felületeknek felelnek meg hipersíkok formájában. Kétdimenziós jellemzőtér esetén az egyenes elválasztó függvényként működik.

A lineáris döntési függvény általános formáját a képlet adja meg

d(x)=w 1 x 1 + w 2 x 2 +…+w n x n +w n +1 = Wx+w n

Ahol x- kép vektor, w=(w 1 , w 2 ,…w n) – a súlyozási együtthatók vektora.

Két osztályra bontás esetén X 1 és X 2 diszkrimináns funkció d x) lehetővé teszi az elismerést a következő szabály szerint:

x tartozik X 1 ha d(x)>0;

x tartozik X 2 ha d(x)<0.

Ha d(x)=0, akkor bizonytalanságról van szó.

Több osztályra bontás esetén több függvény kerül bevezetésre. Ebben az esetben minden képosztályhoz a megkülönböztető funkciójelek bizonyos kombinációja van hozzárendelve.

Például, ha három megkülönböztető függvényt vezetünk be, akkor a következő lehetőség lehetséges a képosztályok azonosítására:

x tartozik X 1 ha d 1 (x)>0,d 2 (x)<0,d 3 (x)<0;

x tartozik X 2 ha d(x)<0,d 2 (x)>0,d 3 (x)<0;

x tartozik X 3 ha d(x)<0,d 2 (x)<0,d 3 (x)>0.

Feltételezzük, hogy más értékkombinációk esetén d 1 (x),d 2 (x),d 3 (x) bizonytalanság áll fenn.

A diszkrimináns függvény módszer egy változata a döntési függvény módszer. Abban, ha elérhető m osztályok létezését feltételezik m funkciókat d i(x), döntőnek nevezett, így ha x tartozik X i, Azt d i(x) > d j(x) mindenkinek j egyenlőtlen én,azok. döntő funkciója d i(x) az összes függvény közül a legnagyobb értékkel rendelkezik d j(x), j=1,...,n..

Ennek a módszernek az illusztrációja lehet egy olyan osztályozó, amely a képpont és a szabvány közötti jellemzőtér minimális euklideszi távolságának becslésén alapul. Mutassuk meg.

A felismert kép jellemzővektora közötti euklideszi távolság x a referenciakép vektorát pedig a || képlet határozza meg x ix|| = 1/2 , j=1,2,…n.

Vektor x osztályhoz lesz rendelve én, amelynek értéke || x ix*|| minimális.

Távolság helyett összehasonlíthatja a távolság négyzetét, pl.

||x ix|| 2 = (x ix)(x ix) t = x x- 2x x i +x i x i

Mivel az érték x x mindenkinek ugyanaz én, minimális függvény || x ix|| 2 egybeesik a döntési függvény maximumával

d i(x) = 2x x i -x i x i.

vagyis x tartozik X i, Ha d i(x) > d j(x) mindenkinek j egyenlőtlen én.

Hogy. a minimális távolság osztályozó gép lineáris döntési függvényeken alapul. Egy ilyen gép általános felépítése az űrlap meghatározó funkcióit használja

d i (x)=w i 1 x 1 + w i 2 x 2 +…+w x n-ben +w i n +1

Vizuálisan a megfelelő blokkdiagrammal ábrázolható.

Azon gépeknél, amelyek a minimális távolság alapján végzik az osztályozást, a következő egyenlőségek érvényesek: w ij = -2x i j , w i n +1 = x i x i.

A diszkrimináns függvény módszerrel történő ekvivalens felismerés a diszkrimináns függvények különbségként történő meghatározásával valósítható meg d ij (x)=d i (x)‑d j (x).

A diszkriminanciafüggvény módszer előnye a felismerő gép egyszerű felépítése, valamint a túlnyomórészt lineáris döntési blokkon keresztül történő megvalósításának lehetősége.

A diszkrimináns függvény módszer másik fontos előnye, hogy egy adott (tanítási) képminta alapján automatikusan betaníthatja a gépet a helyes felismerésre.

Ugyanakkor az automatikus tanulási algoritmus nagyon egyszerűnek bizonyul más felismerési módszerekkel összehasonlítva.

Ezen okok miatt a diszkrimináns függvény módszer széles körű népszerűségre tett szert, és nagyon gyakran használják a gyakorlatban.

Önképző eljárások mintafelismeréshez

Tekintsünk módszereket egy adott (képzési) minta diszkriminanciafüggvény megalkotására a képek két osztályra osztásának problémájával kapcsolatban. Ha két képhalmazt adunk meg, amelyek rendre az A és B osztályba tartoznak, akkor a lineáris diszkriminancia függvény felépítésének problémájára a súlyozási együtthatók vektora formájában keressük a megoldást. W=(w 1 ,w 2 ,...,w n,w n+1), amelynek az a tulajdonsága, hogy bármely kép esetében teljesülnek a következő feltételek:

x az A osztályba tartozik, ha >0, j=1,2,…n.

x B osztályba tartozik, ha<0, j=1,2,…n.

Ha az edzéskészlet abból áll N mindkét osztály képei, a feladat egy olyan w vektor megtalálására redukálódik, amely biztosítja az egyenlőtlenségek rendszerének érvényességét Ha a képzési minta abból áll N mindkét osztály képét, a feladat a vektor megtalálásában rejlik w, biztosítva az egyenlőtlenségek rendszerének érvényességét

x 1 1 w i+x 21 w 2 +...+x n 1 w n+w n +1 >0;

x 1 2 w i+x 22 w 2 +...+x n 2 w n+w n +1 <0;

x 1 énw i+x 2én w 2 +...+x ni w n+w n +1 >0;

................................................

x 1 Nw i +x 2N w 2 +...+x nN w n +w n + 1>0;

Itt x i=(x i 1 ,x i 2 ,...,x i n ,x i n+ 1 ) - képjellemző értékek vektora a képzési mintából, a jel > képvektoroknak felel meg x, az A osztályba tartozó, és a jel< - векторам x, a B osztályba tartozó.

Szükséges vektor w létezik, ha az A és B osztály elválasztható, és egyébként nem létezik. Vektor komponens értékek w megtalálható vagy előre, az SRO hardveres megvalósítását megelőző szakaszban, vagy közvetlenül maga az SRO működése során. Az utolsó ilyen megközelítés nagyobb rugalmasságot és autonómiát biztosít az SRO számára. Tekintsük ezt egy százalékron nevű eszköz példáján. Rosenblatt amerikai tudós találta fel 1957-ben. Sematikus ábrázolás A százalékron, amely biztosítja, hogy egy kép két osztály egyikéhez legyen hozzárendelve, a következő ábrán látható.

Retina S Retina A Retina R

oh oh x 1

oh oh x 2

oh oh x 3

o (összeg)-------> R(reakció)

oh oh x i

oh oh x n

oh oh x n +1

A készülék retina szenzoros elemekből áll S, amelyek véletlenszerűen kapcsolódnak a retina asszociatív elemeihez A. A második retina minden eleme csak akkor ad kimenő jelet, ha elegendő számú, a bemenetére kapcsolt szenzoros elem gerjesztett állapotban van. Az egész rendszer válasza R arányos az asszociatív retina elemeinek bizonyos súlyokkal vett reakcióinak összegével.

által kijelölt x i reakció én th asszociatív elem és azon keresztül w i- reakciósúly-együttható én asszociatív elem, a rendszerreakció így írható fel R=sum( w j x j), j=1,..,n. Ha R>0, akkor a rendszernek bemutatott kép az A osztályba tartozik, és ha R<0, то образ относится к классу B. Описание этой процедуры классификации соответствует рассмотренным нами раньше принципам классификации, и, очевидно, перцентронная модель распознавания образов представляет собой, за исключением сенсорной сетчатки, реализацию линейной дискриминантной функции. Принятый в перцентроне принцип формирования значений x 1 , x 2 ,...,x n megfelel bizonyos algoritmusoknak, amelyek az elsődleges érzékelőktől érkező jelek alapján szolgáltatásokat generálnak.

Általában több elem is lehet R, kialakítva a perceptron reakciót. Ebben az esetben retina jelenlétéről beszélnek a perceptronban R reagáló elemek.

A százalékos séma kiterjeszthető arra az esetre is, ha az osztályok száma kettőnél több, a retinaelemek számának növelésével R a megkülönböztethető osztályok számáig és a maximális reakció meghatározására szolgáló blokk bevezetése a fenti ábrán bemutatott diagramnak megfelelően. Ebben az esetben a kép a számmal rendelkező osztályhoz van rendelve én, Ha R i>R j, mindenkinek j.

A százalékon edzési folyamat a súlyozási együtthatók értékeinek kiválasztásából áll w j hogy a kimeneti jel megfeleljen annak az osztálynak, amelybe a felismert kép tartozik.

Tekintsük a percentron műveleti algoritmust két osztályba tartozó objektumok felismerésének példájával: A és B. Az A osztályba tartozó objektumoknak meg kell felelniük az értéknek. R= +1, és B osztály - az érték R= -1.

A tanulási algoritmus a következő.

Ha a következő kép x az A osztályba tartozik, de R<0 (имеет место ошибка распознавания), тогда коэффициенты w j indexekkel, amelyeknek az értékek megfelelnek x j>0, növelje bizonyos összeggel dw, és a fennmaradó együtthatók w jáltal csökkentett dw. Ebben az esetben a reakció értéke R növekményt kap felé pozitív értékeket, amely megfelel a helyes besorolásnak.

Ha x a B osztályba tartozik, de R>0 (felismerési hiba van), akkor az együtthatók w j megfelelő indexekkel x j<0, увеличивают на dw, és a fennmaradó együtthatók w j ugyanennyivel csökkentve. Ebben az esetben a reakció értéke R növekményt kap a helyes besorolásnak megfelelő negatív értékek felé.

Az algoritmus így megváltoztatja a súlyok vektorát w akkor és csak akkor, ha a képen bemutatott k-edik edzési lépés, hibásan lett besorolva ennek a lépésnek a végrehajtásakor, és elhagyja a súlyok vektorát w helyes besorolás esetén nincs változás. Ennek az algoritmusnak a konvergenciájának bizonyítékát [Tu, Gonzalez] mutatja be. Az ilyen képzés végül (megfelelő kiválasztással dwés a képosztályok lineáris elválaszthatósága) a vektorhoz vezet w, biztosítva a helyes besorolást.

Statisztikai felismerési módszerek.

A statisztikai módszerek az osztályozási hiba valószínűségének minimalizálásán alapulnak. A felismerésre benyújtott kép helytelen besorolásának P valószínűsége, amelyet egy jellemzővektor ír le x, a képlet határozza meg

P = összeg[ p(én)prob( D(x)+én | x osztály én)]

Ahol m- osztályok száma,

p(én) = szonda ( x osztályhoz tartozik én) - egy tetszőleges képhez való tartozás a priori valószínűsége x To én osztály (a képek megjelenési gyakorisága én- osztály),

D(x) - osztályozási döntést hozó függvény (jellemzők vektora x megfelel az osztályszámnak én a készletből (1,2,..., m}),

prob( D(x) nem egyenlő én| x osztályhoz tartozik én) - esemény valószínűsége " D(x) nem egyenlő én", ha a tagsági feltétel teljesül x osztály én, azaz annak valószínűsége, hogy a függvény hibás döntést hoz D(x) adott értékhez x, tulajdonában én- osztály.

Kimutatható, hogy a téves besorolás valószínűsége eléri a minimumot, ha D(x)=én akkor és csak akkor p(x|énp(én)>p(x|jp(j), mindenkinek i+j, Hol p(x|i) - képeloszlási sűrűség én-osztály a funkciótérben.

A fenti szabály szerint a pont x abba az osztályba tartozik, amelynek a maximális érték megfelel p(én) p(x|i), azaz a képek megjelenésének előzetes valószínűségének (gyakoriságának) szorzata én-osztály és képeloszlás sűrűsége én-osztály a funkciótérben. A bemutatott osztályozási szabályt Bayesi-nek nevezzük, mert a valószínűségszámításban ismert Bayes-képletből következik.

Példa. Legyen szükséges a diszkrét jelek felismerése egy zajnak kitett információs csatorna kimenetén.

Minden bemeneti jel értéke 0 vagy 1. A jelátvitel eredményeként az érték a csatorna kimenetén jelenik meg x, amelyre rákerül a Gauss-zaj nulla átlaggal és szórással b.

Jelfelismerést végző osztályozó szintetizálásához a Bayes-féle osztályozási szabályt fogjuk használni.

Az egyeseket képviselő jeleket az 1. osztályba, a nullákat jelentő jeleket a 2. osztályba fogjuk egyesíteni. Legyen előre tudatva, hogy átlagosan minden 1000 jelből a a jelek egységeket és b jelek - nulla. Ekkor az 1. és 2. osztályú (egyesek és nullák) jelek megjelenésének a priori valószínűségeinek értékeit egyenlőnek vehetjük

p(1)=a/1000, p(2)=b/1000.

Mert a zaj Gauss-féle, azaz. engedelmeskedik a normál (Gauss) eloszlási törvénynek, majd az első osztályú képek eloszlási sűrűsége az értéktől függően x, vagy ami ugyanaz, a kimeneti érték megszerzésének valószínűsége x amikor a bemeneten 1 jelet adunk, akkor azt a kifejezés határozza meg

p(x¦1) =(2pib) -1/2 exp(-( x-1) 2 /(2b 2)),

és az értéktől függő eloszlási sűrűséget x másodosztályú képek, i.e. a kimeneti érték megszerzésének valószínűsége x ha 0 jelet adunk a bemeneten, akkor azt a kifejezés határozza meg

p(x¦2)= (2pib) -1/2 exp(- x 2 /(2b 2)),

A Bayes-féle döntési szabály alkalmazása azt a következtetést vonja le, hogy 2. osztályú jelet továbbítottak, azaz. null passzol, ha

p(2) p(x¦2) > p(1) p(x¦1)

vagy pontosabban ha

b exp(- x 2 /(2b 2)) > a exp(-( x-1) 2 /(2b 2)),

Osztással bal oldalt egyenlőtlenség a jobb oldalon, kapjuk

(b/a) exp((1-2 x)/(2b 2)) >1,

ahol a logaritmusok felvétele után azt találjuk

1-2x> 2b 2 ln(a/b)

x< 0.5 - б 2 ln(a/b)

A keletkező egyenlőtlenségből az következik, hogy mikor a=b, azaz a 0 és 1 jelek azonos a priori előfordulási valószínűsége mellett a kép 0 értéket kap, ha x<0.5, а значение 1, когда x>0.5.

Ha előre ismert, hogy az egyik jelzés gyakrabban, a másik ritkábban jelenik meg, pl. egyenlőtlen értékek esetén aÉs b, az osztályozó válaszküszöbe egyik vagy másik irányba eltolódik.

Szóval mikor a/b=2,71 (ami 2,71-szer gyakoribb mértékegység-átvitelnek felel meg) és b 2 =0,1, a kép 0 értéket kap, ha x<0.4, и значение 1, если x>0.4. Ha nincs információ a korábbi eloszlási valószínűségekről, akkor statisztikai felismerési módszerek használhatók, amelyek a Bayes-től eltérő osztályozási szabályokon alapulnak.

A gyakorlatban azonban a Bayes-szabályokon alapuló módszerek a legelterjedtebbek nagyobb hatékonyságuk miatt, valamint azért is, mert a legtöbb mintafelismerési problémában lehetőség van az egyes osztályok képeinek megjelenési valószínűségének előzetes beállítására. .

A mintafelismerés nyelvi módszerei.

A mintafelismerés nyelvi módszerei egy idealizált kép leírásának elemzésén alapulnak, amely grafikon vagy karakterlánc formájában jelenik meg, amely egy bizonyos nyelv kifejezése vagy mondata.

Tekintsük a fent leírt nyelvi felismerés első szakaszának eredményeként kapott idealizált betűképeket. Ezeket az idealizált képeket grafikonok leírásával lehet megadni, például kapcsolódási mátrixok formájában, amint az a fent tárgyalt példában megtörtént. Ugyanez a leírás reprezentálható egy formális nyelv (kifejezés) kifejezésével.

Példa. Legyen megadva az A betű három képe, amelyeket előzetes képfeldolgozás eredményeként kaptunk. Jelöljük ezeket a képeket A1, A2 és A3 azonosítókkal.

A bemutatott képek nyelvi leírásához a PDL-t (Picture Description Language) fogjuk használni. A PDL szókincs a következő szimbólumokat tartalmazza:

1. A legegyszerűbb képek (primitívek) neve. A vizsgált esetre vonatkoztatva a primitívek és a hozzájuk tartozó nevek a következők.

Képek irányított vonal formájában:

fel és balra (le F t), észak (észak), fel és jobbra (jobbra), kelet).

Nevek: L, N, R, E.

2. Bináris műveletek szimbólumai. (+,*,-) Jelentésük megfelel a primitívek szekvenciális kapcsolatának (+), a primitívek kezdetének és végének kapcsolatának (*), csak a primitívek végződéseinek kapcsolatának (-).

3. Jobb és bal zárójelek. ((,)) A zárójelek segítségével meghatározhatja a műveletek sorrendjét egy kifejezésben.

A vizsgált A1, A2 és A3 képeket PDL nyelven írjuk le a következő kifejezésekkel.

T(1)=R+((R-(L+N))*E-L

T(2)=(R+N)+((N+R)-L)*E-L

T(3)=(N+R)+(R-L)*E-(L+N)

A kép nyelvi leírásának megalkotása után valamilyen felismerési eljárással elemezni kell, hogy hozzátartozik-e vagy sem. ezt a képet a számunkra érdekes osztályba (A betűk osztálya), azaz. Függetlenül attól, hogy ennek a képnek van-e valamilyen szerkezete. Ehhez mindenekelőtt le kell írni azoknak a képeknek az osztályát, amelyek a minket érdeklő szerkezettel rendelkeznek.

Nyilvánvaló, hogy az A betű mindig a következőket tartalmazza szerkezeti elemek: bal „láb”, jobb „láb” és fejrész. Nevezzük ezeket az elemeket STL-nek, STR-nek, TR-nek.

Ekkor a PDL nyelvben az A - SIMB A karakterosztályt a kifejezés írja le

SIMB A = STL + TR - STR

Az STL bal "lába" mindig R és N elemek láncolata, amely így írható

STL -> R ¦ N ¦ (STL + R)¦ (STL + N)

(Az STL az R vagy N karakter, vagy egy karakterlánc, amelyet az R vagy N karakterek forrás STL karakterláncához adásával kapunk)

Az STR jobb „lábja” mindig L és N elemek láncolata, amely így is felírható, ti.

STR -> L¦N¦ (STR + L)¦(STR + N)

A TR betű fejrésze egy zárt kontúr, amely E elemből és olyan láncokból áll, mint az STL és STR.

A PDL-ben a TR szerkezetét a kifejezés írja le

TR -> (STL - STR) * E

Végül a következő leírást kapjuk az A betűosztályról:

SIMB A -> (STL + TR - STR),

STL -> R¦N¦ (STL + R)¦ (STL + N)

STR -> L¦N¦ (STR + L)¦(STR + N)

TR -> (STL - STR) * E

Az elismerési eljárás ebben az esetben a következőképpen hajtható végre.

1. A képnek megfelelő kifejezést összehasonlítjuk az STL + TR - STR referenciastruktúrával.

2. Az STL, TR, STR szerkezet egyes elemei, ha lehetséges, i.e. ha a képleírás összehasonlítható a standarddal, akkor a T(A) kifejezés néhány részkifejezése illeszkedik. Például,

A1 esetén: STL=R, STR=L, TR=(R-(L+N))*E

A2 esetén: STL = R + N, STR = L, TR = ((N + R) - L) * E

A3 esetén: STL = N + R, STR = L + N, TR = (R - L) * E 3.

Az STL, STR, TR kifejezéseket összehasonlítjuk a megfelelő referenciastruktúrákkal.

4. Ha az egyes STL, STR, TR kifejezések szerkezete megfelel a standardnak, akkor azt a következtetést vonjuk le, hogy a kép az A betűosztályba tartozik. elemzett kifejezést és a szabványt detektálják, arra a következtetésre jutottak, hogy a kép nem tartozik a SIMB A osztályba. A kifejezési struktúrák összehasonlítása elvégezhető a LISP, PLANER, PROLOG és más hasonló mesterséges intelligencia nyelvek algoritmikus nyelveivel.

A vizsgált példában az összes STL lánc N és R szimbólumokból, az STR láncok pedig L és N szimbólumokból állnak, ami megfelel e láncok adott szerkezetének. A vizsgált képeken a TR szerkezete is megfelel a referencianak, hiszen az olyan láncok „különbségéből” áll, mint az STL, STR, „megszorozva” az E szimbólummal.

Így arra a következtetésre jutunk, hogy a vizsgált képek az osztályba tartoznak SIMB A.


Egy fuzzy vezérlő szintézise egy egyenáramú elektromos hajtáshoza MatLab környezetben

Egy fuzzy vezérlő szintézise egy bemenettel és kimenettel.

A kihívás abban rejlik, hogy a hajtás pontosan kövesse a különböző bemeneti jeleket. A vezérlési művelet fejlesztését egy fuzzy vezérlő végzi, amelyben szerkezetileg a következő funkcionális blokkok különböztethetők meg: fuzzifikátor, szabályblokk és defuzzifikátor.

4. ábra Két nyelvi változót tartalmazó rendszer általánosított funkcionális diagramja.

5. ábra Sematikus diagram fuzzy vezérlő két nyelvi változóval.

A fuzzy vezérlési algoritmus általános esetben egy fuzzy vezérlő bemeneti változóinak átalakítása kimeneti változóivá a következő, egymással összefüggő eljárások segítségével:

1. a mérőérzékelőktől kapott bemeneti fizikai változók átalakítása a vezérlőobjektumtól egy fuzzy vezérlő bemeneti nyelvi változóivá;

2. a vezérlő bemeneti és kimeneti nyelvi változóira vonatkozó logikai utasítások, úgynevezett nyelvi szabályok feldolgozása;

3. a fuzzy vezérlő kimeneti nyelvi változóinak átalakítása fizikai vezérlőváltozókká.

Nézzük először a legegyszerűbb esetet, amikor csak két nyelvi változót vezetünk be a szervohajtás vezérlésére:

„angle” egy bemeneti változó;

„vezérlési művelet” a kimeneti változó.

A vezérlőt a MatLab környezetben a Fuzzy Logic eszköztár segítségével szintetizáljuk. Lehetővé teszi fuzzy következtetések és fuzzy osztályozási rendszerek létrehozását a MatLab környezetben, és integrálhatja ezeket a Simulinkbe. A Fuzzy Logic Toolbox alapkoncepciója a FIS struktúra - Fuzzy Inference System. A FIS struktúra tartalmazza az összes szükséges adatot a fuzzy logikai következtetésen alapuló „bemenetek-kimenetek” funkcionális leképezéséhez az ábrán látható diagram szerint. 6.


6. ábra Fuzzy következtetés.

X - bemeneti éles vektor; - az X bemeneti vektornak megfelelő fuzzy halmazok vektora;
- a logikai következtetés eredménye fuzzy halmazok vektora formájában - a kimeneti tiszta vektor.

A fuzzy modul lehetővé teszi, hogy kétféle fuzzy rendszert építsen - Mamdani és Sugeno. Az olyan rendszerekben, mint a Mamdani, a tudásbázis a forma szabályaiból áll "Ha x 1 = alacsony és x 2 = közepes, akkor y = magas". A Sugeno típusú rendszerekben a tudásbázis a forma szabályaiból áll "Ha x 1 = alacsony és x 2 = közepes, akkor y = a 0 +a 1 x 1 +a 2 x 2 ". Így a Mamdani és a Sugeno rendszerek közötti fő különbség abban rejlik, hogy a tudásbázist alkotó szabályokban a kimeneti változó értékeit különböző módon határozzák meg. A Mamdani típusú rendszerekben a kimeneti változó értékei fuzzy kifejezésekkel vannak megadva, a Sugeno típusú rendszerekben - a bemeneti változók lineáris kombinációjaként. Esetünkben a Sugeno rendszert fogjuk használni, mert jobban alkalmas az optimalizálásra.

A szervohajtás vezérléséhez két nyelvi változó kerül bevezetésre: „hiba” (pozíció szerint) és „vezérlési művelet”. Közülük az első a bemenet, a második a kimenet. Határozzuk meg a megadott változókhoz egy kifejezéskészletet.

A fuzzy logikai következtetés alapvető összetevői. Fuzzifier.

Minden nyelvi változóhoz meghatározzuk az űrlap egy alapfogalomhalmazát, amelybe fuzzy halmazok tartoznak, amelyek kijelölhetők: negatív magas, negatív alacsony, nulla, pozitív alacsony, pozitív magas.

Mindenekelőtt határozzuk meg szubjektív módon, hogy mit értsünk a „nagy hiba”, „kis hiba” stb. fogalma alatt, meghatározva a megfelelő fuzzy halmazokhoz tartozó tagsági függvényeket. Itt egyelőre csak a szükséges pontosság, a bemeneti jelek osztályára ismert paraméterek, ill. józan ész. Még senki sem tudott szigorú algoritmust javasolni a tagsági függvények paramétereinek kiválasztására. Esetünkben az „error” nyelvi változó így fog kinézni.

7. ábra. Nyelvi változó "hiba".

Kényelmesebb a „control” nyelvi változót táblázat formájában bemutatni:

1. táblázat

Szabályblokk.

Tekintsük a néhány helyzetet leíró szabály meghatározásának sorrendjét:

Tegyük fel például, hogy a kimeneti szög egyenlő a bemeneti jellel (azaz a hiba nulla). Nyilvánvalóan ez a kívánt helyzet, ezért nem kell tennünk semmit (az irányítási művelet nulla).

Most vegyünk egy másik esetet: a pozícióhiba sokkal nagyobb, mint nulla. Természetesen ezt kompenzálni kell egy nagy pozitív vezérlőjel generálásával.

Hogy. két szabályt dolgoztak ki, amelyek formálisan az alábbiak szerint határozhatók meg:

Ha hiba = null, Hogy vezérlőművelet = nulla.

Ha hiba = nagy pozitív, Hogy kontroll befolyás = nagy pozitív.

8. ábra. Vezérlés kialakulása kis pozitív pozícióhibával.

9. ábra. Vezérlés kialakítása nulla pozíció hibával.

Az alábbi táblázat bemutatja az összes szabályt, amelyek minden helyzetnek megfelelnek ebben az egyszerű esetben.

2. táblázat

Összességében egy fuzzy vezérlőhöz n bemenettel és 1 kimenettel definiálhatók vezérlési szabályok, ahol az i-edik bemenethez tartozó fuzzy halmazok száma, de a vezérlő normál működéséhez nem szükséges az összes lehetséges szabályokat, de meg lehet boldogulni kevesebbel is. Esetünkben mind az 5 lehetséges szabályt felhasználjuk egy fuzzy vezérlőjel generálására.

Defuzzifier.

Így a keletkező U hatást valamilyen szabály teljesülése szerint határozzuk meg. Ha olyan helyzet áll elő, amikor több szabályt egyszerre hajtanak végre, akkor a kapott U hatást a következő összefüggés szerint találjuk:

, ahol n a kiváltott szabályok száma (defuzzifikáció a régióközpont módszerével), u n– az egyes fuzzy halmazoknak megfelelő vezérlőjel fizikai értéke UBO, UMo, UZ, UMp, UBP. mUn(u)– az u vezérlőjel hovatartozási foka a megfelelő fuzzy halmazhoz Un=( UBO, UMo, UZ, UMp, UBP). Vannak más defuzzifikációs módszerek is, ahol a kimeneti nyelvi változó arányos a „legerősebb” vagy „leggyengébb” szabállyal.

Modellezzük az elektromos hajtás vezérlésének folyamatát a fent leírt fuzzy vezérlő segítségével.

10. ábra. Blokkdiagram rendszerek a környezetbenMatlab.

11. ábra. Egy fuzzy vezérlő blokkdiagramja környezetbenMatlab.

12. ábra. Átmeneti folyamat egyetlen lépésben.

Rizs. 13. Tranziens folyamat harmonikus bemeneti művelet alatt egy bemeneti nyelvi változót tartalmazó fuzzy vezérlővel rendelkező modellhez.

A hajtás jellemzőinek szintetizált vezérlési algoritmussal történő elemzése azt mutatja, hogy messze nem optimálisak és rosszabbak, mint más módszerekkel történő vezérlés szintetizálása esetén (a vezérlési idő túl hosszú egy lépéses művelethez, és a hiba harmonikus). Ez azzal magyarázható, hogy a tagsági függvények paramétereit meglehetősen önkényesen választották meg, és csak a pozícióhiba értéket használtuk vezérlő bemenetként. Természetesen szó sem lehet a keletkező szabályozó optimálisságáról. Ezért a fuzzy vezérlő optimalizálásának feladata válik aktuálissá a lehető legmagasabb szabályozási minőségi mutatók elérése érdekében. Azok. A feladat az f(a 1 ,a 2 …a n) célfüggvény optimalizálása, ahol a 1 ,a 2 …a n a fuzzy vezérlő típusát és jellemzőit meghatározó együtthatók. A fuzzy vezérlő optimalizálásához a Matlab környezet ANFIS blokkját fogjuk használni. A vezérlő jellemzőinek javításának egyik módja lehet a bemenetek számának növelése. Ez rugalmasabbá teszi a szabályozót és javítja a teljesítményét. Adjunk hozzá még egy bemeneti nyelvi változót - a bemeneti jel (a származéka) változási sebességét. A szabályok száma ennek megfelelően növekedni fog. Ezután a szabályozó kapcsolási rajza a következő formában lesz:

14. ábra Egy fuzzy vezérlő sematikus diagramja három nyelvi változóval.

Legyen a bemeneti jel sebességének értéke. A Tn alapfogalomkészletet a következőképpen definiáljuk:

Tn=("negatív (BO)", "nulla (Z)", "pozitív (BP)").

A tagsági függvények elhelyezkedése minden nyelvi változó esetén az ábrán látható.

15. ábra. Az „error” nyelvi változó tagsági függvényei.

16. ábra. A „bemeneti jel sebessége” nyelvi változó tagsági függvényei.

Egy további nyelvi változó hozzáadásával a szabályok száma 3x5=15-re nő. Összeállításuk elve teljesen hasonló a fentebb tárgyalthoz. Mindegyiket az alábbi táblázat mutatja:

3. táblázat

Fuzzy jel

menedzsment

Pozíció hiba

Sebesség

Például ha Ha hiba = nulla és a bemeneti jel deriváltja = nagy pozitív, Hogy kontroll befolyás = kis negatív.

17. ábra. A kontroll kialakítása három nyelvi változó alatt.

A bemenetek számának és ennek megfelelően maguknak a szabályoknak a növekedése miatt a fuzzy vezérlő szerkezete bonyolultabbá válik.

18. ábra. Két bemenettel rendelkező fuzzy vezérlő blokkvázlata.

Kép hozzáadása

20. ábra. Tranziens folyamat harmonikus bemeneti művelet alatt két bemeneti nyelvi változót tartalmazó fuzzy vezérlővel rendelkező modellnél.

Rizs. 21. Hibajel harmonikus bemenet alatt két bemeneti nyelvi változót tartalmazó fuzzy vezérlővel rendelkező modellnél.

Szimuláljunk egy fuzzy vezérlő működését két bemenettel a Matlab környezetben. A modell blokkdiagramja pontosan ugyanaz lesz, mint az ábrán. 19. A harmonikus bemeneti művelet tranziens folyamatának grafikonjából látható, hogy a rendszer pontossága jelentősen megnőtt, ugyanakkor az oszcillációja nőtt, különösen azokon a helyeken, ahol a kimeneti koordináta deriváltja hajlik. nullára. Nyilvánvalóan ennek oka, ahogy fentebb említettük, a tagsági függvény paramétereinek szuboptimális megválasztása mind a bemeneti, mind a kimeneti nyelvi változók esetében. Ezért a fuzzy vezérlőt az ANFISedit blokk segítségével optimalizáljuk a Matlab környezetben.

Egy fuzzy vezérlő optimalizálása.

Tekintsük a genetikai algoritmusok használatát egy fuzzy vezérlő optimalizálására. A genetikai algoritmusok adaptív keresési módszerek, amelyeket a közelmúltban gyakran használnak funkcionális optimalizálási problémák megoldására. A genetikai folyamatokhoz való hasonlóságon alapulnak biológiai szervezetek: a biológiai populációk több generáció alatt fejlődnek ki, a természetes szelekció törvényeinek engedelmeskedve és a Charles Darwin által felfedezett „a legalkalmasabbak túlélése” elve szerint. Ezt a folyamatot utánozva a genetikai algoritmusok képesek „megoldásokat fejleszteni” valós problémákra, ha azokat megfelelően kódolják.

A genetikai algoritmusok „egyedek” gyűjteményével dolgoznak – egy populációval, amelyek mindegyike képviseli lehetséges megoldás ezt a problémát. Minden egyént „alkalmazkodóképességének” mértékével értékelnek aszerint, hogy mennyire „jó” a neki megfelelő probléma megoldása. A legrátermettebb egyedek a populáció más egyedeivel „keresztezve” képesek utódokat „szaporítani”. Ez új egyének megjelenéséhez vezet, akik egyesítik a szüleiktől örökölt tulajdonságok egy részét. A legkevésbé alkalmas egyedek kisebb valószínűséggel szaporodnak, így bármilyen tulajdonságuk is volt, fokozatosan eltűnik a populációból.

Így reprodukálódik, választva a megvalósítható megoldások teljes új sokasága legjobb képviselői az előző generációt, keresztezve őket és sok új egyedet szerezve. Ez az új generáció nagyobb arányban tartalmazza azokat a tulajdonságokat, amelyekkel az előző generáció jó tagjai rendelkeztek. Így nemzedékről nemzedékre a jó tulajdonságok elterjedtek az egész populációban. Végső soron a lakosság a probléma optimális megoldásához fog konvergálni.

Számos módja van a biológiai evolúció gondolatának megvalósítására a genetikai algoritmusok keretein belül. Hagyományos, a 22. ábrán látható következő blokkdiagramként ábrázolható, ahol:

1. A kezdeti sokaság inicializálása – a probléma adott számú megoldásának generálása, amellyel az optimalizálási folyamat megkezdődik;

2. Crossover és mutációs operátorok alkalmazása;

3. Leállítási feltételek - általában az optimalizálás folyamata addig folytatódik, amíg a problémára adott pontosságú megoldást nem találnak, vagy amíg meg nem állapítják, hogy a folyamat konvergál (azaz a probléma megoldása nem javult az elmúlt N generáció során).

A Matlab környezetben a genetikai algoritmusokat külön eszköztár, valamint az ANFIS csomag képviseli. Az ANFIS az Adaptive-Network-Based Fuzzy Inference System – adaptív fuzzy következtetési hálózat – rövidítése. Az ANFIS a hibrid neuro-fuzzy hálózatok egyik első változata – egy speciális típusú előrecsatolt neurális hálózat. A neuro-fuzzy hálózat architektúrája izomorf egy fuzzy tudásbázishoz. A neurofuzzy hálózatok a háromszög normák differenciálható megvalósításait (szorzás és valószínűségi VAGY), valamint sima tagsági függvényeket használnak. Ez lehetővé teszi, hogy gyors és genetikai algoritmusokat használjon a neurális hálózatok betanításához a neuro-fuzzy hálózatok felállításának visszaterjesztési módszerén alapulóan. Az alábbiakban ismertetjük az ANFIS hálózat egyes rétegeinek architektúráját és működési szabályait.

Az ANFIS a Sugeno fuzzy következtetési rendszert ötrétegű előrecsatolt neurális hálózatként valósítja meg. A rétegek célja a következő: az első réteg a bemeneti változók feltételei; a második réteg - a fuzzy szabályok előzményei (feltételei); a harmadik réteg a szabályoknak való megfelelési fokozatok normalizálása; a negyedik réteg a szabályok megkötése; az ötödik réteg a különböző szabályok szerint kapott eredmény összesítése.

A hálózati bemenetek nincsenek külön réteghez hozzárendelve. A 23. ábra egy ANFIS hálózatot mutat be egy bemeneti változóval („hiba”) és öt fuzzy szabállyal. Az „error” bemeneti változó nyelvi kiértékeléséhez 5 kifejezést használnak.


23. ábra. SzerkezetANFIS- hálózatok

Vezessük be a további bemutatáshoz szükséges jelöléseket:

Legyen a hálózati bemenetek;

y - hálózati kimenet;

Fuzzy szabály r sorszámmal;

m - szabályok száma;

Egy fuzzy tag tagsági függvénnyel, amelyet az r-edik szabály változójának nyelvi kiértékelésére használnak (,);

Valós számok az r-edik szabály (,) végén.

Az ANFIS hálózat a következőképpen működik.

1. réteg. Az első réteg minden csomópontja egy harang alakú tagsági függvénnyel rendelkező kifejezést képvisel. A hálózati bemenetek csak a feltételekhez kapcsolódnak. Az első réteg csomópontjainak száma megegyezik a bemeneti változók termhalmazai kardinalitásainak összegével. A csomópont kimenete az, hogy a bemeneti változó értéke milyen mértékben tartozik a megfelelő fuzzy taghoz:

,

ahol a, b és c a tagsági függvény konfigurálható paraméterei.

2. réteg. A második réteg csomópontjainak száma m. Ebben a rétegben minden csomópont egy fuzzy szabálynak felel meg. A második réteg csomópontja az első réteg azon csomópontjaihoz kapcsolódik, amelyek a megfelelő szabály előzményeit alkotják. Ezért a második réteg minden csomópontja 1–n bemeneti jelet tud fogadni. A csomópont kimenete a szabályteljesítés mértéke, amely a bemeneti jelek szorzataként kerül kiszámításra. Jelöljük e réteg csomópontjainak kimeneteit , -vel.

3. réteg. A harmadik réteg csomópontjainak száma is m. Ennek a rétegnek minden csomópontja kiszámítja a fuzzy szabály relatív teljesülési fokát:

4. réteg. A negyedik réteg csomópontjainak száma is m. Minden csomópont a harmadik réteg egy csomópontjához, valamint az összes hálózati bemenethez csatlakozik (a bemenetekkel való kapcsolatok a 18. ábrán nem láthatók). A negyedik réteg csomópontja kiszámítja egy fuzzy szabály hozzájárulását a hálózati kimenethez:

5. réteg. Ebben a rétegben egyetlen csomópont összegzi az összes szabály hozzájárulását:

.

A neurális hálózatok betanítására szolgáló tipikus eljárások használhatók az ANFIS hálózat konfigurálására, mivel az csak differenciálható függvényeket használ. Általában a gradiens süllyedés kombinációját használják visszaszaporítás és legkisebb négyzetek formájában. A backpropagation algoritmus a szabályok előzményeinek paramétereit állítja be, pl. tagsági funkciók. A szabálykövetkeztetések együtthatóit a legkisebb négyzetek módszerével becsüljük meg, mivel lineárisan kapcsolódnak a hálózati kimenethez. A beállítási eljárás minden iterációja két lépésben történik. Az első szakaszban egy betanító mintát adunk a bemenetekhez, és a hálózat kívánt és tényleges viselkedése közötti eltérés alapján az iteratív legkisebb négyzetek módszerével megkeresik a negyedik réteg csomópontjainak optimális paramétereit. A második szakaszban a maradék maradékot a hálózati kimenetről a bemenetekre továbbítják, és az első réteg csomópontjainak paramétereit a backpropagation módszerrel módosítják. Ebben az esetben az első szakaszban talált szabálykövetkeztetési együtthatók nem változnak. Az iteratív hangolási eljárás addig folytatódik, amíg az eltérés meg nem halad egy előre meghatározott értéket. A tagsági függvények beállításához a visszaszaporítási módszeren kívül más optimalizáló algoritmusok is használhatók, például a Levenberg-Marquardt módszer.

24. ábra. ANFISedit munkaterület.

Most próbáljuk meg optimalizálni a fuzzy vezérlőt egy lépéses művelethez. A kívánt átmeneti folyamat megközelítőleg a következő formájú:

25. ábra. A kívánt átállási folyamat.

ábrán látható grafikonból. Ebből következik, hogy a motornak legtöbbször teljes erővel kell működnie, hogy maximális teljesítményt biztosítson, és a kívánt értékhez közeledve egyenletesen fékezzen. Ezektől az egyszerű érvektől vezérelve a következő, táblázatos formában bemutatott értékmintát vesszük képzési mintaként:

4. táblázat


Hiba érték

Kontroll érték

Hiba érték

Kontroll érték

Hiba érték

Kontroll érték


26. ábra. A képzési minta típusa.

A képzést 100 lépésben végezzük. Ez több mint elég az alkalmazott módszer konvergenciájához.

27. ábra. A neurális hálózat betanításának folyamata.

A tanulási folyamat során a tagsági függvények paraméterei úgy alakulnak ki, hogy adott hibaértékhez a vezérlő létrehozza a szükséges vezérlést. A csomópontok közötti területen a hiba szabályozási függése a táblázat adatainak interpolációja. Az interpolációs módszer a neurális hálózat betanításától függ. Valójában a betanítás után a fuzzy vezérlő modell egy változó nemlineáris függvényeként ábrázolható, amelynek grafikonját az alábbiakban mutatjuk be.

28. ábra. A vezérlés és a vezérlőn belüli pozícióhiba grafikonja.

A tagsági függvények talált paramétereinek elmentése után egy optimalizált fuzzy vezérlővel szimuláljuk a rendszert.


Rizs. 29. Tranziens folyamat harmonikus bemeneti művelet alatt egy bemeneti nyelvi változót tartalmazó, optimalizált fuzzy vezérlővel rendelkező modellhez.

30. ábra. Hibajel harmonikus bemeneti művelet alatt két bemeneti nyelvi változót tartalmazó fuzzy vezérlővel rendelkező modellnél.


A grafikonokból az következik, hogy a fuzzy vezérlő optimalizálása neurális hálózati betanítással sikeres volt. A hiba változékonysága és nagysága jelentősen csökkent. Ezért a neurális hálózat használata igencsak indokolt olyan szabályozók optimalizálására, amelyek működési elve fuzzy logikán alapul. Azonban még egy optimalizált vezérlő sem tudja kielégíteni a pontossági követelményeket, ezért célszerű más vezérlési módot fontolóra venni, amikor a fuzzy vezérlő nem közvetlenül vezérli az objektumot, hanem az aktuális helyzettől függően több szabályozási törvényt kombinál.



Előző cikk: Következő cikk:

© 2015 .
Az oldalról | Kapcsolatok
| Webhelytérkép