në shtëpi » kërpudha helmuese » Teoria e informacionit dhe njohja e modeleve. Njohja e modelit

Teoria e informacionit dhe njohja e modeleve. Njohja e modelit

Die, 29 Mars 2015

Aktualisht, ka shumë detyra në të cilat kërkohet të merret një vendim në varësi të pranisë së një objekti në imazh ose ta klasifikojë atë. Aftësia për të "njohur" konsiderohet vetia kryesore e qenieve biologjike, ndërsa sistemet kompjuterike nuk e zotërojnë plotësisht këtë veti.

Konsideroni elementet e përgjithshme të modelit të klasifikimit.

Klasa- një grup objektesh që kanë veti të përbashkëta. Për objektet e së njëjtës klasë, supozohet prania e "ngjashmërisë". Një numër arbitrar klasash mund të përcaktohet për detyrën e njohjes, më shumë se 1. Numri i klasave shënohet me numrin S. Çdo klasë ka etiketën e vet identifikuese të klasës.

Klasifikimi- procesi i caktimit të etiketave të klasave për objektet, sipas disa përshkrimeve të vetive të këtyre objekteve. Një klasifikues është një pajisje që merr një grup karakteristikash të një objekti si hyrje dhe prodhon një etiketë klase si rezultat.

Verifikimi- procesi i përputhjes së një shembulli objekti me një model të vetëm objekti ose përshkrim klase.

Nën mënyrë emrin e zonës do ta kuptojmë në hapësirën e atributeve, në të cilën shfaqen shumë objekte apo dukuri të botës materiale. shenjë- një përshkrim sasior i një vetie të caktuar të objektit ose dukurisë në studim.

hapësira e veçorive kjo është një hapësirë ​​N-dimensionale e përcaktuar për një detyrë të caktuar njohjeje, ku N është një numër fiks i veçorive të matura për çdo objekt. Vektori nga hapësira e veçorive x që korrespondon me objektin e problemit të njohjes është një vektor N-dimensionale me komponentë (x_1,x_2,…,x_N), të cilat janë vlerat e veçorive për objektin e dhënë.

Me fjalë të tjera, njohja e modelit mund të përkufizohet si caktimi i të dhënave fillestare në një klasë të caktuar duke nxjerrë veçori ose veçori thelbësore që karakterizojnë këto të dhëna nga masa e përgjithshme e detajeve të parëndësishme.

Shembuj të problemeve të klasifikimit janë:

  • njohja e personazheve;
  • njohja e të folurit;
  • vendosja e një diagnoze mjekësore;
  • Parashikimi i Motit;
  • njohja e fytyrës
  • klasifikimi i dokumenteve etj.

Më shpesh, materiali burimor është imazhi i marrë nga kamera. Detyra mund të formulohet si marrja e vektorëve të veçorive për secilën klasë në imazhin e konsideruar. Procesi mund të shihet si një proces kodimi, i cili konsiston në caktimin e një vlere për çdo veçori nga hapësira e veçorive për secilën klasë.

Nëse marrim parasysh 2 klasa objektesh: të rriturit dhe fëmijët. Si veçori, ju mund të zgjidhni lartësinë dhe peshën. Siç shihet nga figura, këto dy klasa formojnë dy grupe jo të kryqëzuara, të cilat mund të shpjegohen nga tiparet e zgjedhura. Megjithatë, nuk është gjithmonë e mundur të zgjidhen parametrat e saktë të matur si veçori të klasave. Për shembull, parametrat e zgjedhur nuk janë të përshtatshëm për krijimin e klasave jo të mbivendosura të futbollistëve dhe basketbollistëve.

Detyra e dytë e njohjes është zgjedhja e veçorive ose vetive karakteristike nga imazhet origjinale. Kjo detyrë mund t'i atribuohet parapërpunimit. Nëse marrim parasysh detyrën e njohjes së të folurit, mund të dallojmë veçori të tilla si zanoret dhe bashkëtingëlloret. Atributi duhet të jetë një veti karakteristike e një klase të caktuar, ndërsa është e përbashkët për këtë klasë. Shenjat që karakterizojnë dallimet ndërmjet - shenjave ndërklasore. Karakteristikat e zakonshme për të gjitha klasat nuk përmbajnë informacion të dobishëm dhe nuk konsiderohen si veçori në problemin e njohjes. Zgjedhja e veçorive është një nga detyrat e rëndësishme që lidhet me ndërtimin e një sistemi njohjeje.

Pasi të përcaktohen veçoritë, është e nevojshme të përcaktohet procedura optimale e vendimit për klasifikim. Konsideroni një sistem njohjeje modeli të krijuar për të njohur klasa të ndryshme M, të shënuara si m_1,m_2,…,m 3. Atëherë mund të supozojmë se hapësira e imazhit përbëhet nga rajone M, secila përmban pika që korrespondojnë me një imazh nga një klasë. Atëherë problemi i njohjes mund të konsiderohet si ndërtimi i kufijve që ndajnë klasat M bazuar në vektorët e pranuar të matjes.

Zgjidhja e problemit të parapërpunimit të imazhit, nxjerrjes së veçorive dhe problemit të marrjes së zgjidhjes dhe klasifikimit optimal zakonisht shoqërohet me nevojën për të vlerësuar një sërë parametrash. Kjo çon në problemin e vlerësimit të parametrave. Përveç kësaj, është e qartë se nxjerrja e veçorive mund të përdorë informacion shtesë bazuar në natyrën e klasave.

Krahasimi i objekteve mund të bëhet në bazë të paraqitjes së tyre në formën e vektorëve matës. Është i përshtatshëm për të paraqitur të dhënat e matjes si numra realë. Pastaj ngjashmëria e vektorëve të veçorive të dy objekteve mund të përshkruhet duke përdorur distancën Euklidiane.

ku d është dimensioni i vektorit të veçorive.

Ekzistojnë 3 grupe të metodave të njohjes së modelit:

  • Shembull krahasimi. Ky grup përfshin klasifikimin sipas mesatares më të afërt, klasifikimin sipas distancës me fqinjin më të afërt. Metodat e njohjes strukturore mund të përfshihen gjithashtu në grupin e krahasimit të mostrës.
  • Metodat Statistikore. Siç nënkupton edhe emri, metodat statistikore përdorin disa informacione statistikore kur zgjidhin një problem njohjeje. Metoda përcakton përkatësinë e një objekti në një klasë të caktuar në bazë të probabilitetit.Në disa raste kjo zbret në përcaktimin e probabilitetit a posteriori të një objekti që i përket një klase të caktuar, me kusht që veçoritë e këtij objekti të kenë marrë të duhurën. vlerat. Një shembull është metoda e rregullave të vendimit Bayesian.
  • Rrjetet nervore. Një klasë e veçantë e metodave të njohjes. Një tipar dallues nga të tjerët është aftësia për të mësuar.

Klasifikimi sipas mesatares më të afërt

Në qasjen klasike të njohjes së modelit, në të cilën një objekt i panjohur për klasifikim përfaqësohet si një vektor i veçorive elementare. Një sistem njohjeje i bazuar në veçori mund të zhvillohet në mënyra të ndryshme. Këta vektorë mund t'i njihen sistemit paraprakisht si rezultat i trajnimit ose të parashikohen në kohë reale bazuar në disa modele.

Një algoritëm i thjeshtë klasifikimi përbëhet nga grupimi i të dhënave të referencës së klasës duke përdorur vektorin e pritjes së klasës (mesatarja).

ku x(i,j) është tipari i referencës j i klasës i, n_j është numri i vektorëve referencë të klasës i.

Atëherë objekti i panjohur do t'i përkasë klasës i nëse është shumë më afër vektorit të pritjes së klasës i sesa vektorëve të pritjes së klasave të tjera. Kjo metodë është e përshtatshme për problemet në të cilat pikat e secilës klasë janë të vendosura në mënyrë kompakte dhe larg pikave të klasave të tjera.

Vështirësitë do të shfaqen nëse klasat kanë një strukturë pak më komplekse, për shembull, si në figurë. Në këtë rast, klasa 2 ndahet në dy seksione jo të mbivendosura, të cilat përshkruhen dobët nga një vlerë mesatare e vetme. Gjithashtu, klasa 3 është shumë e zgjatur, mostrat e klasës së 3-të me vlera të mëdha të koordinatave x_2 janë më afër vlerës mesatare të klasës së parë sesa klasës së 3-të.

Problemi i përshkruar në disa raste mund të zgjidhet duke ndryshuar llogaritjen e distancës.

Ne do të marrim parasysh karakteristikën e "shpërndarjes" së vlerave të klasës - σ_i, përgjatë çdo drejtimi koordinativ i. Devijimi standard është i barabartë me rrënjën katrore të variancës. Distanca Euklidiane e shkallëzuar ndërmjet vektorit x dhe vektorit të pritjes x_c është

Kjo formulë e distancës do të zvogëlojë numrin e gabimeve të klasifikimit, por në realitet, shumica e problemeve nuk mund të përfaqësohen nga një klasë kaq e thjeshtë.

Klasifikimi sipas distancës nga fqinji më i afërt

Një qasje tjetër për klasifikimin është caktimi i një vektori të panjohur të tipareve x në klasën së cilës ky vektor është më afër një kampioni të veçantë. Ky rregull quhet rregulli i fqinjit më të afërt. Klasifikimi i fqinjëve më të afërt mund të jetë më efikas edhe kur klasat janë komplekse ose kur klasat mbivendosen.

Kjo qasje nuk kërkon supozime në lidhje me modelet e shpërndarjes së vektorëve të veçorive në hapësirë. Algoritmi përdor vetëm informacione rreth mostrave të njohura të referencës. Metoda e zgjidhjes bazohet në llogaritjen e distancës x për çdo mostër në bazën e të dhënave dhe gjetjen e distancës minimale. Përparësitë e kësaj qasjeje janë të dukshme:

  • në çdo kohë mund të shtoni mostra të reja në bazën e të dhënave;
  • Strukturat e të dhënave të pemës dhe rrjetit reduktojnë numrin e distancave të llogaritura.

Për më tepër, zgjidhja do të jetë më e mirë nëse shikoni në bazën e të dhënave jo për një fqinj më të afërt, por për k. Më pas, për k > 1, jep mostrën më të mirë të shpërndarjes së vektorëve në hapësirën d-dimensionale. Sidoqoftë, përdorimi efikas i vlerave k varet nëse ka mjaftueshëm në çdo rajon të hapësirës. Nëse ka më shumë se dy klasa, atëherë është më e vështirë të merret vendimi i duhur.

Letërsia

  • M. Castrillon,. O. Deniz,. D. Hernández dhe J. Lorenzo, “Një krahasim i detektorëve të fytyrës dhe tipareve të fytyrës bazuar në kornizën e përgjithshme të zbulimit të objekteve të Viola-Jones”, International Journal of Computer Vision, nr.22, f. 481-494, 2011.
  • Y.-Q. Wang, "Një analizë e algoritmit të zbulimit të fytyrës Viola-Jones", Journal IPOL, 2013.
  • L. Shapiro dhe D. Stockman, Vizioni kompjuterik, Binom. Laboratori i njohurive, 2006.
  • Z. N. G., Metodat e njohjes dhe aplikimi i tyre, Radio Sovjetike, 1972.
  • J. Tu, R. Gonzalez, Parimet matematikore të njohjes së modeleve, Moskë: "Mir" Moskë, 1974.
  • Khan, H. Abdullah dhe M. Shamian Bin Zainal, "Algoritmi efikas i zbulimit të syve dhe gojës duke përdorur kombinimin e viola jones dhe zbulimin e pikselit të ngjyrës së lëkurës" International Journal of Engineering and Applied Sciences, nr. Vol. 3 nr 4, 2013.
  • V. Gaede dhe O. Gunther, "Multidimensional Access Methods", ACM Computing Surveys, f. 170-231, 1998.

Sistemet e gjalla, duke përfshirë njerëzit, janë përballur vazhdimisht me detyrën e njohjes së modeleve që nga fillimi i tyre. Në veçanti, informacioni që vjen nga organet shqisore përpunohet nga truri, i cili nga ana tjetër rendit informacionin, siguron vendimmarrjen dhe më pas, duke përdorur impulse elektrokimike, transmeton sinjalin e nevojshëm më tej, për shembull, në organet e lëvizjes, të cilat. zbatojnë veprimet e nevojshme. Pastaj ka një ndryshim në mjedis, dhe dukuritë e mësipërme përsëriten. Dhe nëse shikoni, atëherë çdo fazë shoqërohet me njohje.

Me zhvillimin e teknologjisë kompjuterike, u bë e mundur zgjidhja e një numri problemesh që lindin në procesin e jetës, për të lehtësuar, përshpejtuar, përmirësuar cilësinë e rezultatit. Për shembull, funksionimi i sistemeve të ndryshme të mbështetjes së jetës, ndërveprimi njeri-kompjuter, shfaqja e sistemeve robotike, etj. Megjithatë, vërejmë se aktualisht nuk është e mundur të sigurohet një rezultat i kënaqshëm në disa detyra (njohja e objekteve të ngjashme me lëvizje të shpejtë , tekst i shkruar me dorë).

Qëllimi i punës: të studiojë historinë e sistemeve të njohjes së modeleve.

Tregoni ndryshimet cilësore që kanë ndodhur në fushën e njohjes së modeleve, si teorike ashtu edhe teknike, duke treguar arsyet;

Diskutoni metodat dhe parimet e përdorura në informatikë;

Jepni shembuj të perspektivave që priten në të ardhmen e afërt.

1. Çfarë është njohja e modelit?

Hulumtimi i parë me teknologjinë kompjuterike në thelb ndoqi skemën klasike të modelimit matematik - modeli matematikor, algoritmi dhe llogaritja. Këto ishin detyrat e modelimit të proceseve që ndodhin gjatë shpërthimeve të bombave atomike, llogaritja e trajektoreve balistike, aplikime ekonomike dhe të tjera. Megjithatë, përveç ideve klasike të kësaj serie, kishte edhe metoda të bazuara në një natyrë krejtësisht të ndryshme dhe siç tregonte praktika e zgjidhjes së disa problemeve, ato shpesh jepnin rezultate më të mira se zgjidhjet e bazuara në modele matematikore tepër të ndërlikuara. Ideja e tyre ishte të braktisnin dëshirën për të krijuar një model matematikor shterues të objektit në studim (për më tepër, shpesh ishte praktikisht e pamundur të ndërtoheshin modele adekuate), dhe në vend të kësaj të kënaqeshin me përgjigjen vetëm për pyetjet specifike me interes për ne, dhe këto përgjigje duhet të kërkohen nga konsideratat e zakonshme për një klasë të gjerë problemesh. Kërkimet e këtij lloji përfshinin njohjen e imazheve vizuale, parashikimin e rendimenteve, nivelet e lumenjve, problemin e dallimit ndërmjet naftëmbajtësve dhe akuiferëve duke përdorur të dhëna gjeofizike indirekte, etj. Kërkohej një përgjigje specifike në këto detyra në një formë mjaft të thjeshtë, si p.sh. për shembull, nëse një objekt i përket njërës prej klasave të para-fiksuara. Dhe të dhënat fillestare të këtyre detyrave, si rregull, jepeshin në formën e informacionit fragmentar për objektet në studim, për shembull, në formën e një grupi objektesh të para-klasifikuara. Nga pikëpamja matematikore, kjo do të thotë se njohja e modelit (dhe kjo klasë problemesh u emërua në vendin tonë) është një përgjithësim i gjerë i idesë së ekstrapolimit të funksionit.

Rëndësia e një formulimi të tillë për shkencat teknike është pa dyshim dhe kjo në vetvete justifikon studime të shumta në këtë fushë. Megjithatë, problemi i njohjes së modeleve ka gjithashtu një aspekt më të gjerë për shkencën natyrore (megjithatë, do të ishte e çuditshme nëse diçka kaq e rëndësishme për sistemet artificiale kibernetike nuk do të ishte e rëndësishme për ato natyrore). Konteksti i kësaj shkence përfshinte në mënyrë organike pyetjet e parashtruara nga filozofët e lashtë për natyrën e njohurive tona, aftësinë tonë për të njohur imazhe, modele, situata të botës përreth. Në fakt, praktikisht nuk ka dyshim se mekanizmat për njohjen e imazheve më të thjeshta, të tilla si imazhet e një grabitqari ose ushqimi të rrezikshëm që po afrohej, u formuan shumë më herët sesa u shfaq gjuha elementare dhe aparati logjik formal. Dhe nuk ka dyshim se mekanizma të tillë janë zhvilluar mjaftueshëm edhe në kafshët më të larta, të cilat, në aktivitetin e tyre jetësor, gjithashtu kanë nevojë urgjente për aftësinë për të dalluar një sistem mjaft kompleks të shenjave të natyrës. Kështu, në natyrë, ne shohim se fenomeni i të menduarit dhe i vetëdijes bazohet qartë në aftësinë për të njohur modele dhe përparimi i mëtejshëm i shkencës së inteligjencës lidhet drejtpërdrejt me thellësinë e të kuptuarit të ligjeve themelore të njohjes. Duke kuptuar faktin se pyetjet e mësipërme shkojnë shumë përtej përkufizimit standard të njohjes së modelit (termi mësim i mbikëqyrur është më i zakonshëm në literaturën në gjuhën angleze), është gjithashtu e nevojshme të kuptohet se ato kanë lidhje të thella me këtë relativisht të ngushtë (por ende larg nga shterimi) drejtim.

Edhe tani, njohja e modelit ka hyrë fort në jetën e përditshme dhe është një nga njohuritë më vitale të një inxhinieri modern. Në mjekësi, njohja e modelit i ndihmon mjekët të bëjnë diagnoza më të sakta; në fabrika, përdoret për të parashikuar defekte në grupe mallrash. Sistemet biometrike të identifikimit personal si thelbi i tyre algoritmik bazohen gjithashtu në rezultatet e kësaj disipline. Zhvillimi i mëtejshëm i inteligjencës artificiale, veçanërisht dizajni i kompjuterëve të gjeneratës së pestë të aftë për komunikim më të drejtpërdrejtë me një person në gjuhët natyrore për njerëzit dhe përmes të folurit, është i paimagjinueshëm pa njohje. Këtu, robotika, sistemet e kontrollit artificial që përmbajnë sisteme njohjeje si nënsisteme jetike, janë lehtësisht të arritshme.

Kjo është arsyeja pse shumë vëmendje iu kushtua zhvillimit të njohjes së modeleve që në fillim nga specialistë të profileve të ndryshme - kibernetikë, neurofiziologë, psikologë, matematikanë, ekonomistë, etj. Kryesisht për këtë arsye, vetë njohja moderne e modeleve ushqehet me idetë e këtyre disiplinave. Pa pretenduar se është e plotë (dhe është e pamundur ta pretendosh atë në një ese të shkurtër), ne do të përshkruajmë historinë e njohjes së modelit, idetë kryesore.

Përkufizimet

Para se të vazhdojmë me metodat kryesore të njohjes së modelit, ne japim disa përkufizime të nevojshme.

Njohja e imazheve (objekteve, sinjaleve, situatave, fenomeneve ose proceseve) është detyra e identifikimit të një objekti ose përcaktimit të ndonjë prej vetive të tij nga imazhi i tij (njohja optike) ose regjistrimi audio (njohja akustike) dhe karakteristika të tjera.

Një nga ato themelore është koncepti i një grupi që nuk ka një formulim specifik. Në një kompjuter, një grup përfaqësohet nga një grup elementësh që nuk përsëriten të të njëjtit lloj. Fjala "jo-përsëritëse" do të thotë që një element në grup ose është aty ose nuk është aty. Kompleti universal përfshin të gjithë elementët e mundshëm për problemin që zgjidhet, grupi bosh nuk përmban asnjë.

Një imazh është një grupim klasifikimi në sistemin e klasifikimit që bashkon (veçon) një grup të caktuar objektesh sipas ndonjë atributi. Imazhet kanë një veti karakteristike, e cila manifestohet në faktin se njohja me një numër të kufizuar fenomenesh nga i njëjti grup bën të mundur njohjen e një numri të madh arbitrarisht të përfaqësuesve të tij. Imazhet kanë veti karakteristike objektive në kuptimin që njerëz të ndryshëm që mësojnë nga materiale të ndryshme vëzhguese, në pjesën më të madhe, klasifikojnë të njëjtat objekte në të njëjtën mënyrë dhe në mënyrë të pavarur nga njëri-tjetri. Në formulimin klasik të problemit të njohjes, grupi universal ndahet në pjesë-imazhe. Çdo hartë e çdo objekti me organet perceptuese të sistemit njohës, pavarësisht nga pozicioni i tij në lidhje me këto organe, zakonisht quhet imazh i objektit, dhe grupet e imazheve të tilla, të bashkuara nga disa veti të përbashkëta, janë imazhe.

Metoda e caktimit të një elementi në çdo imazh quhet rregull vendimi. Një koncept tjetër i rëndësishëm është metrika, një mënyrë për të përcaktuar distancën midis elementeve të një grupi universal. Sa më e vogël të jetë kjo distancë, aq më të ngjashme janë objektet (simbolet, tingujt, etj.) që njohim. Në mënyrë tipike, elementët specifikohen si një grup numrash, dhe metrika specifikohet si një funksion. Efikasiteti i programit varet nga zgjedhja e paraqitjes së imazheve dhe zbatimi i metrikës, një algoritëm njohjeje me metrika të ndryshme do të bëjë gabime me frekuenca të ndryshme.

Mësimi zakonisht quhet procesi i zhvillimit në një sistem të një reagimi të veçantë ndaj grupeve të sinjaleve të jashtme identike duke ndikuar vazhdimisht në sistemin e korrigjimit të jashtëm. Një rregullim i tillë i jashtëm në trajnim zakonisht quhet "inkurajim" dhe "ndëshkim". Mekanizmi për gjenerimin e këtij rregullimi përcakton pothuajse plotësisht algoritmin e të mësuarit. Vetë-mësimi ndryshon nga të mësuarit në atë që këtu nuk raportohet informacion shtesë në lidhje me korrektësinë e reagimit ndaj sistemit.

Përshtatja është një proces i ndryshimit të parametrave dhe strukturës së sistemit, dhe ndoshta edhe veprimeve të kontrollit, bazuar në informacionin aktual për të arritur një gjendje të caktuar të sistemit me pasiguri fillestare dhe ndryshim të kushteve të funksionimit.

Të mësuarit është një proces, si rezultat i të cilit sistemi gradualisht fiton aftësinë për t'iu përgjigjur me reagimet e nevojshme grupeve të caktuara të ndikimeve të jashtme, dhe përshtatja është rregullimi i parametrave dhe strukturës së sistemit për të arritur cilësinë e kërkuar të kontrolli në kushtet e ndryshimeve të vazhdueshme në kushtet e jashtme.

Shembuj të detyrave të njohjes së modeleve: - Njohja e shkronjave;

Metoda e përsëritjes. Në këtë metodë bëhet krahasimi me një bazë të caktuar të dhënash, ku për secilin nga objektet ekzistojnë opsione të ndryshme për modifikimin e ekranit. Për shembull, për njohjen optike të imazhit, mund të aplikoni metodën e përsëritjes në kënde ose shkallë të ndryshme, zhvendosje, deformime, etj. Për shkronjat, mund të përsërisni mbi fontin ose vetitë e tij. Në rastin e njohjes së modelit të tingullit, ekziston një krahasim me disa modele të njohura (një fjalë e thënë nga shumë njerëz). Më tej, kryhet një analizë më e thellë e karakteristikave të imazhit. Në rastin e njohjes optike, ky mund të jetë përkufizimi i karakteristikave gjeometrike. Mostra e zërit në këtë rast i nënshtrohet analizës së frekuencës dhe amplitudës.

Metoda tjetër është përdorimi i rrjeteve nervore artificiale(INS). Kërkon ose një numër të madh shembujsh të detyrës së njohjes, ose një strukturë të veçantë të rrjetit nervor që merr parasysh specifikat e kësaj detyre. Por, megjithatë, kjo metodë karakterizohet nga efikasiteti dhe produktiviteti i lartë.

Metodat e bazuara në vlerësimet e densitetit të shpërndarjes së vlerave të veçorive. Huazuar nga teoria klasike e vendimeve statistikore, në të cilën objektet e studimit konsiderohen si realizime të një ndryshoreje të rastësishme shumëdimensionale të shpërndarë në hapësirën e tipareve sipas disa ligjeve. Ato bazohen në skemën e vendimmarrjes Bayesian, e cila i referohet probabiliteteve fillestare të objekteve që i përkasin një klase të caktuar dhe densiteteve të shpërndarjes së veçorive të kushtëzuara.

Grupi i metodave të bazuara në vlerësimin e densitetit të shpërndarjes së vlerave të veçorive lidhet drejtpërdrejt me metodat e analizës diskriminuese. Qasja Bayesian ndaj vendimmarrjes është një nga metodat parametrike më të zhvilluara në statistikat moderne, për të cilën shprehja analitike e ligjit të shpërndarjes (ligji normal) konsiderohet të jetë e njohur dhe vetëm një numër i vogël parametrash (vektorët mesatarë dhe matricat e kovariancës). ) duhet të vlerësohen. Vështirësitë kryesore në zbatimin e kësaj metode konsiderohen si nevoja për të mbajtur mend të gjithë kampionin e trajnimit për të llogaritur vlerësimet e densitetit dhe ndjeshmërinë e lartë ndaj kampionit të trajnimit.

Metodat e bazuara në supozimet për klasën e funksioneve të vendimit. Në këtë grup konsiderohet i njohur lloji i funksionit të vendimmarrjes dhe jepet cilësia funksionale e tij. Bazuar në këtë funksional, përafrimi optimal me funksionin e vendimit gjendet nga sekuenca e trajnimit. Rregulli i vendimit për cilësinë funksionale zakonisht shoqërohet me një gabim. Avantazhi kryesor i metodës është qartësia e formulimit matematikor të problemit të njohjes. Mundësia e nxjerrjes së njohurive të reja për natyrën e një objekti, në veçanti, njohuri për mekanizmat e ndërveprimit të atributeve, kufizohet thelbësisht këtu nga një strukturë e caktuar ndërveprimi, e fiksuar në formën e zgjedhur të funksioneve të vendimit.

Metoda e krahasimit të prototipit. Kjo është metoda më e lehtë e njohjes zgjatuese në praktikë. Zbatohet kur klasat e njohura tregohen si klasa gjeometrike kompakte. Pastaj qendra e grupimit gjeometrik (ose objekti më afër qendrës) zgjidhet si pikë prototip.

Për të klasifikuar një objekt të papërcaktuar, gjendet prototipi më i afërt me të dhe objekti i përket së njëjtës klasë si ai. Natyrisht, në këtë metodë nuk formohen imazhe të përgjithësuara. Lloje të ndryshme distancash mund të përdoren si masë.

Metoda e k fqinjëve më të afërt. Metoda qëndron në faktin se gjatë klasifikimit të një objekti të panjohur, gjendet një numër i caktuar (k) i hapësirës së veçorive gjeometrikisht më të afërt të fqinjëve të tjerë më të afërt me përkatësinë tashmë të njohur të një klase. Vendimi për të caktuar një objekt të panjohur merret duke analizuar informacionin për fqinjët e tij më të afërt. Nevoja për të zvogëluar numrin e objekteve në kampionin e trajnimit (precedentë diagnostikues) është një disavantazh i kësaj metode, pasi kjo zvogëlon përfaqësimin e kampionit të trajnimit.

Bazuar në faktin se algoritme të ndryshme njohjeje sillen ndryshe në të njëjtin kampion, lind pyetja e një rregulli vendimmarrjeje sintetike që do të përdorte pikat e forta të të gjithë algoritmeve. Për këtë, ekziston një metodë sintetike ose grupe rregullash vendimi që kombinojnë aspektet më pozitive të secilës prej metodave.

Në përfundim të rishikimit të metodave të njohjes, ne paraqesim thelbin e sa më sipër në një tabelë përmbledhëse, duke shtuar disa metoda të tjera të përdorura në praktikë.

Tabela 1. Tabela e klasifikimit të metodave të njohjes, krahasimi i fushave të aplikimit dhe kufizimeve të tyre

Klasifikimi i metodave të njohjes

Zona e aplikimit

Kufizimet (disvantazhet)

Metodat intensive të njohjes

Metodat e bazuara në vlerësimet e densitetit

Probleme me një shpërndarje të njohur (normale), nevoja për të mbledhur statistika të mëdha

Nevoja për të numëruar të gjithë grupin e trajnimit gjatë njohjes, ndjeshmëri e lartë ndaj mospërfaqësimit të grupit të trajnimit dhe objekteve

Metodat e bazuara në supozime

Klasat duhet të jenë të ndara mirë

Forma e funksionit të vendimit duhet të njihet paraprakisht. Pamundësia për të marrë parasysh njohuritë e reja në lidhje me korrelacionet midis veçorive

Metodat Boolean

Probleme të dimensioneve të vogla

Kur zgjidhni rregullat logjike të vendimit, nevojitet një numërim i plotë. Intensitet i lartë i punës

Metodat gjuhësore

Detyra e përcaktimit të gramatikës për një grup të caktuar deklaratash (përshkrime të objekteve) është e vështirë të zyrtarizohet. Probleme teorike të pazgjidhura

Metodat e zgjeruara të njohjes

Metoda e krahasimit të prototipit

Problemet e dimensionit të vogël të hapësirës së veçorive

Varësia e lartë e rezultateve të klasifikimit nga metrika. Metrikë optimale e panjohur

k metoda e fqinjit më të afërt

Varësia e lartë e rezultateve të klasifikimit nga metrika. Nevoja për një numërim të plotë të kampionit të trajnimit gjatë njohjes. Kompleksiteti llogaritës

Algoritmet e llogaritjes së notave (ABO)

Probleme të dimensioneve të vogla për sa i përket numrit të klasave dhe veçorive

Varësia e rezultateve të klasifikimit nga metrika. Nevoja për një numërim të plotë të kampionit të trajnimit gjatë njohjes. Kompleksiteti i lartë teknik i metodës

Rregullat e vendimit kolektiv (CRC) është një metodë sintetike.

Probleme të dimensioneve të vogla për sa i përket numrit të klasave dhe veçorive

Kompleksiteti teknik shumë i lartë i metodës, numri i pazgjidhur i problemeve teorike, si në përcaktimin e fushave të kompetencës së metodave të veçanta, ashtu edhe në vetë metodat e veçanta

  • tutorial

Për një kohë të gjatë doja të shkruaja një artikull të përgjithshëm që përmban bazat e Njohjes së Imazhit, një lloj udhëzuesi mbi metodat bazë, duke treguar se kur t'i përdorësh ato, çfarë detyrash zgjidhin, çfarë mund të bësh në mbrëmje në gjunjë dhe për çfarë është më mirë të mos mendoni pa pasur një ekip njerëzish në 20.

Unë kam shkruar disa artikuj mbi Njohjen Optike për një kohë të gjatë, kështu që disa herë në muaj njerëz të ndryshëm më shkruajnë me pyetje për këtë temë. Ndonjëherë të vjen ndjesia se jeton me ta në botë të ndryshme. Nga njëra anë, ju e kuptoni se një person ka shumë të ngjarë të jetë profesionist në një temë të lidhur, por di shumë pak për metodat e njohjes optike. Dhe gjëja më e bezdisshme është se ai përpiqet të zbatojë një metodë nga një fushë e afërt e njohurive, e cila është logjike, por nuk funksionon plotësisht në Njohjen e Imazhit, por nuk e kupton këtë dhe ofendohet shumë nëse fillon t'i thotë diçka nga shumë bazë. Dhe duke pasur parasysh që të tregosh nga bazat është shumë kohë, e cila shpesh nuk është aty, bëhet edhe më e trishtuar.

Ky artikull është krijuar në mënyrë që një person që nuk është marrë kurrë me metodat e njohjes së imazhit, brenda 10-15 minutave, mund të krijojë në kokën e tij një pamje të caktuar themelore të botës që korrespondon me temën dhe të kuptojë se në cilin drejtim duhet të gërmojë. Shumë nga metodat e përshkruara këtu janë të zbatueshme për përpunimin e radarit dhe audios.
Do të filloj me disa parime që ne gjithmonë fillojmë t'i tregojmë një klienti të mundshëm ose një personi që dëshiron të fillojë të bëjë Njohjen Optike:

  • Kur zgjidhni një problem, shkoni gjithmonë nga më e thjeshta. Është shumë më e lehtë t'i varësh një personi një etiketë portokalli sesa të ndjekësh një person, duke e theksuar atë në kaskada. Është shumë më e lehtë të marrësh një aparat fotografik me rezolucion më të lartë sesa të zhvillosh një algoritëm super-rezolucion.
  • Një deklaratë e rreptë problemi në metodat e njohjes optike është urdhrat e madhësisë më të rëndësishme sesa në problemet e programimit të sistemit: një fjalë shtesë në TK mund të shtojë 50% të punës.
  • Në problemet e njohjes, nuk ka zgjidhje universale. Ju nuk mund të bëni një algoritëm që thjesht do të "njohë çdo mbishkrim". Një shenjë në rrugë dhe një fletë teksti janë objekte thelbësisht të ndryshme. Ndoshta është e mundur të bëhet një algoritëm i përgjithshëm (këtu është një shembull i mirë nga Google), por kjo do të kërkojë shumë punë nga një ekip i madh dhe do të përbëhet nga dhjetëra nënprograme të ndryshme.
  • OpenCV është bibla, e cila ka shumë metoda dhe me të cilën mund të zgjidhni 50% të vëllimit të pothuajse çdo problemi, por OpenCV është vetëm një pjesë e vogël e asaj që mund të bëhet në realitet. Në një studim, në përfundime shkruhej: "Problemi nuk zgjidhet me metoda OpenCV, prandaj është i pazgjidhshëm". Mundohuni ta shmangni këtë, mos jini dembel dhe vlerësoni me maturi detyrën aktuale çdo herë nga e para, pa përdorur shabllone OpenCV.
Është shumë e vështirë të japësh një lloj këshille universale, ose të tregosh se si të krijosh një lloj strukture rreth së cilës mund të ndërtosh një zgjidhje për problemet arbitrare të vizionit kompjuterik. Qëllimi i këtij artikulli është të strukturojë atë që mund të përdoret. Do të përpiqem t'i ndaj metodat ekzistuese në tre grupe. Grupi i parë është parafiltrimi dhe përgatitja e imazhit. Grupi i dytë është përpunimi logjik i rezultateve të filtrimit. Grupi i tretë janë algoritmet e vendimmarrjes të bazuara në përpunimin logjik. Kufijtë midis grupeve janë shumë arbitrare. Për të zgjidhur një problem, nuk është gjithmonë e nevojshme të aplikohen metoda nga të gjitha grupet; ndonjëherë mjaftojnë dy, dhe ndonjëherë edhe një.

Lista e metodave të paraqitura këtu nuk është e plotë. Unë propozoj të shtoj në komente metoda kritike që nuk i kam shkruar dhe t'i atribuoj 2-3 fjalë shoqëruese për secilën.

Pjesa 1. Filtrimi

Në këtë grup, vendosa metoda që ju lejojnë të zgjidhni zonat me interes në imazhe pa i analizuar ato. Shumica e këtyre metodave aplikojnë një lloj transformimi uniform në të gjitha pikat në imazh. Në nivelin e filtrimit, imazhi nuk analizohet, por pikat që filtrohen mund të konsiderohen si zona me karakteristika të veçanta.
Binarizimi i pragut, zgjedhja e zonës së histogramit
Transformimi më i thjeshtë është binarizimi i imazhit nga pragu. Për imazhet RGB dhe gri, pragu është vlera e ngjyrës. Ka probleme ideale në të cilat një transformim i tillë është i mjaftueshëm. Supozoni se dëshironi të zgjidhni automatikisht artikujt në një fletë të bardhë letre:




Zgjedhja e pragut me të cilin ndodh binarizimi përcakton kryesisht vetë procesin e binarizimit. Në këtë rast, imazhi u binarizuar nga ngjyra mesatare. Në mënyrë tipike, binarizimi bëhet me një algoritëm që zgjedh në mënyrë adaptive një prag. Një algoritëm i tillë mund të jetë zgjedhja e pritjes ose mënyrës. Dhe ju mund të zgjidhni majën më të madhe të histogramit.

Binarizimi mund të japë rezultate shumë interesante kur punoni me histograme, duke përfshirë situatën nëse marrim parasysh një imazh jo në RGB, por në HSV. Për shembull, segmentoni ngjyrat e interesit. Mbi këtë parim, është e mundur të ndërtohet një detektor etiketë dhe një detektor i lëkurës njerëzore.
Filtrimi klasik: Fourier, LPF, HPF
Metodat klasike të filtrimit nga radari dhe përpunimi i sinjalit mund të zbatohen me sukses në një sërë detyrash të Njohjes së Modeleve. Metoda tradicionale në radar, e cila pothuajse kurrë nuk përdoret në imazhe në formën e saj të pastër, është transformimi Fourier (më konkretisht, FFT). Një nga përjashtimet e pakta ku përdoret transformimi Furier 1D është kompresimi i imazhit. Për analizën e imazhit, një transformim njëdimensional zakonisht nuk është i mjaftueshëm, ju duhet të përdorni një transformim dy-dimensional shumë më intensiv me burime.

Pak njerëz e llogarisin atë në të vërtetë, zakonisht është shumë më e shpejtë dhe më e lehtë për të përdorur konvolucionin e rajonit të interesit me një filtër të gatshëm të mprehur në frekuenca të larta (HPF) ose të ulëta (LPF). Një metodë e tillë, natyrisht, nuk lejon analizën e spektrit, por në një detyrë specifike të përpunimit të videos, zakonisht nuk nevojitet një analizë, por një rezultat.


Shembujt më të thjeshtë të filtrave që theksojnë frekuencat e ulëta (filtri Gaussian) dhe frekuencat e larta (filtri Gabor).
Për çdo pikë imazhi, zgjidhet një dritare dhe shumëzohet me një filtër të së njëjtës madhësi. Rezultati i një konvolucioni të tillë është vlera e re e pikës. Kur zbatoni LPF dhe HPF, merren imazhe të këtij lloji:



Valët e valëve
Por, çka nëse përdorim disa funksione karakteristike arbitrare për konvolucionin me sinjalin? Atëherë do të quhet "Transformimi i valëve". Ky përkufizim i valëve nuk është i saktë, por tradicionalisht, në shumë ekipe, analiza e valëve është kërkimi i një modeli arbitrar në një imazh duke përdorur konvolucionin me një model të këtij modeli. Ekziston një grup funksionesh klasike që përdoren në analizën e valëve. Këto përfshijnë valëzimin Haar, valëzimin Morlet, valëzimin e kapelës meksikane, etj. Primitivët Haar, për të cilët kishte disa nga artikujt e mi të mëparshëm ( , ), i referohen funksioneve të tilla për një hapësirë ​​dy-dimensionale.


Më sipër janë 4 shembuj të valëve klasike. Wavelet 3D Haar, valëzimi 2D Meyer, valëzimi meksikan Hat, valëzimi Daubechies. Një shembull i mirë i përdorimit të interpretimit të zgjeruar të valëve është problemi i gjetjes së një shkëlqimi në sy, për të cilin vetë shkëlqimi është një valëzues:

Valët klasike zakonisht përdoren për kompresimin e imazhit, ose për klasifikimin e tyre (që do të përshkruhet më poshtë).
Korrelacioni
Pas një interpretimi kaq të lirë të valëve nga ana ime, vlen të përmendet korrelacioni aktual që qëndron në themel të tyre. Kur filtroni imazhe, ky është një mjet i domosdoshëm. Një aplikacion klasik është korrelacioni i transmetimit të videos për të gjetur kompensime ose transmetime optike. Detektori më i thjeshtë i zhvendosjes është gjithashtu, në një farë kuptimi, një korrelator i ndryshimit. Aty ku imazhet nuk lidhen, kishte lëvizje.

Filtrimi i funksionit
Një klasë interesante e filtrave janë funksionet e filtrimit. Këto janë filtra thjesht matematikorë që ju lejojnë të zbuloni një funksion të thjeshtë matematikor në një imazh (vijë, parabolë, rreth). Ndërtohet një imazh akumulues, në të cilin për secilën pikë të figurës origjinale vizatohet një grup funksionesh që e gjenerojnë atë. Transformimi më klasik është transformimi Hough për linjat. Në këtë transformim, për çdo pikë (x;y), vizatohet një grup pikash (a;b) të drejtëzës y=ax+b, për të cilat barazia është e vërtetë. Merrni foto të bukura:


(plusi i parë për atë që është i pari që gjen një kapje në foto dhe një përkufizim të tillë dhe e shpjegon atë, plusi i dytë për atë që është i pari që thotë atë që tregohet këtu)
Transformimi Hough ju lejon të gjeni çdo funksion të parametrizueshëm. Për shembull rrathët. Ekziston një transformim i modifikuar që ju lejon të kërkoni për çdo formë. Ky transformim është jashtëzakonisht i dashur për matematikanët. Por kur përpunoni imazhe, për fat të keq, nuk funksionon gjithmonë. Shpejtësi shumë e ngadaltë, ndjeshmëri shumë e lartë ndaj cilësisë së binarizimit. Edhe në situata ideale, preferoja të kaloja me metoda të tjera.
Homologu i transformimit Hough për linjat është transformimi i Radonit. Ai llogaritet përmes FFT-së, e cila jep një fitim të performancës në një situatë ku ka shumë pikë. Përveç kësaj, mund të aplikohet në një imazh jo-binar.
Filtrimi i konturit
Një klasë e veçantë e filtrave është filtrimi i kufirit dhe konturit. Shtigjet janë shumë të dobishme kur duam të kalojmë nga puna me një imazh në punën me objektet në atë imazh. Kur një objekt është mjaft kompleks, por i dalluar mirë, atëherë shpesh mënyra e vetme për të punuar me të është të zgjidhni konturet e tij. Ekzistojnë një numër algoritmesh që zgjidhin problemin e filtrimit të kontureve:

Më i përdoruri është Kenny, i cili funksionon mirë dhe zbatimi i të cilit është në OpenCV (aty është edhe Sobel, por ai kërkon konturet më keq).



Filtra të tjerë
Më sipër janë filtra, modifikimet e të cilave ndihmojnë në zgjidhjen e 80-90% të detyrave. Por përveç tyre, ka filtra më të rrallë që përdoren në detyrat lokale. Ka dhjetëra filtra të tillë, nuk do t'i rendis të gjithë. Me interes janë filtrat iterativë (për shembull, një model i pamjes aktive), si dhe transformimet ridgelet dhe curvlet, të cilat janë një aliazh i filtrimit dhe analizës klasike të valëve në fushën e transformimit të radonit. Transformimi Beamlet funksionon bukur në kufirin e transformimit të valëve dhe analizës logjike, duke ju lejuar të nënvizoni konturet:

Por këto transformime janë shumë specifike dhe të përshtatura për detyra të rralla.

Pjesa 2. Përpunimi logjik i rezultateve të filtrimit

Filtrimi jep një grup të dhënash të përshtatshme për përpunim. Por shpesh nuk mund t'i marrësh dhe t'i përdorësh këto të dhëna pa i përpunuar ato. Në këtë seksion, do të ketë disa metoda klasike që ju lejojnë të kaloni nga imazhi te vetitë e objekteve ose te vetë objektet.
Morfologjia
Kalimi nga filtrimi në logjikë, për mendimin tim, janë metodat e morfologjisë matematikore ( , , ). Në fakt, këto janë operacionet më të thjeshta të rritjes dhe gërryerjes së imazheve binare. Këto metoda ju lejojnë të hiqni zhurmën nga një imazh binar duke rritur ose ulur elementët e disponueshëm. Bazuar në morfologjinë matematikore, ekzistojnë algoritme konturuese, por zakonisht ato përdorin disa lloj algoritmesh hibride ose algoritme në lidhje.
analiza e konturit
Në seksionin mbi filtrimin, tashmë janë përmendur algoritmet për marrjen e kufijve. Kufijtë që rezultojnë shndërrohen thjesht në konture. Për algoritmin Canny kjo ndodh automatikisht, për algoritme të tjera kërkohet binarizimi shtesë. Ju mund të merrni një kontur për një algoritëm binar, për shembull, me algoritmin e brumbullit.
Kontura është një karakteristikë unike e një objekti. Shpesh kjo ju lejon të identifikoni objektin përgjatë konturit. Ekziston një aparat i fuqishëm matematikor që ju lejon ta bëni këtë. Aparati quhet analiza e konturit ( , ).

Për të qenë i sinqertë, nuk kam arritur kurrë të aplikoj analizën e konturit në probleme reale. Kërkohen kushte shumë ideale. Ose nuk ka kufi, ose ka shumë zhurmë. Por, nëse keni nevojë të njihni diçka në kushte ideale, atëherë analiza e konturit është një opsion i shkëlqyeshëm. Punon shumë shpejt, matematikë e bukur dhe logjikë e kuptueshme.
Pika njëjës
Pikat kyçe janë karakteristika unike të një objekti që lejojnë që objekti të lidhet me vetveten ose me klasa të ngjashme objektesh. Ka dhjetëra mënyra për të zgjedhur pika të tilla. Disa metoda nxjerrin në pah pika të veçanta në kornizat fqinje, disa pas një periudhe të gjatë kohore dhe kur ndriçimi ndryshon, disa ju lejojnë të gjeni pika të veçanta që mbeten të tilla edhe kur objekti rrotullohet. Le të fillojmë me metoda që na lejojnë të gjejmë pika të veçanta që nuk janë aq të qëndrueshme, por llogariten shpejt, dhe më pas do të shkojmë në kompleksitet në rritje:
Klasa e parë. Pika të veçanta që janë të qëndrueshme për sekonda. Pika të tilla përdoren për të drejtuar një objekt midis kornizave video ngjitur, ose për të konverguar imazhet nga kamerat fqinje. Këto pika përfshijnë maksimumet lokale të imazhit, qoshet në imazh (më të mirët nga detektorët, ndoshta, detektori Haris), pikat në të cilat arrihet maksimumi i shpërndarjes, gradientë të caktuar, etj.
Klasa e dyte. Pika të veçanta që janë të qëndrueshme gjatë ndryshimit të ndriçimit dhe lëvizjeve të vogla të objektit. Pika të tilla shërbejnë kryesisht për trajnimin dhe klasifikimin pasues të llojeve të objekteve. Për shembull, një klasifikues i këmbësorëve ose një klasifikues fytyre është produkt i një sistemi të ndërtuar pikërisht në pika të tilla. Disa nga valët e përmendura më parë mund të jenë baza për pika të tilla. Për shembull, Haar primitives, kërkimi me shkëlqim, kërkimi për veçori të tjera specifike. Këto pika përfshijnë pikat e gjetura me metodën e histogrameve të gradientëve të drejtimit (HOG).
Klasa e tretë. pika të qëndrueshme. Unë di vetëm për dy metoda që japin stabilitet të plotë dhe për modifikimet e tyre. Këto janë SURF dhe SIFT. Ato ju lejojnë të gjeni pika kyçe edhe kur rrotulloni imazhin. Llogaritja e pikave të tilla zgjat më shumë se metodat e tjera, por për një kohë mjaft të kufizuar. Fatkeqësisht, këto metoda janë të patentuara. Edhe pse, në Rusi është e pamundur të patentohen algoritmet, prandaj përdorni atë për tregun e brendshëm.

Pjesa 3. Trajnimi

Pjesa e tretë e tregimit do t'i kushtohet metodave që nuk funksionojnë drejtpërdrejt me imazhin, por që ju lejojnë të merrni vendime. Në thelb, këto janë metoda të ndryshme të mësimit të makinerive dhe vendimmarrjes. Kohët e fundit, Yandyks postoi një kurs për këtë temë në Habr, ka një përzgjedhje shumë të mirë atje. Këtu është në versionin tekst. Për një studim serioz të temës, ju rekomandoj fuqimisht t'i shikoni ato. Këtu do të përpiqem të identifikoj disa metoda bazë të përdorura posaçërisht në njohjen e modeleve.
Në 80% të situatave, thelbi i të mësuarit në problemin e njohjes është si më poshtë:
Ekziston një mostër provë në të cilën ka disa klasa objektesh. Le të jetë prania / mungesa e një personi në foto. Për çdo imazh, ekziston një grup karakteristikash që janë theksuar nga ndonjë veçori, qoftë Haar, HOG, SURF ose ndonjë valë valësh. Algoritmi i të mësuarit duhet të ndërtojë një model të tillë, sipas të cilit do të jetë në gjendje të analizojë imazhin e ri dhe të vendosë se cili prej objekteve është në imazh.
Si është bërë? Secila prej imazheve të testimit është një pikë në hapësirën e veçorive. Koordinatat e tij janë pesha e çdo veçorie në imazh. Le të jenë shenjat tona: "Prania e syve", "Prania e një hunde", "Prania e dy duarve", "Prania e veshëve" etj. Të gjitha këto shenja do t'i ndajmë me detektorët që kemi, të cilat stërviten në pjesë të trupit të ngjashme me ato të njeriut. Për një person në një hapësirë ​​të tillë, pika e saktë do të jetë . Për majmunin, pikë për kalin. Klasifikuesi është trajnuar mbi një mostër shembujsh. Por jo të gjitha fotografitë tregonin duar, të tjerat nuk kishin sy, dhe në të tretën majmuni kishte një hundë njeriu për shkak të një gabimi klasifikues. Klasifikuesi njerëzor i trajnueshëm ndan automatikisht hapësirën e veçorive në atë mënyrë që të thotë: nëse tipari i parë shtrihet në intervalin 0.5 Në thelb, qëllimi i klasifikuesit është të vizatojë në hapësirën e veçorive zonat karakteristike të objekteve të klasifikimit. Kështu do të duket përafrimi i njëpasnjëshëm i përgjigjes për një nga klasifikuesit (AdaBoost) në hapësirën dydimensionale:


Ka shumë klasifikues. Secila prej tyre funksionon më mirë në disa nga detyrat e saj. Detyra e zgjedhjes së një klasifikuesi për një detyrë specifike është kryesisht një art. Këtu janë disa foto të bukura mbi këtë temë.
Rast i thjeshtë, ndarje njëdimensionale
Le të marrim një shembull të rastit më të thjeshtë të klasifikimit, kur hapësira e veçorive është njëdimensionale dhe duhet të ndajmë 2 klasa. Situata ndodh më shpesh sesa mund të duket: për shembull, kur duhet të dalloni dy sinjale ose të krahasoni një model me një mostër. Le të themi se kemi një mostër trajnimi. Në këtë rast, fitohet një imazh, ku boshti X do të jetë një masë e ngjashmërisë, dhe boshti Y do të jetë numri i ngjarjeve me një masë të tillë. Kur objekti i dëshiruar është i ngjashëm me vetveten, fitohet një Gaussian i majtë. Kur nuk është e ngjashme - e drejtë. Vlera X=0.4 i ndan mostrat në mënyrë që një vendim i gabuar të minimizojë mundësinë e marrjes së ndonjë vendimi të gabuar. Është kërkimi për një ndarës të tillë që është detyra e klasifikimit.


Shënim i vogël. Kriteri që minimizon gabimin nuk do të jetë gjithmonë optimal. Grafiku i mëposhtëm është një grafik i një sistemi aktual të njohjes së irisit. Për një sistem të tillë, kriteri zgjidhet në atë mënyrë që të minimizojë probabilitetin e pranimit të rremë të një të huaji në objekt. Një probabilitet i tillë quhet "gabim i llojit të parë", "probabiliteti i alarmit të rremë", "pozitiv i rremë". Në literaturën angleze "False Access Rate".
) AdaBusta është një nga klasifikuesit më të zakonshëm. Për shembull, kaskada Haar është ndërtuar mbi të. Zakonisht përdoret kur nevojitet klasifikimi binar, por asgjë nuk e pengon mësimin për më shumë klasa.
SVM ( , , , ) Një nga klasifikuesit më të fuqishëm me shumë implementime. Në parim, në detyrat mësimore që kam hasur, funksionoi njësoj si adabusta. Konsiderohet mjaft i shpejtë, por trajnimi i tij është më i vështirë se ai i Adabusta dhe kërkon zgjedhjen e bërthamës së duhur.

Ekzistojnë gjithashtu rrjete nervore dhe regresion. Por për t'i klasifikuar shkurtimisht dhe për të treguar se si ndryshojnë, nevojitet një artikull shumë më i madh se ky.
________________________________________________
Shpresoj se kam qenë në gjendje të jap një pasqyrë të shpejtë të metodave të përdorura pa u zhytur në matematikë dhe përshkrim. Ndoshta kjo do të ndihmojë dikë. Edhe pse, natyrisht, artikulli është i paplotë dhe nuk ka asnjë fjalë për punën me imazhe stereo, ose për LSM me filtrin Kalman, ose për qasjen adaptive Bayesian.
Nëse ju pëlqen artikulli, atëherë do të përpiqem të bëj pjesën e dytë me një përzgjedhje shembujsh se si zgjidhen problemet ekzistuese të Njohjes së Imazhit.

Dhe së fundi

Çfarë duhet lexuar?
1) Dikur më pëlqeu shumë libri "Përpunimi i imazhit dixhital" nga B. Yana, i cili është shkruar thjesht dhe qartë, por në të njëjtën kohë jepet pothuajse e gjithë matematika. Mirë për t'u njohur me metodat ekzistuese.
2) Klasik i zhanrit është R Gonzalez, R. Woods "Digital Image Processing". Për disa arsye, ishte më e vështirë për mua se e para. Shumë më pak matematikë, por më shumë metoda dhe fotografi.
3) "Përpunimi dhe analiza e imazhit në problemet e shikimit të makinës" - shkruar në bazë të një kursi të mësuar në një nga departamentet e PhysTech. Shumë metoda dhe përshkrimi i tyre i detajuar. Por për mendimin tim, libri ka dy minuse të mëdha: libri është i fokusuar fort në paketën softuerike që vjen me të, në libër shumë shpesh përshkrimi i një metode të thjeshtë kthehet në xhungël matematikore, nga e cila është e vështirë të dalësh. diagrami strukturor i metodës. Por autorët kanë krijuar një faqe të përshtatshme, ku është paraqitur pothuajse e gjithë përmbajtja - wiki.technicalvision.ru Shtoni etiketa

Etj objekte që karakterizohen nga një grup i kufizuar i vetive dhe veçorive të caktuara. Detyra të tilla zgjidhen mjaft shpesh, për shembull, kur kaloni ose drejtoni një rrugë në semafor. Njohja e ngjyrës së një semafori të ndezur dhe njohja e rregullave të rrugës ju lejon të merrni vendimin e duhur nëse do të kaloni apo jo rrugën.

Nevoja për një njohje të tillë lind në një sërë fushash - nga çështjet ushtarake dhe sistemet e sigurisë deri te dixhitalizimi i sinjaleve analoge.

Problemi i njohjes së imazhit ka marrë një rëndësi të jashtëzakonshme në kushtet e mbingarkesës së informacionit, kur një person nuk mund të përballojë një kuptim linear-sekuencial të mesazheve që vijnë tek ai, si rezultat i të cilit truri i tij kalon në mënyrën e njëkohshme të perceptimit dhe të menduarit. , për të cilat është karakteristikë një njohje e tillë.

Prandaj, nuk është rastësi që problemi i njohjes së imazhit doli të jetë në fushën e kërkimit ndërdisiplinor, përfshirë në lidhje me punën për krijimin e inteligjencës artificiale dhe krijimin e sistemeve teknike njohja e modelit po tërheq gjithnjë e më shumë vëmendje.

YouTube Enciklopedike

    1 / 4

    Hyrje në njohjen e modeleve

    R.V. Shamin. Leksioni nr. 6 Rrjetet Hopfield dhe Hamming në problemet e njohjes së modeleve

    [DDSH-2016]: Rrjetet nervore dhe vizioni kompjuterik modern

    Leksioni 9. Zbutja eksponenciale. Njohja e modelit: kth metoda e fqinjit më të afërt

    Titra

Udhëzime në njohjen e modelit

Ka dy drejtime kryesore:

  • Studimi i aftësive të njohjes që zotërojnë qeniet e gjalla, shpjegimi dhe modelimi i tyre;
  • Zhvillimi i teorisë dhe metodave për ndërtimin e pajisjeve të dizajnuara për të zgjidhur probleme individuale për qëllime të aplikuara.

Deklarata zyrtare e problemit

Njohja e modelit është caktimi i të dhënave fillestare në një klasë të caktuar duke theksuar veçoritë thelbësore që karakterizojnë këto të dhëna nga masa totale e të dhënave jo thelbësore.

Kur vendosin problemet e njohjes, ata përpiqen të përdorin një gjuhë matematikore, duke u përpjekur - në ndryshim nga teoria e rrjeteve nervore artificiale, ku baza është të merret një rezultat përmes eksperimentit - të zëvendësojnë eksperimentin me arsyetim logjik dhe prova matematikore.

Deklarata klasike e problemit të njohjes së modelit: Jepet një grup objektesh. Ata duhet të klasifikohen. Një grup përfaqësohet nga nënbashkësi, të cilat quhen klasa. Janë dhënë: informacion rreth klasave, një përshkrim i të gjithë grupit dhe një përshkrim i informacionit rreth një objekti që i përket një klase të caktuar nuk dihet. Kërkohet, sipas informacionit të disponueshëm për klasat dhe përshkrimit të objektit, të përcaktohet se cilës klasë i përket ky objekt.

Më shpesh, imazhet njëngjyrëshe konsiderohen në problemet e njohjes së modelit, gjë që bën të mundur që një imazh të konsiderohet si funksion në një plan. Nëse marrim parasysh një pikë të vendosur në një rrafsh T (\displaystyle T), ku funksioni shpreh në secilën pikë të imazhit karakteristikën e tij - shkëlqimin, transparencën, densitetin optik, atëherë një funksion i tillë është një regjistrim formal i figurës.

Kompleti i të gjitha funksioneve të mundshme f (x , y) (\displaystyle f(x, y)) në sipërfaqe T (\displaystyle T)- ekziston një model i grupit të të gjitha imazheve X (\displaystyle X). Prezantimi i konceptit ngjashmëritë midis imazheve, mund të vendosni detyrën e njohjes. Forma specifike e një mjedisi të tillë varet fuqimisht nga fazat pasuese të njohjes në përputhje me një ose një qasje tjetër.

Disa metoda të njohjes së imazheve grafike

Për njohjen optike të imazhit, mund të aplikoni metodën e përsëritjes mbi pamjen e një objekti në kënde të ndryshme, shkallë, zhvendosje, etj. Për shkronjat, duhet të përsërisni mbi fontin, vetitë e fontit, etj.

Qasja e dytë është gjetja e konturit të objektit dhe ekzaminimi i vetive të tij (lidhja, prania e qosheve, etj.)

Një qasje tjetër është përdorimi i rrjeteve artificiale neurale . Kjo metodë kërkon ose një numër të madh shembujsh të detyrës së njohjes (me përgjigje të sakta), ose një strukturë të veçantë të rrjetit nervor që merr parasysh specifikat e kësaj detyre.

Perceptroni si një metodë e njohjes së modelit

F. Rosenblatt, duke prezantuar konceptin e një modeli truri, detyra e të cilit është të tregojë se si mund të lindin fenomene psikologjike në një sistem fizik, struktura dhe vetitë funksionale të të cilit janë të njohura, përshkroi eksperimentet më të thjeshta mbi diskriminimin. Këto eksperimente janë tërësisht të lidhura me metodat e njohjes së modelit, por ndryshojnë në atë që algoritmi i zgjidhjes nuk është determinist.

Eksperimenti më i thjeshtë, mbi bazën e të cilit është e mundur të merren informacione të rëndësishme psikologjike për një sistem të caktuar, zbret në faktin se modeli paraqitet me dy stimuj të ndryshëm dhe kërkohet t'u përgjigjet atyre në mënyra të ndryshme. Qëllimi i një eksperimenti të tillë mund të jetë të studiojë mundësinë e diskriminimit të tyre spontan nga sistemi në mungesë të ndërhyrjes nga eksperimentuesi, ose, anasjelltas, të studiojë diskriminimin e detyruar, në të cilin eksperimentuesi kërkon të mësojë sistemin të kryejë klasifikimi i kërkuar.

Në një eksperiment mësimor, perceptroni zakonisht paraqitet me një sekuencë të caktuar imazhesh, e cila përfshin përfaqësues të secilës prej klasave që duhen dalluar. Sipas disa rregullave të modifikimit të kujtesës, zgjedhja e saktë e reagimit përforcohet. Më pas stimuli i kontrollit i paraqitet perceptronit dhe përcaktohet probabiliteti i marrjes së përgjigjes së saktë për stimujt e kësaj klase. Në varësi të faktit nëse stimuli i zgjedhur i kontrollit përputhet ose nuk përputhet me një nga imazhet që janë përdorur në sekuencën e stërvitjes, merren rezultate të ndryshme:

  1. Nëse stimuli i kontrollit nuk përkon me ndonjë nga stimujt e të mësuarit, atëherë eksperimenti shoqërohet jo vetëm me diskriminim i pastër, por përfshin edhe elemente përgjithësime.
  2. Nëse stimuli i kontrollit ngacmon një grup të caktuar elementesh shqisore që janë krejtësisht të ndryshëm nga ata elementë që janë aktivizuar nën ndikimin e stimujve të paraqitur më parë të së njëjtës klasë, atëherë eksperimenti është një hetim. përgjithësim i pastër.

Perceptronet nuk kanë aftësinë për përgjithësim të pastër, por ato funksionojnë mjaft të kënaqshme në eksperimentet e diskriminimit, veçanërisht nëse stimuli i kontrollit përkon mjaft ngushtë me një nga modelet për të cilat perceptroni ka grumbulluar tashmë një përvojë.

Shembuj të problemeve të njohjes së modelit

  • Njohja e barkodit
  • Njohja e targave
  • Njohja e imazhit
  • Njohja e zonave lokale të kores së tokës në të cilat ndodhen depozitat


Artikulli i mëparshëm: Artikulli vijues:

© 2015 .
Rreth sajtit | Kontaktet
| harta e faqes