KompjutersTeknoloġija informatika

Viżjoni tal-kompjuter moderna. Kompiti u t-teknoloġija viżjoni tal-kompjuter. Kompjuter programming Viżjoni fl-Python

Kif biex jgħallmu kompjuter biex jifhem dak huwa muri fl-istampa jew stampi? Dan jidher sempliċi, iżda għal kompjuter dan huwa biss matriċi li jikkonsisti żerijiet u dawk minn fejn inti tixtieq li tinkiseb informazzjoni importanti.

X'inhu viżjoni tal-kompjuter? Huwa l-abbiltà li "tara" kompjuter tiegħek

Viżjoni - huwa sors importanti ta 'informazzjoni għall-persuna li tuża dan, irridu jiksbu, skond l-estimi differenti, 70-90% ta' l-informazzjoni kollha. U, naturalment, jekk irridu noħolqu karozza intelliġenti, għandna bżonn li jiġu implimentati l-istess ħiliet u kompjuter.

Il-problema ta 'viżjoni tal-kompjuter jista' jiġi ddikjarat pjuttost ċar. X'inhu "ara"? Huwa mifhum li fejn hemm biss billi tħares. Li kkonkludiet id-differenzi ta 'viżjoni tal-kompjuter u l-viżjoni tal-bniedem. Viżjoni għalina - hija sors ta 'għarfien dwar id-dinja, kif ukoll bħala sors ta' informazzjoni metrika - jiġifieri, il-ħila li jifhmu l-distanzi u daqsijiet.

immaġni għadma Semantika

Ħarsa lejn l-istampa, nistgħu jiddeskrivu minn numru ta 'attributi, biex ngħidu hekk, biex tinkiseb informazzjoni semantiku.

Per eżempju, tħares lejn din l-istampa, nistgħu ngħidu li huwa barra. X'inhu l-traffiku belt. Li hemm karozzi. nistgħu raden li dan huwa Asja tax-Xlokk fuq il-konfigurazzjoni tal-bini u hieroglyphics. Il ritratt ta Mao Zedong jifhmu li dan huwa ta 'Beijing, u jekk xi ħadd raw jgħixu video jew stess kien ilu hemm, x'nifhem li dan huwa l-Pjazza ta' Tiananmen famużi.

Dak li nistgħu ngħidu aktar dwar l-istampa, dan iqisuh? Nistgħu tidentifika oġġetti fil-immaġini, li jgħidu, li hemm nies hawn eqreb - ċint. Hawnhekk umbrelel, kartelluni li bini. Dawn huma eżempji ta 'klassijiet huwa oġġetti importanti ħafna, li huma involuti fit-tfittxija għall-mument.

Still nistgħu nitgħallmu xi wħud mill-karatteristiċi jew attributi ta 'oġġetti. Per eżempju, hawnhekk nistgħu jiddetermina li din mhix ritratt ta Ċiniż ordinarja, jiġifieri, Mao Zedong.

Skond il-vettura tista 'tiġi determinata li huwa oġġett li jiċċaqlaq, u huwa diffiċli, li mhux deformat waqt il-moviment. Dwar bnadar jista 'jingħad illi toġġezzjona, huma wkoll jiċċaqilqu, iżda dawn m'humiex diffiċli, kontinwament deformat. U fil-xena hemm il-riħ, li jistgħu jiġu determinati billi jiġu żviluppati bnadar, u jista 'anke jiddeterminaw id-direzzjoni tar-riħ, per eżempju, huwa blowing mix-xellug għal-lemin.

Id-distanzi u tulijiet fil-vista kompjuter

Importanti ħafna hija l-informazzjoni metrika dwar ix-xjenza viżjoni tal-kompjuter. Dan huwa kull tip ta 'distanzi. Per eżempju, għall-Rover huwa partikolarment importanti minħabba li l-timijiet huma mill-Dinja madwar 20 minuta u risposta kemm. Għaldaqstant, ir-rabta hemm u lura - 40 minuta. U jekk nagħmlu pjan għall kmandi moviment of the Earth, għandek bżonn tieħu kont ta 'dan.

B'suċċess integrata l-teknoloġija ta 'viżjoni tal-kompjuter fil-logħob video. Skond il-video, inti tista 'tibni mudelli tridimensjonali ta' oġġetti, persuni, u ritratti fuq l-utent tista 'terġa-mudelli tridimensjonali ta' bliet. U mbagħad jimxu fuqhom.

viżjoni tal-kompjuter - firxa pjuttost wiesgħa. Huwa hija marbuta mill-qrib ma 'xjenzi oħra varji. Parti mill-viżjoni tal-kompjuter Huwa jaqbad l-erja tipproċessa l-immaġini u xi kultant talloka viżjoni tal-kompjuter, storikament.

Analiżi, rikonoxximent tad-disinn - il-passaġġ għall-ħolqien ta 'intelliġenza superjuri

Let us teżamina dawn il-kunċetti separatament.

Image Ipproċessar - dan huwa qasam ta 'algoritmi, li fiha l-input u l-output - immaġini, u għandna lilu nagħmlu xi ħaġa.

immaġni analiżi - huwa l-qasam ta 'viżjoni tal-kompjuter, li jiffoka fuq ħidma ma' l-immaġni żewġ dimensjonijiet u tippubblika l-konklużjonijiet minn dan.

Pattern Rikonoxximent - dixxiplina matematiċi astratt li jirrikonoxxi d-data fil-forma ta 'vettori. Dan huwa, fl-entratura - vettur u aħna għandna xi ħaġa li tagħmel ma 'dan. Meta l-vector huwa, aħna mhumiex daqshekk importanti li tkun taf.

viżjoni tal-kompjuter - oriġinarjament kien li jirrestawra l-istruttura tal-immaġini żewġ dimensjonijiet. Illum dan il-qasam sar iktar wiesgħa u jista 'jiġi interpretat bħala aċċettazzjoni ta' kollha ta 'l-oġġetti fiżiċi jagħmlu, ibbażata fuq l-immaġni. Jiġifieri, huwa l-kompitu ta 'intelliġenza artifiċjali.

B'mod parallel mal-viżjoni tal-kompjuter fil-qasam kompletament differenti, fil-ġeodesija, ta'Photogrammetry evolviet - kejl tad-distanza bejn oġġetti fuq immaġini żewġ dimensjonijiet.

Robots tista "ara"

U finalment - dan huwa viżjoni magna. Taħt il-viżjoni magna tfisser viżjoni tar-robots. Din hija d-deċiżjoni ta 'xi problemi ta' produzzjoni. Nistgħu ngħidu li l-viżjoni tal-kompjuter - huwa xjenza waħda kbira. Jgħaqqad xi wħud mill-naħa l-oħra tax-xjenza. U meta l-viżjoni tal-kompjuter gets xi applikazzjoni partikolari, jirriżulta fi viżjoni magna.

reġjun viżjoni tal-kompjuter għandu massa ta 'applikazzjonijiet prattiċi. Hija assoċjata ma 'l-awtomazzjoni tal-produzzjoni. Fuq l-intrapriżi jsiru aktar effiċjenti biex jissostitwixxu xogħol manwali bil-magna. Il-magna ma jiksbu għajjien, mhux irqad, hija kellha iskeda tax-xogħol irregolari, hija lesta li taħdem 365 ġurnata fis-sena. Allura, bl-użu tax-xogħol magna, nistgħu tikseb riżultat garantit fuq ċertu żmien, u huwa pjuttost interessanti. kompiti kollha għandhom użu ċara għal sistemi viżjoni tal-kompjuter. U m'hemm xejn aħjar milli jaraw ir-riżultati immedjatament fuq l-istampa biss fl-istadju kalkolu.

Dwar il-limitu tad-dinja ta 'intelliġenza artifiċjali

Flimkien mal-qasam - huwa diffiċli! Parti sinifikanti tal-moħħ responsabbli għall-viżjoni, u huwa maħsub li jekk inti jgħallmu kompjuter tiegħek li "tara", jiġifieri, l-viżjoni sħiħa użu tal-kompjuter, huwa wieħed mill-għanijiet ta 'intelliġenza artifiċjali sħiħa. Jekk nistgħu issolvi l-problema fuq il-livell tal-bniedem, l-aktar probabbli fl-istess ħin, aħna se ssolvi l-problema ta 'l-AI. Dan huwa tajjeb ħafna! Jew mhux tajjeb ħafna, jekk inti tfittex, "Terminator 2".

Għaliex huwa viżjoni - huwa diffiċli? Minħabba li l-immaġni tal-istess oġġett jistgħu jvarjaw skond ħafna fuq fatturi esterni. Skont l-oġġett ta 'punti ta' osservazzjoni tfittex differenti.

Per eżempju, l-istess figura, meħuda minn angoli differenti. U dak li huwa aktar interessanti fil-figura tista 'tkun għajn waħda, żewġ għajnejn u nofs. U skont il-kuntest (jekk din id-dehra tal-bniedem fi shirt mal-għajnejn miżbugħa), l-għajn tista 'tkun aktar minn tnejn.

Il-kompjuter għadu ma jifhimx, iżda "jara"

Fattur ieħor li jagħmilha diffiċli - huwa l-dawl. L-istess xena b'dawl differenti se tfittex differenti. daqs oġġett jistgħu jvarjaw. Barra minn hekk, l-oġġetti ta 'kull klassi. Kif tista 'tgħid dwar raġel dak l-għoli tiegħu ta' 2 metri? Xejn. tkabbir tal-bniedem u jista 'jkun 2.3 m, u 80 ċm. Bħal tipi oħra ta' oġġetti, madankollu, huma oġġetti ta 'l-istess klassi.

Partikolarment oġġetti li jgħixu jgħaddu minn varjetà ta 'razez. Hair nies, atleti, annimali. Ħares lejn stampi ta 'żwiemel tmexxija, tistabbilixxi dak li qed jiġri bil mane tagħhom u denb huwa sempliċement impossibbli. A oġġetti li jikkoinċidu fil immaġini? Jekk inti shove immaġni kompjuter, anke il-magna aktar qawwija issib diffikultà biex jagħtu l-aħjar deċiżjoni.

fehma li jmiss - huwa moħbija. Xi oġġetti, l-annimali masquerading bħala l-ambjent, u pjuttost skillfully. U l-istess spots u kulur. Madankollu, naraw minnhom, għalkemm mhux dejjem minn afar.

Problema oħra - il-moviment. Oġġetti fil-mozzjoni inkonċepibbli jgħaddu deformazzjoni.

Ħafna mill-oġġetti huma varjabbli ħafna. Hawnhekk, per eżempju, fil-ritratti żewġ taħt il-għanijiet tal-"siġġu".

U fuq dan inti tista 'tiltaqa. Iżda biex jgħallmu magna, tali li l-affarijiet differenti fil-forma, kulur, materjal, kollox huwa oġġett "siġġu" - huwa diffiċli ħafna. Dan huwa l-isfida. Li jintegraw metodi ta 'viżjoni tal-kompjuter - huwa li jgħallmu magna biex jinftiehem, tanalizza, jispekula.

Integrazzjoni ta 'viżjoni tal-kompjuter fil-pjattaformi varji

Il-massa ta 'viżjoni tal-kompjuter bdew jippenetraw aktar fl-2001, meta hu maħluq l-ewwel ditekter wiċċ. Aħna għamilha żewġ awturi: Viola, Jones. Din kienet l-ewwel mgħaġġel u affidabbli biżżejjed algoritmu, li wera l-qawwa ta 'metodi ta' tagħlim magna.

Issa viżjoni tal-kompjuter jkollhomx biżżejjed applikazzjonijiet prattiċi ġodda - ir-rikonoxximent tal-wiċċ uman.

Iżda biex jirrikonoxxu l-bniedem bħal fil-films - f'angoli każwali, kondizzjonijiet tad-dawl differenti - huwa impossibbli. Iżda biex isolvu l-problema, jew wieħed li nies differenti b'dawl differenti jew differenti joħolqu, simili bħal fil-ritratt fil-passaport, huwa possibbli bi grad għoli ta 'fiduċja.

rekwiżiti fuq ritratt passaport aktar minħabba l-karatteristika ta 'l-algoritmi rikonoxximent wiċċ.

Per eżempju, jekk għandek passaport bijometriku, f'xi ajruporti moderni, tista 'tuża s-sistema awtomatika kontroll tal-passaport.

problema mhux solvuta ta 'viżjoni tal-kompjuter - l-abbiltà li jirrikonoxxu kwalunkwe test

Forsi xi ħadd użati sistema OCR. Waħda minn dawn - Reader Multa, huwa popolari ħafna fis-sistema Runet. Hemm ħafna forom fejn inti timla fid-dejta, huma perfettament skennjati, l-informazzjoni hija rikonoxxuta mis-sistema tajjeb ħafna. Iżda ma 'kwalunkwe test fl-istampa tas-sitwazzjoni hija ħafna agħar. Din il-problema xorta tibqa mhux solvuta.

Logħob jinvolvu viżjoni tal-kompjuter, mozzjoni qbid

kbar żona separata - huwa l-ħolqien ta 'mudelli tridimensjonali u mozzjoni qbid (li huwa implimentat pjuttost b'suċċess fil-logħob tal-kompjuter). L-ewwel programm, li juża viżjoni tal-kompjuter - sistema ta 'interazzjoni mal-kompjuter bl-użu ġesti. Meta ġiet maħluqa kien ħafna affarijiet miftuħa.

L-algoritmu hija mfassla pjuttost sempliċi, iżda biex jiġi kkonfigurat li ħadet biex joħolqu ġeneratur ta 'immaġini sintetiċi ta' persuni biex jiksbu miljun stampi. Supercomputer magħhom biex jagħżlu l-parametri ta 'l-algoritmu, li għalih issa jaħdem tajjeb.

C'est miljun immaġini u Ġimgħa żmien supercomputer jistgħu jingħaddu possibbli li jinħoloq algoritmu li tikkonsma 12% tal-kapaċità ta 'proċessur wieħed u jippermetti lil persuna li jipperċepixxi l-pożizzjoni fil-ħin reali. Din is-sistema Microsoft Kinect (2010).

Fittex għal stampi minn kontenut jippermettilek ittella ritratti għas-sistema, u r-riżultati ta 'dan se jagħti l-istampi bl-istess kontenut u magħmula mill-istess angolu.

Eżempji ta 'viżjoni tal-kompjuter: tridimensjonali u bidimensjonali mapep issa qed isiru magħha. Mapep għall-karozzi tan-navigazzjoni jkunu aġġornati regolarment skond l-DVR.

Hemm database ma 'biljuni ta' ritratti geotagged. Permezz ta 'downloading l-istampa fid-database, inti tista' tiddetermina fejn tkun saret, u anke ma xi perspettiva. Naturalment, dejjem jekk l-post huwa popolari biżżejjed li fl-istess ħin il-turisti u għamlet numru ta 'ritratti taż-żona kien hemm.

robots huma kullimkien

Robotika fil-preżent, kullimkien, mingħajr ma fi kwalunkwe mod. Issa hemm vetturi li jkollhom kameras speċjali li jirrikonoxxu pedestrians u sinjali tat-toroq biex jittrasmettu jikkmanda lis-sewwieq (dan b'mod programm tal-kompjuter biex tara, jgħin lill-sewwieq). U hemm ftit totalment awtomatizzati vetturi robotiċi, iżda dawn ma tistax tibbaża ruħha biss fuq is-sistema video camera mingħajr l-użu ta 'ammont kbir ta' informazzjoni addizzjonali.

kamera Moderna - dan huwa obscura kamera analogu

Ejja nitkellmu dwar l-immaġni diġitali. kameras diġitali moderni huma rranġati fuq il-prinċipju tal-obscura kamera. Biss minflok il-toqba minn fejn dawl jidħol fil-raġġ u proġettata fuq il-ħajt dahar tal-kamra taċ-ċirkwit suġġett, għandna sistema ottika speċjali msejħa l-lenti. għan huwa li jiġbru raġġ ta 'dawl kbira u jikkonvertu hekk li l-raġġi mgħoddi minn punt virtwali sabiex tikseb l-projezzjoni u jiffurmaw immaġni fuq il-film jew matriċi.

kameras diġitali moderna (matriċi) huwa kompost minn elementi individwali - pixels. Kull pixel jista 'jkejjel l-enerġija ta' dawl li huwa inċident fuq it-total pixel, u toħroġ numru output wieħed. Għalhekk, kamera diġitali, irridu jiksbu minflok il-kejl tad-dawl stabbiliti immaġni luminożità, maqbuda fi pixel wieħed - il-kompjuter kamp ta 'vista. Għalhekk, meta l-immaġini naraw mhux flowing linji u kontorni ċari, u grilja ta 'kwadri kkulurita fil-kuluri differenti - pixels.

Hawn taħt għandek tara l-ewwel immaġni diġitali fid-dinja.

Iżda fil din l-istampa ma tkunx? Kulur. X'inhu kulur?

perċezzjoni Psychological ta 'kulur

Kulur - dan huwa dak li naraw. Il-kulur ta 'l waħda u l-istess ħaġa għall-bnedmin u l-qtates se jkun differenti. Minħabba li aħna (bnedmin) u sistema ottika annimali - il-viżjoni hija differenti. Għalhekk, il-kulur - huwa ta 'kwalità psikoloġiku ta' viżjoni tagħna li sseħħ meta josservaw oġġetti u dawl. U mhux proprjetà fiżika tal-oġġett u d-dawl. Kulur - huwa r-riżultat ta 'l-interazzjoni tal-komponenti tad-dawl, u l-xena ta' sistema viżiva tagħna.

Kompjuter programming Viżjoni fil Python jużaw libreriji

Jekk inti iddeċidejt li jidħlu serjament fl-istudju ta 'viżjoni tal-kompjuter, għandhom jippreparaw immedjatament għal numru ta' diffikultajiet, din ix-xjenza mhix l-eħfef u ġlud numru ta 'nases. Imma "Programmar tal-kompjuter Viżjoni fuq il Python" l-awtur ta 'Jannar Erik SOLEMA - ktieb li tiddeskrivi l-lingwa l-aktar sempliċi. Hawnhekk inti ser jiffamiljarizzaw irwieħhom mal-metodi ta 'rikonoxximent ta' oġġetti varji fil 3D, jitgħallmu jaħdmu ma 'l-immaġni stereo, realtà virtwali u applikazzjonijiet oħra ħafna ta' viżjoni tal-kompjuter. Fil-ktieb huma biżżejjed eżempji Python. Iżda l-ispjegazzjonijiet huma ppreżentati, biex ngħidu hekk, ġeneralizzata, sabiex ma overload wisq riċerka u data oġġettiva. Xogħol adattati għall-istudenti, dilettanti, u dilettanti. Niżżel dan il-ktieb u oħrajn dwar il-viżjoni tal-kompjuter (pdf format) jistgħu jkunu fil-netwerk.

Fil-mument, hemm sors miftuħ librerija ta 'algoritmi viżjoni tal-kompjuter u tipproċessa l-immaġini u algoritmi numeriċi OpenCV. Daqs kemm titwettaq aktar lingwi ta 'programmar moderni, huwa sors miftuħ. Jekk nitkellmu dwar il-viżjoni tal-kompjuter, Python użi bħala lingwa ta 'programmar, għandha wkoll l-appoġġ tal-librerija, barra minn hekk, qed tevolvi kontinwament u għandha komunità kbira.

Il-kumpanija "Microsoft" jipprovdi s-servizzi tagħha-Api kapaċi li jħarreġ in-netwerk newrali biex jaħdmu ma 'stampi ta' nies. Hemm ukoll l-opportunità li japplikaw viżjoni tal-kompjuter, Python użi bħala lingwa ta 'programmar.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 mt.delachieve.com. Theme powered by WordPress.