Nola interpretatzen dute irudi bat?
Pertsona batek irudi bat ikusten duenean, normalean berehala antzematen ditu aurpegiak, objektuak, mugimenduak edo egoerak. Makina batek, ordea, ez du ulermen hori modu naturalean: irudi bat zenbakiz osatutako sare gisa tratatzen du.
Pixel bakoitzak balio jakin bat dauka, eta sistema batek balio horien arteko harremanak aztertzen ditu. Horrela, ertzak, kolore aldaketak, formak edo ehundurak bezalako arrastoak identifikatzen hasten da. Ez du "txakur bat" ulertzen guk bezala, baina txakur askoren irudiak ikusita, antzeko patroiekin lotzen ikasten du.
Ikusmen artifiziala ez da benetako ikusmena
Sistema batek irudi bat sailka dezake oso modu eraginkorrean, baina horrek ez du esan nahi benetan ulertzen duenik irudi horretan zer gertatzen den. Maiz, datuetan ikasitako patroien arabera ari da soilik.
Kontzeptu klabeak
Irudi digital baten oinarrizko puntuak dira; makinak hasieran hori baino ez du ikusten.
Ertzak, koloreak, formak edo ehundurak bezalako arrasto bisualak dira.
Adibide askotan errepikatzen diren antzekotasunak, objektuak bereizteko balio dutenak.
Irudi bati kategoria bat esleitzea, adibidez "autoa", "txakurra" edo "seinale bat".
Nola aztertzen dute irudi bat?
Sistemak irudia pixel multzo gisa hartzen du, kolore edo intentsitate balioekin.
Ertzak, forma sinpleak, lerroak edo errepikapenak bezalako arrasto bisualak identifikatzen ditu.
Aurreko adibideetan ikasitakoarekin konparatzen du ea antzekotasunik dagoen ikusteko.
Azkenik, probabilitate baten arabera erabakitzen du zer ageri den edo zer elementu dauden.
Sistemak etiketa edo detekzio bat itzultzen du, baina emaitza hori ez da beti zuzena izango.
🔬 Bisualizadore interaktiboa
Ikusi zuzenean nola analizatzen duen makina batek irudi bat, pauso bakoitzean zer gertatzen den ulertzeko. Kargatu irudi bat edo erabili adibidea eta sakatu "Analisia hasi".
Irudia sartu
Analisi pausoak
1. Pixelak
Makina batek pixelak zenbaki gisa ikusten ditu.
2. Ertzak
Koloreen aldaketak detektatzen ditu.
3. Patroiak
Ertzak eta formak konbinatzen ditu.
4-5. Emaitza
Sistemak probabilitatea esleituko dio.
Eguneroko adibide errealak
Gailuak aurpegiko ezaugarri jakin batzuk detektatzen ditu desblokeatzeko.
Galeria aplikazioek pertsonak, animaliak edo paisaiak automatikoki antzeman ditzakete.
Kameraren bidez errepidea, seinaleak edo oinezkoak identifikatzen saiatzen dira.
Produktu batean akatsak edo forma desegokiak automatikoki detektatzeko erabiltzen da.
Mugak eta arriskuak
Ikusmen artifizialeko sistemek huts egin dezakete irudia iluna bada, angelua arraroa bada, kalitatea txarra bada edo entrenamendu datuak mugatuak badira. Horrek esan nahi du egoera berrietan edo baldintza zailagoetan emaitzak ez direla beti fidagarriak.
Gainera, entrenamendu irudietan aniztasun falta badago, sistema batzuek pertsona edo egoera batzuekin beste batzuekin baino hobeto funtzionatuko dute. Horregatik, datuen kalitatea eta ordezkaritza funtsezkoak dira.
Makina vs pertsona
Makinek pixelak balio numeriko gisa tratatzen dute; pertsonek esanahia eta testuingurua lotzen dituzte.
Makinek patroi ikasiak erabiltzen dituzte; pertsonek esperientzia zabalagoa eta ulermena.
Makinek gehiago sufri dezakete aurretik ikusi ez duten egoera baten aurrean.
Makinek ziurtasunez huts egin dezakete; pertsonek ere huts egiten dute, baina testuingurua hobeto erabiltzen dute.
Hausnartu
Pentsatu gaur egun erabiltzen duzun tresna batean: mugikorreko kamera, sare sozial bat edo garraio-sistema bat. Non egon daiteke ikusmen artifiziala lanean? Zer arrasto edo patroi bilatuko lituzke makina batek egoera horretan?
Mini-quiza
Makinak irudi bat datu numeriko gisa tratatzen du hasieran; hortik abiatzen da patroien azterketa.
Irudi txarrak, baldintza zailak edo entrenamendu datu pobreek sistemaren zehaztasuna asko murriztu dezakete.
Glosarioa
Irudi digital baten oinarrizko unitatea.
Irudi batean antzematen den arrasto bisuala, adibidez ertza edo forma.
Irudi bati kategoria bat esleitzea, esaterako "txakurra" edo "autoa".
Makinek irudiak eta bideoak aztertzeko erabiltzen duten AA arloa.
Irudi askotan errepikatzen den egitura edo antzekotasuna, identifikazioa errazten duena.