Domů     Objevy
Neuvěřitelný software v praxi: Jak mozek rozpoznává objekty?
Jan Zelenka 25.1.2024

Sedíte, pijete kávu a držíte v ruce časopis (nebo mobil) s tímhle textem. A ani jste se nepodivili nad tím, jak je možné, že jste časopis/mobil ihned vnímali jako časopis/mobil, křeslo si nespletli se stoličkou a bezpečně rozpoznali svůj hrnek. Co na to říká mozek?.

Identifikace objektů se nám zdá jako ta nejvíc samozřejmá věc pod sluncem. Když se nad ní však zamyslíme, na dveře potichu začne klepat úžas. Vezmeme-li v úvahu rozmanité tvary jezevčíků, vlkodavů a rotvajlerů, jak vždycky poznáme, že na nás cení zuby právě pes?

Britský neurovědec David Marr (1945–1980), který navzdory svému krátkému životu dokázal významně ovlivnit svůj obor, přišel s komputační teorií rozpoznávání objektů. V ní rozčleňuje rozpoznávání do několika stádií.

V těch se postupně zpřesňuje reprezentace objektu, v mysli se vytváří jakýsi model reality. Začíná se od naprosto hrubé a přibližné informace až po plné zpodobení a mentální uchopení objektu. Metaforicky si můžete představit malíře, který nejprve jen hrubě načrtne rysy Mony Lisy, až později přidá barvy a celému obrazu dodá živost.

Jak to, že mozek hned pozná zvířata, i když si nejsou moc podobná se skutečnými? foto: Pixabay

Z 2D náčrtu na 3D

Prvním ze stádií Marrovy komputační teorie je primární náčrt. Tento náčrt použije informace z optického vizuálního toku tak, aby zkonstruoval informace o hranách a konturách daného objektu. Z těchto hran a kontur dojde k určení základních tvarů objektů.

Je ale důležité si říci, že se stále pohybujeme ve dvojdimenzionálním zobrazení, nemáme tedy informace o hloubce objektu.

To se začíná měnit ve dvou a půl dimenzionálním náčrtku. Zde se pomocí různých nápovědí přidá do modelu informace o hloubce. Ptáte se, proč se tomuto náčrtu neříká trojdimenzionální náčrt, když de facto obsahuje všechny tři dimenze?

To proto, aby bylo možné odlišit, kdy je reprezentace objektu závislá a nezávislá na úhlu pozorovatele. Ve dvoj a půl dimenzionálním náčrtu totiž pozorovatel vnímá objekt z toho místa, kde je postaven.

Vytvoření modelu a pak porovnání s pamětí

V posledním stádiu – ve trojdimenzionálním náčrtu – naproti tomu člověk vnímá objekt již jako reprezentaci, ke které má přístup ze všech úhlů pohledu. Představte si to tak, že ve specializovaném projektu vytvoříte model nějakého objektu a pak ho můžete svobodně otáčet ve všech směrech.

Takhle nějak vypadá reprezentace objektu v posledním stádiu. Toto odpoutání od úhlu pohledu umožňuje pozorovateli objekt lépe rozpoznat. Kdyby totiž reprezentace objektu zůstala vázána na úhel pohledu pozorovatele, byla by značně variabilní což by znesnadňovalo rozpoznávání.

Když je 3D model vytvořen, stačí jej podle Davida Mara porovnat s 3D reprezentací uloženou v paměti a objekt je rozpoznán.

Mozek nějak rozpoznává objekty a jinak umělá inteligence. foto: Pixabay

36 geonů

Zcela jiný přístup představuje teorie rozpoznávání pomocí komponent od amerického vědce Irvinga Biedermana (1939 – 2022). Ten uvažoval následovně: Každý objekt se dá rozložit na několik málo tvarů, ze kterých je složen.

Například hrnek se dá rozložit na válec a oblouk (ouško hrnku), který je k němu připojen. Těmto tvarům dal Biederman název geony a vymyslel jich celkem 36.

Podle Biedermana probíhá proces rozpoznávání objektu následovně: Nejprve dojde k určení hran objektu a rozhodnutí, jak by se objekt měl rozložit na jednotlivé geony. Poté jsou určeny vztahy mezi jednotlivými geony.

Tedy například to, na jakém místě je k válci hrnku připojen oblouk jeho ouška. Poté se tato reprezentace porovná s reprezentacemi uloženými v paměti.

Zatímco Marrova teorie předpokládá, že rozpoznávání závisí na úhlu pohledu, klíčovou predikcí teorie geonů je, že rozpoznávání je nezávislé na úhlu pohledu, a je ztížené jen tehdy, pokud je nějaký geon zakryt.

To znamená, že byste například jízdní kolo měli rozpoznat stejně snadno a rychle ať už byste se na něj dívali z boku, zepředu nebo zespoda.

Teorie a platnost

Jak jsou na tom vědecká zjištění ohledně těchto předpokladů? Obecně se dá říci, že spíše než abychom jasně stanovili, zda je rozpoznávání závislé na úhlu pohledu, můžeme mluvit o tom kdy takové je a kdy nikoliv.

Ukazuje se, že orientace objektu, tedy změna úhlu pohledu pro pozorovatele, změní aktivitu mozku brzy po prezentaci objektu. To napovídá tomu, že by vnímání mohlo být závislé na úhlu pohledu pouze v prvních chvílích, což nápadně připomíná rozčlenění rozpoznávání objektu na stádia podle Marrovy teorie.

Také se ukazuje, že rozpoznávání je nezávislé na úhlu pohledu, když jde o známé objekty. A také když určujeme kategorii objektů, tedy rozlišujeme psy od koček, spíše než když provádíme identifikaci v rámci jedné kategorie, tedy určujeme, zda jde o pudla, nebo ratlíka.

Uvedené teorie jsou zkrátka jen… teorie. To znamená, že si nemůžeme být jisti jejich platností a na jejich prověření ještě budeme čekat. Spíše tak můžete vzít teorie jako jakýsi nástroj, jakým uchopit realitu.

Související články
Jen v Česku si míchu poraní až tři stovky lidí ročně. Následky narušení tohoto křehkého spletence nervových vláken jsou zpravidla nevratné. Anebo ne? Kristýna Kárová z Ústavu experimentální medicíny AV ČR se možnostmi regenerace axonů po míšním poranění intenzivně zabývá. Potřebuju podrbat na nose, vyhodnotí mozek a vyšle motorickou drahou míchy signál do svalů ruky, […]
Na dně moře u japonského pobřeží bylo objeveno gigantické naleziště klíčových prvků pro výrobu baterií do elektromobilů, ložisko niklu a kobaltu. První vrty u ostrova Minami-Torišima budou zahájeny příští rok. Využívání ložiska v průmyslovém měřítku má být zahájeno v roce 2026. Podle nadace The Nippon Foundation, která v posledních měsících zkoumala mořské dno u ostrova […]
Bezmála tři století víme, že blesk je elektrický výboj. Stále ale není jasné, jak přesně vzniká, a není možné jej předpovědět. Přispět k vyřešení bouřkové hádanky by mohl model elektrizace oblačnosti, na jehož vývoji pracuje Jana Popová z Ústavu fyziky atmosféry AV ČR. Většinou blesky vznikají v bouřkovém oblaku, který se nazývá cumulonimbus. Známe ho […]
V době spuštění obsadil 40. příčku mezi pětistovkou nejvýkonnějších superpočítačů světa. Teď český superpočítač Salomon definitivně opouští datový sál IT4Innovations národního superpočítačového centra, které je součástí VŠB – Technické univerzity Ostrava. Výzkumných projektů bylo za dobu provozu Salomonu v období 15. září 2015 až 13. prosince 2021 celkově 1 085, spotřebovaly celkem 1 024 milionů jádrohodin výpočetního času a […]
Ta zpráva mohla vyděsit tisíce lidí, kteří zamíří v létě na Jadran. Kvůli oteplování moře se u pobřeží Černé Hory, zejména v moři u pláží v okolí Budvy, objevili mnohoštětinatci známí jako ohniví červi. Prý jsou jedovatí. Prý pouhý dotyk může lidem způsobit zdravotní obtíže. Mnohoštětinatec Hermodice carunculata, přezdívaný jako ohnivý červ kvůli zbarvení, způsobil […]
reklama
Nejčtenější články
za poslední
24 hodin    3 dny    týden
reklama
Nenechte si ujít další zajímavé články
reklama
Copyright © RF-Hobby.cz