Domů     Objevy
Neuvěřitelný software v praxi: Jak mozek rozpoznává objekty?
Jan Zelenka 25.1.2024

Sedíte, pijete kávu a držíte v ruce časopis (nebo mobil) s tímhle textem. A ani jste se nepodivili nad tím, jak je možné, že jste časopis/mobil ihned vnímali jako časopis/mobil, křeslo si nespletli se stoličkou a bezpečně rozpoznali svůj hrnek. Co na to říká mozek?.

Identifikace objektů se nám zdá jako ta nejvíc samozřejmá věc pod sluncem. Když se nad ní však zamyslíme, na dveře potichu začne klepat úžas. Vezmeme-li v úvahu rozmanité tvary jezevčíků, vlkodavů a rotvajlerů, jak vždycky poznáme, že na nás cení zuby právě pes?

Britský neurovědec David Marr (1945–1980), který navzdory svému krátkému životu dokázal významně ovlivnit svůj obor, přišel s komputační teorií rozpoznávání objektů. V ní rozčleňuje rozpoznávání do několika stádií.

V těch se postupně zpřesňuje reprezentace objektu, v mysli se vytváří jakýsi model reality. Začíná se od naprosto hrubé a přibližné informace až po plné zpodobení a mentální uchopení objektu. Metaforicky si můžete představit malíře, který nejprve jen hrubě načrtne rysy Mony Lisy, až později přidá barvy a celému obrazu dodá živost.

Jak to, že mozek hned pozná zvířata, i když si nejsou moc podobná se skutečnými? foto: Pixabay

Z 2D náčrtu na 3D

Prvním ze stádií Marrovy komputační teorie je primární náčrt. Tento náčrt použije informace z optického vizuálního toku tak, aby zkonstruoval informace o hranách a konturách daného objektu. Z těchto hran a kontur dojde k určení základních tvarů objektů.

Je ale důležité si říci, že se stále pohybujeme ve dvojdimenzionálním zobrazení, nemáme tedy informace o hloubce objektu.

To se začíná měnit ve dvou a půl dimenzionálním náčrtku. Zde se pomocí různých nápovědí přidá do modelu informace o hloubce. Ptáte se, proč se tomuto náčrtu neříká trojdimenzionální náčrt, když de facto obsahuje všechny tři dimenze?

To proto, aby bylo možné odlišit, kdy je reprezentace objektu závislá a nezávislá na úhlu pozorovatele. Ve dvoj a půl dimenzionálním náčrtu totiž pozorovatel vnímá objekt z toho místa, kde je postaven.

Vytvoření modelu a pak porovnání s pamětí

V posledním stádiu – ve trojdimenzionálním náčrtu – naproti tomu člověk vnímá objekt již jako reprezentaci, ke které má přístup ze všech úhlů pohledu. Představte si to tak, že ve specializovaném projektu vytvoříte model nějakého objektu a pak ho můžete svobodně otáčet ve všech směrech.

Takhle nějak vypadá reprezentace objektu v posledním stádiu. Toto odpoutání od úhlu pohledu umožňuje pozorovateli objekt lépe rozpoznat. Kdyby totiž reprezentace objektu zůstala vázána na úhel pohledu pozorovatele, byla by značně variabilní což by znesnadňovalo rozpoznávání.

Když je 3D model vytvořen, stačí jej podle Davida Mara porovnat s 3D reprezentací uloženou v paměti a objekt je rozpoznán.

Mozek nějak rozpoznává objekty a jinak umělá inteligence. foto: Pixabay

36 geonů

Zcela jiný přístup představuje teorie rozpoznávání pomocí komponent od amerického vědce Irvinga Biedermana (1939 – 2022). Ten uvažoval následovně: Každý objekt se dá rozložit na několik málo tvarů, ze kterých je složen.

Například hrnek se dá rozložit na válec a oblouk (ouško hrnku), který je k němu připojen. Těmto tvarům dal Biederman název geony a vymyslel jich celkem 36.

Podle Biedermana probíhá proces rozpoznávání objektu následovně: Nejprve dojde k určení hran objektu a rozhodnutí, jak by se objekt měl rozložit na jednotlivé geony. Poté jsou určeny vztahy mezi jednotlivými geony.

Tedy například to, na jakém místě je k válci hrnku připojen oblouk jeho ouška. Poté se tato reprezentace porovná s reprezentacemi uloženými v paměti.

Zatímco Marrova teorie předpokládá, že rozpoznávání závisí na úhlu pohledu, klíčovou predikcí teorie geonů je, že rozpoznávání je nezávislé na úhlu pohledu, a je ztížené jen tehdy, pokud je nějaký geon zakryt.

To znamená, že byste například jízdní kolo měli rozpoznat stejně snadno a rychle ať už byste se na něj dívali z boku, zepředu nebo zespoda.

Teorie a platnost

Jak jsou na tom vědecká zjištění ohledně těchto předpokladů? Obecně se dá říci, že spíše než abychom jasně stanovili, zda je rozpoznávání závislé na úhlu pohledu, můžeme mluvit o tom kdy takové je a kdy nikoliv.

Ukazuje se, že orientace objektu, tedy změna úhlu pohledu pro pozorovatele, změní aktivitu mozku brzy po prezentaci objektu. To napovídá tomu, že by vnímání mohlo být závislé na úhlu pohledu pouze v prvních chvílích, což nápadně připomíná rozčlenění rozpoznávání objektu na stádia podle Marrovy teorie.

Také se ukazuje, že rozpoznávání je nezávislé na úhlu pohledu, když jde o známé objekty. A také když určujeme kategorii objektů, tedy rozlišujeme psy od koček, spíše než když provádíme identifikaci v rámci jedné kategorie, tedy určujeme, zda jde o pudla, nebo ratlíka.

Uvedené teorie jsou zkrátka jen… teorie. To znamená, že si nemůžeme být jisti jejich platností a na jejich prověření ještě budeme čekat. Spíše tak můžete vzít teorie jako jakýsi nástroj, jakým uchopit realitu.

Související články
Přesnější a rychlejší mapování znečištění vodních ploch i lepší ovládání pasivních hladinových plavidel tažených lodí byly hlavní cíle projektů kooperace robotických dronů vyvíjených Skupinou multirobotických systémů FEL ČVUT (MRS) a autonomně řízených lodí. Výsledky představili výzkumníci před pár dny u břehů vodní nádrže Orlík. Nad hladinu a okolní louky se vzneslo během soustřední v minulých dnech […]
Sto let vzbuzuje italská zkamenělina plaza úžas, zejména svou výjimečně zachovalou kůží, která se u fosilií starých 280 milionů let takřka nevidí. Psalo se o ni v knihách i článcích, až nyní ji ale vědci poprvé prozkoumali nejmodernější technologií. O překvapení nebylo nouze – a nepatřila vždy k nejpříjemnějším. Už od svého objevu v Itálii roku 1931 […]
Ve svém nejmenším provedení měří 11–13 milimetrů. Je tedy tak akorát drobný, aby se vešel do trávicího ústrojí. Řeč však není o žádné bakterii, ale o unikátním vynálezu vědců z Univerzity v Novém Jižním Walesu, který dokáže tisknout efektivní náhrady tkáně přímo v lidském těle. Nový chirurgický nástroj pojmenovali u protinožců jako F3DB, což je […]
Byla to senzace, když v roce 2003 na indonéském ostrově Flores našli vědci kosterní pozůstatky asi metr vysokého humanoida. Právě kvůli výšce se mu začalo přezdívat hobit. Kdo byli tito lidé ale zač? Trpěli záhadnou nemocí, v jejímž důsledku se zmenšili, jak si experti myslí? Oficiálně jde o člověka floreského (Homo floresiensis), mnohem více se však uchytilo […]
V každém krajském městě sbírali vědci klíšťata v parcích a zjišťovali, nakolik jsou pro člověka nebezpečná. Nyní vyhodnotili výsledky za loňskou sezonu a vyplynulo z nich, že klíšťata v městských parcích jsou infikovaná víc než ta v přírodě. U každého čtvrtého klíštěte byly nalezeny bakterie způsobující lymeskou borreliózu. V řadě parků pak bylo borrelií infikováno i více než 30 […]
reklama
Nejčtenější články
za poslední
24 hodin    3 dny    týden
reklama
Nenechte si ujít další zajímavé články
reklama
Copyright © RF-Hobby.cz