Domů     Objevy
Neuvěřitelný software v praxi: Jak mozek rozpoznává objekty?
Jan Zelenka 25.1.2024

Sedíte, pijete kávu a držíte v ruce časopis (nebo mobil) s tímhle textem. A ani jste se nepodivili nad tím, jak je možné, že jste časopis/mobil ihned vnímali jako časopis/mobil, křeslo si nespletli se stoličkou a bezpečně rozpoznali svůj hrnek. Co na to říká mozek?.

Identifikace objektů se nám zdá jako ta nejvíc samozřejmá věc pod sluncem. Když se nad ní však zamyslíme, na dveře potichu začne klepat úžas. Vezmeme-li v úvahu rozmanité tvary jezevčíků, vlkodavů a rotvajlerů, jak vždycky poznáme, že na nás cení zuby právě pes?

Britský neurovědec David Marr (1945–1980), který navzdory svému krátkému životu dokázal významně ovlivnit svůj obor, přišel s komputační teorií rozpoznávání objektů. V ní rozčleňuje rozpoznávání do několika stádií.

V těch se postupně zpřesňuje reprezentace objektu, v mysli se vytváří jakýsi model reality. Začíná se od naprosto hrubé a přibližné informace až po plné zpodobení a mentální uchopení objektu. Metaforicky si můžete představit malíře, který nejprve jen hrubě načrtne rysy Mony Lisy, až později přidá barvy a celému obrazu dodá živost.

Jak to, že mozek hned pozná zvířata, i když si nejsou moc podobná se skutečnými? foto: Pixabay

Z 2D náčrtu na 3D

Prvním ze stádií Marrovy komputační teorie je primární náčrt. Tento náčrt použije informace z optického vizuálního toku tak, aby zkonstruoval informace o hranách a konturách daného objektu. Z těchto hran a kontur dojde k určení základních tvarů objektů.

Je ale důležité si říci, že se stále pohybujeme ve dvojdimenzionálním zobrazení, nemáme tedy informace o hloubce objektu.

To se začíná měnit ve dvou a půl dimenzionálním náčrtku. Zde se pomocí různých nápovědí přidá do modelu informace o hloubce. Ptáte se, proč se tomuto náčrtu neříká trojdimenzionální náčrt, když de facto obsahuje všechny tři dimenze?

To proto, aby bylo možné odlišit, kdy je reprezentace objektu závislá a nezávislá na úhlu pozorovatele. Ve dvoj a půl dimenzionálním náčrtu totiž pozorovatel vnímá objekt z toho místa, kde je postaven.

Vytvoření modelu a pak porovnání s pamětí

V posledním stádiu – ve trojdimenzionálním náčrtu – naproti tomu člověk vnímá objekt již jako reprezentaci, ke které má přístup ze všech úhlů pohledu. Představte si to tak, že ve specializovaném projektu vytvoříte model nějakého objektu a pak ho můžete svobodně otáčet ve všech směrech.

Takhle nějak vypadá reprezentace objektu v posledním stádiu. Toto odpoutání od úhlu pohledu umožňuje pozorovateli objekt lépe rozpoznat. Kdyby totiž reprezentace objektu zůstala vázána na úhel pohledu pozorovatele, byla by značně variabilní což by znesnadňovalo rozpoznávání.

Když je 3D model vytvořen, stačí jej podle Davida Mara porovnat s 3D reprezentací uloženou v paměti a objekt je rozpoznán.

Mozek nějak rozpoznává objekty a jinak umělá inteligence. foto: Pixabay

36 geonů

Zcela jiný přístup představuje teorie rozpoznávání pomocí komponent od amerického vědce Irvinga Biedermana (1939 – 2022). Ten uvažoval následovně: Každý objekt se dá rozložit na několik málo tvarů, ze kterých je složen.

Například hrnek se dá rozložit na válec a oblouk (ouško hrnku), který je k němu připojen. Těmto tvarům dal Biederman název geony a vymyslel jich celkem 36.

Podle Biedermana probíhá proces rozpoznávání objektu následovně: Nejprve dojde k určení hran objektu a rozhodnutí, jak by se objekt měl rozložit na jednotlivé geony. Poté jsou určeny vztahy mezi jednotlivými geony.

Tedy například to, na jakém místě je k válci hrnku připojen oblouk jeho ouška. Poté se tato reprezentace porovná s reprezentacemi uloženými v paměti.

Zatímco Marrova teorie předpokládá, že rozpoznávání závisí na úhlu pohledu, klíčovou predikcí teorie geonů je, že rozpoznávání je nezávislé na úhlu pohledu, a je ztížené jen tehdy, pokud je nějaký geon zakryt.

To znamená, že byste například jízdní kolo měli rozpoznat stejně snadno a rychle ať už byste se na něj dívali z boku, zepředu nebo zespoda.

Teorie a platnost

Jak jsou na tom vědecká zjištění ohledně těchto předpokladů? Obecně se dá říci, že spíše než abychom jasně stanovili, zda je rozpoznávání závislé na úhlu pohledu, můžeme mluvit o tom kdy takové je a kdy nikoliv.

Ukazuje se, že orientace objektu, tedy změna úhlu pohledu pro pozorovatele, změní aktivitu mozku brzy po prezentaci objektu. To napovídá tomu, že by vnímání mohlo být závislé na úhlu pohledu pouze v prvních chvílích, což nápadně připomíná rozčlenění rozpoznávání objektu na stádia podle Marrovy teorie.

Také se ukazuje, že rozpoznávání je nezávislé na úhlu pohledu, když jde o známé objekty. A také když určujeme kategorii objektů, tedy rozlišujeme psy od koček, spíše než když provádíme identifikaci v rámci jedné kategorie, tedy určujeme, zda jde o pudla, nebo ratlíka.

Uvedené teorie jsou zkrátka jen… teorie. To znamená, že si nemůžeme být jisti jejich platností a na jejich prověření ještě budeme čekat. Spíše tak můžete vzít teorie jako jakýsi nástroj, jakým uchopit realitu.

Související články
Evropská unie učinila další krok směrem k posílení evropské kvantové výpočetní infrastruktury podpisem smlouvy na pořízení kvantového počítače konsorcia LUMI-Q, který bude umístěn v České republice, konkrétně v IT4Innovations národním superpočítačovém centru v Ostravě, které je součástí VŠB – Technické univerzity Ostrava. Smlouva byla podepsána mezi Společným evropským podnikem pro vysoce výkonné počítání (EuroHPC JU) […]
Co je hořké, to se nejí. Tento reflex v sobě máme hluboce zakořeněný. Asi třetina lidí však nevnímá určitý typ hořkosti. Můžou za to geny, které zásadně ovlivňují i další chutě. Jídlo přináší požitek, ale někdy také riziko. Proto nás příroda vybavila chuťovými a čichovými receptory, které mají za úkol včas odhalit jedovatou a zkaženou potravu. […]
Narození zdravého dítěte není zdaleka taková samozřejmost, jak by se mohlo zdát. Jen zhruba každé třetí počaté lidské embryo je schopno dát vzniknout těhotenství, které je zakončeno příchodem dítěte na svět. Nejranější fáze lidského života jsou totiž plné překážek, které ne každý zárodek dovede překonat. Aktuální výzkum českých vědců publikovaný v prestižním vědeckém časopise Nature Communications […]
Suché akademické definice říkají: Priming je experimentální rámec, ve kterém zpracování počátečního stimulu ovlivní odpověď na stimul následující. Jak tuto obtížně stravitelnou větu pochopit? Představte si, že uvidíte na dovolené v Maroku varování před hady. Jdete si tak křovinatou krajinou v podhůří Atlasu, když v tom sebou trhnete – zahlédli jste hada! Vzápětí se ale zasmějete – jednalo […]
Výzkumný tým Pavla Plevky z institutu CEITEC Masarykovy univerzity popsal strukturu a replikační cyklus bakteriofága, který si dokáže bez problémů poradit s bakterií, proti níž přestávají působit existující antibiotika. Je to obrovská naděje pro lidi s oslabenou imunitou nebo chronickým onemocněním, jimž hrozí vážné infekce. Bakteriofágy jsou viry, které se množí v bakteriálních buňkách. Když […]
reklama
Nejčtenější články
za poslední
24 hodin    3 dny    týden
reklama
Nenechte si ujít další zajímavé články
reklama
Copyright © RF-Hobby.cz
Provozovatel: RF HOBBY, s. r. o., Bohdalecká 6/1420, 101 00 Praha 10, IČO: 26155672, tel.: 420 281 090 611, e-mail: sekretariat@rf-hobby.cz