Domů     Objevy
Neuvěřitelný software v praxi: Jak mozek rozpoznává objekty?
Jan Zelenka 25.1.2024

Sedíte, pijete kávu a držíte v ruce časopis (nebo mobil) s tímhle textem. A ani jste se nepodivili nad tím, jak je možné, že jste časopis/mobil ihned vnímali jako časopis/mobil, křeslo si nespletli se stoličkou a bezpečně rozpoznali svůj hrnek. Co na to říká mozek?.

Identifikace objektů se nám zdá jako ta nejvíc samozřejmá věc pod sluncem. Když se nad ní však zamyslíme, na dveře potichu začne klepat úžas. Vezmeme-li v úvahu rozmanité tvary jezevčíků, vlkodavů a rotvajlerů, jak vždycky poznáme, že na nás cení zuby právě pes?

Britský neurovědec David Marr (1945–1980), který navzdory svému krátkému životu dokázal významně ovlivnit svůj obor, přišel s komputační teorií rozpoznávání objektů. V ní rozčleňuje rozpoznávání do několika stádií.

V těch se postupně zpřesňuje reprezentace objektu, v mysli se vytváří jakýsi model reality. Začíná se od naprosto hrubé a přibližné informace až po plné zpodobení a mentální uchopení objektu. Metaforicky si můžete představit malíře, který nejprve jen hrubě načrtne rysy Mony Lisy, až později přidá barvy a celému obrazu dodá živost.

Jak to, že mozek hned pozná zvířata, i když si nejsou moc podobná se skutečnými? foto: Pixabay

Z 2D náčrtu na 3D

Prvním ze stádií Marrovy komputační teorie je primární náčrt. Tento náčrt použije informace z optického vizuálního toku tak, aby zkonstruoval informace o hranách a konturách daného objektu. Z těchto hran a kontur dojde k určení základních tvarů objektů.

Je ale důležité si říci, že se stále pohybujeme ve dvojdimenzionálním zobrazení, nemáme tedy informace o hloubce objektu.

To se začíná měnit ve dvou a půl dimenzionálním náčrtku. Zde se pomocí různých nápovědí přidá do modelu informace o hloubce. Ptáte se, proč se tomuto náčrtu neříká trojdimenzionální náčrt, když de facto obsahuje všechny tři dimenze?

To proto, aby bylo možné odlišit, kdy je reprezentace objektu závislá a nezávislá na úhlu pozorovatele. Ve dvoj a půl dimenzionálním náčrtu totiž pozorovatel vnímá objekt z toho místa, kde je postaven.

Vytvoření modelu a pak porovnání s pamětí

V posledním stádiu – ve trojdimenzionálním náčrtu – naproti tomu člověk vnímá objekt již jako reprezentaci, ke které má přístup ze všech úhlů pohledu. Představte si to tak, že ve specializovaném projektu vytvoříte model nějakého objektu a pak ho můžete svobodně otáčet ve všech směrech.

Takhle nějak vypadá reprezentace objektu v posledním stádiu. Toto odpoutání od úhlu pohledu umožňuje pozorovateli objekt lépe rozpoznat. Kdyby totiž reprezentace objektu zůstala vázána na úhel pohledu pozorovatele, byla by značně variabilní což by znesnadňovalo rozpoznávání.

Když je 3D model vytvořen, stačí jej podle Davida Mara porovnat s 3D reprezentací uloženou v paměti a objekt je rozpoznán.

Mozek nějak rozpoznává objekty a jinak umělá inteligence. foto: Pixabay

36 geonů

Zcela jiný přístup představuje teorie rozpoznávání pomocí komponent od amerického vědce Irvinga Biedermana (1939 – 2022). Ten uvažoval následovně: Každý objekt se dá rozložit na několik málo tvarů, ze kterých je složen.

Například hrnek se dá rozložit na válec a oblouk (ouško hrnku), který je k němu připojen. Těmto tvarům dal Biederman název geony a vymyslel jich celkem 36.

Podle Biedermana probíhá proces rozpoznávání objektu následovně: Nejprve dojde k určení hran objektu a rozhodnutí, jak by se objekt měl rozložit na jednotlivé geony. Poté jsou určeny vztahy mezi jednotlivými geony.

Tedy například to, na jakém místě je k válci hrnku připojen oblouk jeho ouška. Poté se tato reprezentace porovná s reprezentacemi uloženými v paměti.

Zatímco Marrova teorie předpokládá, že rozpoznávání závisí na úhlu pohledu, klíčovou predikcí teorie geonů je, že rozpoznávání je nezávislé na úhlu pohledu, a je ztížené jen tehdy, pokud je nějaký geon zakryt.

To znamená, že byste například jízdní kolo měli rozpoznat stejně snadno a rychle ať už byste se na něj dívali z boku, zepředu nebo zespoda.

Teorie a platnost

Jak jsou na tom vědecká zjištění ohledně těchto předpokladů? Obecně se dá říci, že spíše než abychom jasně stanovili, zda je rozpoznávání závislé na úhlu pohledu, můžeme mluvit o tom kdy takové je a kdy nikoliv.

Ukazuje se, že orientace objektu, tedy změna úhlu pohledu pro pozorovatele, změní aktivitu mozku brzy po prezentaci objektu. To napovídá tomu, že by vnímání mohlo být závislé na úhlu pohledu pouze v prvních chvílích, což nápadně připomíná rozčlenění rozpoznávání objektu na stádia podle Marrovy teorie.

Také se ukazuje, že rozpoznávání je nezávislé na úhlu pohledu, když jde o známé objekty. A také když určujeme kategorii objektů, tedy rozlišujeme psy od koček, spíše než když provádíme identifikaci v rámci jedné kategorie, tedy určujeme, zda jde o pudla, nebo ratlíka.

Uvedené teorie jsou zkrátka jen… teorie. To znamená, že si nemůžeme být jisti jejich platností a na jejich prověření ještě budeme čekat. Spíše tak můžete vzít teorie jako jakýsi nástroj, jakým uchopit realitu.

Související články
Medicína Objevy 20.1.2025
Hojení ran je klíčovým biologickým procesem, který umožňuje tělu regenerovat poškozené tkáně a obnovit svou funkčnost. Nedávný výzkum však odhalil překvapující skutečnost – mechanismy, které stojí za hojením ran, mají mnoho společného s procesy, které vedou k růstu a šíření rakovinných buněk. Tento objev otevírá nové možnosti pro léčbu nejen chronických ran, ale i rakoviny […]
Objevy Příroda 16.1.2025
Před sedmi lety zaujal Lenku Caisovou z Biologického centra Akademie věd ČR při procházce v přírodě nenápadný, ale velmi zvláštní mech. Při podrobnější laboratorní analýze vědkyně odhalila, že se nejedná o mech, ale o dosud neznámou, mnohobuněčnou zelenou řasu. Pojmenovala ji Draparnaldia erecta a záhy rozpoznala její potenciál stát se mimořádně zajímavým výzkumným objektem pro […]
Objevy Zajímavosti 15.1.2025
Jako Jekyll a Hyde se chovají některé materiály. Mezinárodní tým Hanuše Seinera z Ústavu termomechaniky AV ČR zjistil, že v některých směrech je slitina niklu, manganu a galia schopna přenášet elastické vlny rychleji než ocel, v jiných směrech se však pulzy šíří pomaleji než ve vzduchu. Aby vědci popsali chování slitiny, museli ji rozklíčovat atom […]
Říká se mu velbloud rostlinné říše, protože je suchovzdorný, což je při současných klimatických změnách u plodin nedocenitelnou vlastností. Čirok v naší zemi zatím málo známe, ale je pátou nejpěstovanější obilninou světa. Čirok je v České republice proti majoritním obilninám – pšenici, rýži a kukuřici, zatím okrajový, globálně však představuje významnou zemědělskou plodinu. Základem výživy […]
Objevy Příroda 13.1.2025
Objev, který nadchl paleontology po celém světě, přinesla sibiřská věčně zmrzlá půda. V permafrostu bylo nalezeno mimořádně dobře zachovalé mládě šavlozubé kočky, které žilo před přibližně 32 000 lety. Tento objev umožňuje vědcům poprvé nahlédnout do skutečného vzhledu dávného predátora, o němž dosud měli k dispozici pouze fosilizované kosti a otisky tlap. „Byla jsem naprosto […]
reklama
Nejčtenější články
za poslední
24 hodin    3 dny    týden
reklama
Nenechte si ujít další zajímavé články
reklama
Copyright © RF-Hobby.cz
Provozovatel: RF HOBBY, s. r. o., Bohdalecká 6/1420, 101 00 Praha 10, IČO: 26155672, tel.: 420 281 090 611, e-mail: sekretariat@rf-hobby.cz