Domů     Objevy
Neuvěřitelný software v praxi: Jak mozek rozpoznává objekty?
Jan Zelenka 25.1.2024

Sedíte, pijete kávu a držíte v ruce časopis (nebo mobil) s tímhle textem. A ani jste se nepodivili nad tím, jak je možné, že jste časopis/mobil ihned vnímali jako časopis/mobil, křeslo si nespletli se stoličkou a bezpečně rozpoznali svůj hrnek. Co na to říká mozek?.

Identifikace objektů se nám zdá jako ta nejvíc samozřejmá věc pod sluncem. Když se nad ní však zamyslíme, na dveře potichu začne klepat úžas. Vezmeme-li v úvahu rozmanité tvary jezevčíků, vlkodavů a rotvajlerů, jak vždycky poznáme, že na nás cení zuby právě pes?

Britský neurovědec David Marr (1945–1980), který navzdory svému krátkému životu dokázal významně ovlivnit svůj obor, přišel s komputační teorií rozpoznávání objektů. V ní rozčleňuje rozpoznávání do několika stádií.

V těch se postupně zpřesňuje reprezentace objektu, v mysli se vytváří jakýsi model reality. Začíná se od naprosto hrubé a přibližné informace až po plné zpodobení a mentální uchopení objektu. Metaforicky si můžete představit malíře, který nejprve jen hrubě načrtne rysy Mony Lisy, až později přidá barvy a celému obrazu dodá živost.

Jak to, že mozek hned pozná zvířata, i když si nejsou moc podobná se skutečnými? foto: Pixabay

Z 2D náčrtu na 3D

Prvním ze stádií Marrovy komputační teorie je primární náčrt. Tento náčrt použije informace z optického vizuálního toku tak, aby zkonstruoval informace o hranách a konturách daného objektu. Z těchto hran a kontur dojde k určení základních tvarů objektů.

Je ale důležité si říci, že se stále pohybujeme ve dvojdimenzionálním zobrazení, nemáme tedy informace o hloubce objektu.

To se začíná měnit ve dvou a půl dimenzionálním náčrtku. Zde se pomocí různých nápovědí přidá do modelu informace o hloubce. Ptáte se, proč se tomuto náčrtu neříká trojdimenzionální náčrt, když de facto obsahuje všechny tři dimenze?

To proto, aby bylo možné odlišit, kdy je reprezentace objektu závislá a nezávislá na úhlu pozorovatele. Ve dvoj a půl dimenzionálním náčrtu totiž pozorovatel vnímá objekt z toho místa, kde je postaven.

Vytvoření modelu a pak porovnání s pamětí

V posledním stádiu – ve trojdimenzionálním náčrtu – naproti tomu člověk vnímá objekt již jako reprezentaci, ke které má přístup ze všech úhlů pohledu. Představte si to tak, že ve specializovaném projektu vytvoříte model nějakého objektu a pak ho můžete svobodně otáčet ve všech směrech.

Takhle nějak vypadá reprezentace objektu v posledním stádiu. Toto odpoutání od úhlu pohledu umožňuje pozorovateli objekt lépe rozpoznat. Kdyby totiž reprezentace objektu zůstala vázána na úhel pohledu pozorovatele, byla by značně variabilní což by znesnadňovalo rozpoznávání.

Když je 3D model vytvořen, stačí jej podle Davida Mara porovnat s 3D reprezentací uloženou v paměti a objekt je rozpoznán.

Mozek nějak rozpoznává objekty a jinak umělá inteligence. foto: Pixabay

36 geonů

Zcela jiný přístup představuje teorie rozpoznávání pomocí komponent od amerického vědce Irvinga Biedermana (1939 – 2022). Ten uvažoval následovně: Každý objekt se dá rozložit na několik málo tvarů, ze kterých je složen.

Například hrnek se dá rozložit na válec a oblouk (ouško hrnku), který je k němu připojen. Těmto tvarům dal Biederman název geony a vymyslel jich celkem 36.

Podle Biedermana probíhá proces rozpoznávání objektu následovně: Nejprve dojde k určení hran objektu a rozhodnutí, jak by se objekt měl rozložit na jednotlivé geony. Poté jsou určeny vztahy mezi jednotlivými geony.

Tedy například to, na jakém místě je k válci hrnku připojen oblouk jeho ouška. Poté se tato reprezentace porovná s reprezentacemi uloženými v paměti.

Zatímco Marrova teorie předpokládá, že rozpoznávání závisí na úhlu pohledu, klíčovou predikcí teorie geonů je, že rozpoznávání je nezávislé na úhlu pohledu, a je ztížené jen tehdy, pokud je nějaký geon zakryt.

To znamená, že byste například jízdní kolo měli rozpoznat stejně snadno a rychle ať už byste se na něj dívali z boku, zepředu nebo zespoda.

Teorie a platnost

Jak jsou na tom vědecká zjištění ohledně těchto předpokladů? Obecně se dá říci, že spíše než abychom jasně stanovili, zda je rozpoznávání závislé na úhlu pohledu, můžeme mluvit o tom kdy takové je a kdy nikoliv.

Ukazuje se, že orientace objektu, tedy změna úhlu pohledu pro pozorovatele, změní aktivitu mozku brzy po prezentaci objektu. To napovídá tomu, že by vnímání mohlo být závislé na úhlu pohledu pouze v prvních chvílích, což nápadně připomíná rozčlenění rozpoznávání objektu na stádia podle Marrovy teorie.

Také se ukazuje, že rozpoznávání je nezávislé na úhlu pohledu, když jde o známé objekty. A také když určujeme kategorii objektů, tedy rozlišujeme psy od koček, spíše než když provádíme identifikaci v rámci jedné kategorie, tedy určujeme, zda jde o pudla, nebo ratlíka.

Uvedené teorie jsou zkrátka jen… teorie. To znamená, že si nemůžeme být jisti jejich platností a na jejich prověření ještě budeme čekat. Spíše tak můžete vzít teorie jako jakýsi nástroj, jakým uchopit realitu.

Související články
Autismus je jako strašák společnosti. Zatímco podvědomě s sebou nese předsudky z předsudků, konkrétně už ovlivňuje schopnost dítěte komunikovat, navazovat vztahy a zapojit se do běžných aktivit. Někteří jedinci s poruchami autistického spektra (PAS) vykazují mimořádné schopnosti, například v matematice, jazycích nebo umění, jiní čelí výzvám, které komplikují jejich každodenní život. Právě dnes si připomínáme […]
Objevy Vesmír 31.3.2025
Při pohledu na Grand Canyon v Arizoně si snadno představíme, jak jej po miliony let vyřezávala voda, pomalu formující tuto dechberoucí krajinu. Ale co kdyby podobné kaňony vznikly během několika minut? Přesně to se stalo na Měsíci! Dva gigantické kaňony poblíž jeho jižního pólu, Vallis Schrödinger a Vallis Planck, mají s Grand Canyonem podobné rozměry, […]
Automobilka Toyota Motor Europe (TME) vybuduje nový typ provozu pro systematické zpracování vozidel na konci jejich životnosti. Oddělení pod názvem Toyota Circular Factory má v rámci recyklačního procesu uvést maximum materiálu z rozebíraných aut zpět do výroby. První takový provoz bude umístěný v rámci závodu společnosti Toyota Motor Manufacturing UK (TMUK) v Burnastonu, kde se […]
Objevy Příroda 24.3.2025
Lék na rakovinu ani levnější chleba to nepřinese, ale je to výzkum, který naplňuje jedinou věc, odvěkou lidskou touhu cestovat do minulosti. A za ním stojí Stanislav Vosolsobě z Přírodovědecké fakulty UK, jehož výstupem je odborný článek v renomovaném britském časopise New Phytologist. Cestování do minulosti za poznáním dávno vyhynulých organismů není v poslední dekádě […]
Objevy Technika 20.3.2025
Tento rychlý a obratný robotický hmyz by mohl v budoucnu pomáhat s mechanickým opylováním. Díky novému designu byl robot velikosti hmyzu schopen létat 100krát déle než předchozí verze. Vědci z Massachusettského technologického institutu (MIT) vyvinuli novou generaci robotického hmyzu, který by v budoucnu mohl významně přispět k mechanickému opylování rostlin. Tento drobný robot, vážící méně […]
reklama
Nejčtenější články
za poslední
24 hodin    3 dny    týden
reklama
Nenechte si ujít další zajímavé články
reklama
Copyright © RF-Hobby.cz
Provozovatel: RF HOBBY, s. r. o., Bohdalecká 6/1420, 101 00 Praha 10, IČO: 26155672, tel.: 420 281 090 611, e-mail: sekretariat@rf-hobby.cz