Hlas oceánu: Jak AI pomáhá porozumět delfínům?

Mezi savci těžko najdeme tvora s dominantnějším mozkem. Ten delfíní může vážit až 1,7 kg, což je víc než u člověka. Tito inteligentní živočichové spolu komunikují cvakáním a hvízdáním a dokážou rozeznat svá vlastní „jména“.

Díky pokroku v umělé inteligenci možná budeme moci jejich řeč brzy přeložit do lidské a naopak. Jsme jen krůček od mluvení se zvířaty?.

Legendární potápěč a držitel několika světových rekordů, Ital Enzo Maiorca, v roce 1970 plaval u břehů Sicílie, když mu ve vodě kdosi „poklepal“ na záda. Byl to delfíní samec, který překvapeného Enzu zavedl ke své březí družce, lapené ve staré rybářské síti.

Potápěč neváhal a zvíře osvobodil. Na znamení vděčnosti za záchranu rodiny se samec lehce dotkl čumákem Enzovy tváře. Příběh zní jako z pera hollywoodských scénáristů, skutečně se ale stal. Zdá se, že tito kytovci si našli způsob, jak s lidmi komunikovat – a my jim možná brzy budeme moci odpovídat.

Knihovna zvuků

Americká nezisková organizace Wild Dolphin Project (WDP) studuje komunitu delfínů skvrnitých žijící u Baham posledních 40 let. Její výzkumníci zasvětili celou tuto dobu snaze rozluštit komplikované sociální interakce těchto mořských savců a nasbírali k tomu účelu množství akustických dat.

O komunikaci s kytovci sní odborníci už dlouho, dosud ale postrádali dostatečně pokročilou technologii k analýze a napodobování jejich zvuků. Zlom nastal s příchodem velkých jazykových modelů (LLM). S jejich využitím bychom mohli překládat komunikaci těchto živočichů mnohem rychleji než manuálními přístupy.

Aby tuto možnost organizace WDP prověřila, spojila se s vědci z Georgijského technologického institutu a týmem Google DeepMind. Těm poskytla svou rozsáhlou knihovnu nahrávek delfíních zvuků pro trénink jazykového modelu.

Našeptávač delfíní řeči

Po svém „zaškolení“ dostal jazykový model za úkol generovat sekvence zvuků podobné delfínům. Jak popsal výzkumník Thad Sterner z Google DeepMind, „polovina z toho byl hluk v pozadí, který očekáváte od oceánu.“ Druhá část ale překvapila.

Obsahovala autenticky znějící cvakání, hvizdy a prudké pulzy – rychlé sekvence cvakání, které delfíni často vydávají během boje. Tyto pulzy přitom Starner nebyl schopen reprodukovat pomocí běžných počítačových programů, LLM je vygeneroval sám na základě toho, co se naučil z nahrávek.

Podle Googlu nyní model dokáže prakticky předvídat následující zvuky v sekvenci podobně, jako když internetový vyhledávač našeptává další slova. „Trvalo by asi 150 let, než bychom prošli všechna data a pokusili se z nich vytáhnout tyto vzorce manuálně,“ dodala zakladatelka WDP, Denise Herzingová.

Výsledkem celé spolupráce se stal projekt DolphinGemma, iniciativa, která využívá umělou inteligenci k analýze a reprodukci delfíní komunikace.

Obousměrný podvodní překladač

Součástí projektu je také technologie pro oboustrannou komunikaci lidí a delfínů, podvodní počítačový systém CHAT, vyvinutý Georgijským technologickým institutem. Tento nástroj využívá hydrofony a reproduktory k nahrávání delfíních zvuků, a zároveň k přehrávání hvizdů vytvořených LLM. Sloužit má v podstatě ke sledování reakcí delfínů na slova vytvořená AI k označení nejrůznějších předmětů a symbolů, od mořské trávy po hračku. „Cílem je jednoho dne mluvit delfíní řečí,“ dodala Herzingová.