Jak sztuczna inteligencja Google’a odkrywa sekrety komunikacji delfinów

Delfiny i sztuczna inteligencja: nowe możliwości w badaniu komunikacji Delfiny od dawna zachwycają naukowców i miłośników zwierząt swoją inteligencją, złożonymi zachowaniami społecznymi oraz skomplikowanym systemem porozumiewania się. Od lat trwają badania, które mają odpowiedzieć na pytanie, czy te morskie ssaki posługują się językiem podobnym do ludzkiego. Dziś, dzięki rozwojowi sztucznej inteligencji (AI), pojawiają się nowe, […]

Delfiny i sztuczna inteligencja: nowe możliwości w badaniu komunikacji

Delfiny od dawna zachwycają naukowców i miłośników zwierząt swoją inteligencją, złożonymi zachowaniami społecznymi oraz skomplikowanym systemem porozumiewania się. Od lat trwają badania, które mają odpowiedzieć na pytanie, czy te morskie ssaki posługują się językiem podobnym do ludzkiego. Dziś, dzięki rozwojowi sztucznej inteligencji (AI), pojawiają się nowe, ekscytujące możliwości w tej dziedzinie. Przełomowym projektem jest współpraca Google z Wild Dolphin Project (WDP), której efektem jest stworzenie modelu AI o nazwie DolphinGemma. Jego zadaniem jest analiza dźwięków wydawanych przez delfiny, co może nie tylko pomóc w ich dekodowaniu, ale także otworzyć drogę do dwustronnej komunikacji z tymi niezwykłymi stworzeniami.

Jak AI pomaga zrozumieć dźwięki delfinów?

Delfiny porozumiewają się za pomocą kombinacji kliknięć, gwizdów oraz ruchów ciała. Te dźwięki różnią się częstotliwością i intensywnością, co może oznaczać różne komunikaty w zależności od kontekstu – np. podczas poszukiwania pożywienia, godów czy interakcji z innymi osobnikami. Mimo wielu lat badań, pełne zrozumienie tego systemu pozostaje wyzwaniem. Tradycyjne metody analizy nie radzą sobie z ogromną ilością danych generowanych przez delfiny, co utrudnia wyciąganie wniosków.

Sztuczna inteligencja rozwiązuje ten problem, wykorzystując uczenie maszynowe i algorytmy przetwarzania języka naturalnego (NLP) do analizy nagrań. Modele AI potrafią wykrywać wzorce i powiązania w dźwiękach, które są niezauważalne dla ludzkiego ucha. Mogą klasyfikować różne rodzaje odgłosów i łączyć je z konkretnymi zachowaniami lub stanami emocjonalnymi. Przykładowo, niektóre gwizdy wydają się związane z interakcjami społecznymi, a kliknięcia – z nawigacją lub echolokacją.

Choć AI ma ogromny potencjał, wyzwaniem pozostaje zbieranie i przetwarzanie dużych zbiorów danych oraz trenowanie modeli. Aby uporać się z tymi trudnościami, Google i WDP opracowali DolphinGemma – specjalny model AI przeznaczony do badania komunikacji delfinów, zdolny do wykrywania złożonych wzorców w ich wokalizacjach.

Czym jest DolphinGemma?

DolphinGemma bazuje na Gemmie, otwartoźródłowym modelu generatywnym Google'a, zawierającym około 400 milionów parametrów. Jego zadaniem jest nauka struktury dźwięków delfinów oraz generowanie nowych sekwencji przypominających ich odgłosy. Model powstał we współpracy z WDP i Georgia Tech, wykorzystując dane z nagrań atlantyckich delfinów plamistych zbieranych od 1985 roku. Dzięki technologii SoundStream, dźwięki są tokenizowane, co pozwala modelowi przewidywać kolejne elementy sekwencji. Podobnie jak modele językowe generują tekst, DolphinGemma przewiduje, jakie dźwięki mogą wydać delfiny, co pomaga w identyfikacji ewentualnych reguł gramatycznych w ich komunikacji.

Co ciekawe, model potrafi nawet tworzyć nowe, delfinopodobne odgłosy – analogicznie do tego, jak funkcja predykcyjna w telefonie podpowiada następne słowa. Ta umiejętność może pomóc w odkrywaniu zasad rządzących ich porozumiewaniem się.

Jak działa DolphinGemma w praktyce?

Kluczową zaletą DolphinGemmy jest możliwość działania w czasie rzeczywistym na urządzeniach takich jak telefony Google Pixel. Dzięki lekkiej architekturze model nie wymaga drogiego, specjalistycznego sprzętu. Badacze mogą nagrywać dźwięki delfinów bezpośrednio na smartfonie i od razu je analizować, co obniża koszty badań i zwiększa dostępność technologii.

Ponadto, DolphinGemma jest zintegrowana z systemem CHAT (Cetacean Hearing Augmentation Telemetry), który umożliwia odtwarzanie syntetycznych dźwięków i obserwację reakcji delfinów. To może prowadzić do stworzenia wspólnego słownika, umożliwiającego dwustronną komunikację.

Szersze znaczenie i plany Google'a

DolphinGemma to nie tylko przełom w badaniu delfinów, ale także krok naprzód w poznawaniu zwierzęcej inteligencji i komunikacji. Dekodowanie ich dźwięków może dać wgląd w strukturę społeczną, priorytety i sposób myślenia tych stworzeń, co z kolei wpłynie na lepsze metody ochrony. Projekt jest częścią szerszej inicjatywy wykorzystującej AI do badania komunikacji u innych gatunków, takich jak kruki, wieloryby czy surykatki.

Google planuje udostępnić DolphinGemma jako otwarty model w 2025 roku, aby umożliwić globalną współpracę naukowców. W kolejnych etapach model ma być dostosowywany do badania innych gatunków, np. delfinów butlonosych. Kolejnym krokiem będą testy terenowe, które pogłębią wiedzę o atlantyckich delfinach plamistych.

Wyzwania i sceptycyzm naukowy

Mimo ogromnego potencjału, projekt napotyka trudności. Nagrania w oceanie są zakłócane przez szum tła, co wymaga zaawansowanych technik filtrowania. Thad Starner z Georgia Tech, zaangażowany w badania, zwraca uwagę, że wiele danych zawiera niepożądane dźwięki środowiska. Niektórzy naukowcy, jak zoolog Arik Kershenbaum, kwestionują nawet, czy delfiny posługują się prawdziwym językiem, czy raczej prostszym systemem sygnałów. Thea Taylor, dyrektor Sussex Dolphin Project, ostrzega przed ryzykiem nieświadomego uczenia delfinów naśladowania dźwięków. Te głosy podkreślają potrzebę ostrożnej interpretacji wyników AI.

Podsumowanie

Badania Google'a nad komunikacją delfinów to przełomowy projekt, który przybliża nas do zrozumienia ich złożonego świata. Dzięki sztucznej inteligencji naukowcy odkrywają ukryte wzorce w dźwiękach, co może zrewolucjonizować ochronę przyrody i badania nad inteligencją zwierząt. Choć wyzwania pozostają, dotychczasowe postępy pokazują ogromny potencjał AI w tej dziedzinie.