Jak Google wykorzystuje AI do odkrywania tajemnic komunikacji delfinów
Delfiny słyną z wysokiej inteligencji, złożonych zachowań społecznych oraz skomplikowanych systemów komunikacji. Od lat naukowcy i miłośnicy zwierząt zastanawiają się, czy te morskie ssaki posługują się językiem podobnym do ludzkiego. Dzięki sztucznej inteligencji (AI) pojawiły się nowe możliwości badania tej kwestii. Jednym z najciekawszych projektów w tej dziedzinie jest współpraca Google z Wild Dolphin Project (WDP), w ramach której powstał model AI o nazwie DolphinGemma. Jego zadaniem jest analiza dźwięków wydawanych przez delfiny. To przełomowe rozwiązanie może nie tylko pomóc w rozszyfrowaniu ich sposobu porozumiewania się, ale także umożliwić dwustronną komunikację między ludźmi a tymi niezwykłymi stworzeniami.
Rola AI w badaniu dźwięków delfinów
Delfiny komunikują się za pomocą kliknięć, gwizdów oraz ruchów ciała. Te dźwięki różnią się częstotliwością i natężeniem, co może oznaczać różne komunikaty w zależności od kontekstu, np. podczas poszukiwania pożywienia, godów czy interakcji z innymi osobnikami. Mimo wielu lat badań, pełne zrozumienie tych sygnałów pozostaje wyzwaniem. Tradycyjne metody analizy nie radzą sobie z ogromną ilością danych generowanych przez delfiny, co utrudnia wyciąganie wniosków.
AI pomaga pokonać te ograniczenia dzięki algorytmom uczenia maszynowego i przetwarzania języka naturalnego (NLP), które potrafią wykrywać wzorce w dźwiękach niedostępne dla ludzkiego ucha. Modele AI mogą klasyfikować różne rodzaje odgłosów, łącząc je z konkretnymi zachowaniami lub stanami emocjonalnymi. Przykładowo, niektóre gwizdy wydają się związane z interakcjami społecznymi, a kliknięcia służą głównie nawigacji i echolokacji.
Choć AI ma ogromny potencjał, wyzwaniem pozostaje zbieranie i przetwarzanie ogromnych zbiorów danych oraz trenowanie modeli na ich podstawie. Aby rozwiązać ten problem, Google i WDP opracowali DolphinGemma – specjalny model AI przeznaczony do analizy komunikacji delfinów, zdolny wykrywać złożone wzorce w ich wokalizacjach.
Czym jest DolphinGemma?
DolphinGemma bazuje na Gemmie od Google – otwartoźródłowym modelu generatywnym AI zawierającym około 400 milionów parametrów. Jego zadaniem jest nauka struktury dźwięków wydawanych przez delfiny oraz generowanie nowych sekwencji przypominających ich odgłosy. Model powstał we współpracy z WDP i Georgia Tech, wykorzystując dane z nagrań atlantyckich delfinów plamistych zbieranych od 1985 roku. DolphinGemma korzysta z technologii SoundStream Google, która tokenizuje dźwięki, umożliwiając przewidywanie kolejnych elementów w sekwencji. Podobnie jak modele językowe generują tekst, DolphinGemma potrafi przewidywać, jakie dźwięki mogą wydać delfiny, co pomaga w identyfikacji ewentualnych reguł gramatycznych w ich komunikacji.
Model może nawet tworzyć nowe, delfinopodobne dźwięki, na podobnej zasadzie jak funkcja autouzupełniania tekstu. Ta umiejętność może pomóc w odkryciu zasad rządzących ich porozumiewaniem się i dostarczyć odpowiedzi na pytanie, czy ich wokalizacje tworzą strukturalny język.
DolphinGemma w praktyce
Kluczową zaletą DolphinGemmy jest możliwość działania w czasie rzeczywistym na urządzeniach takich jak telefony Google Pixel. Dzięki lekkiej architekturze model nie wymaga drogiego, specjalistycznego sprzętu. Badacze mogą nagrywać dźwięki delfinów bezpośrednio na smartfony i od razu je analizować. To znacznie obniża koszty badań i zwiększa dostępność technologii.
Ponadto, DolphinGemma jest zintegrowana z systemem CHAT (Cetacean Hearing Augmentation Telemetry), który pozwala odtwarzać syntetyczne dźwięki i obserwować reakcje delfinów. To może doprowadzić do stworzenia wspólnego słownika, umożliwiającego dwustronną komunikację.
Szersze implikacje i plany Google
DolphinGemma ma znaczenie nie tylko dla badań nad komunikacją delfinów, ale także dla rozwoju nauki o poznaniu zwierząt. Rozszyfrowanie ich wokalizacji może dać wgląd w strukturę społeczną, priorytety i sposób myślenia tych stworzeń. To z kolei może poprawić działania ochronne i poszerzyć wiedzę na temat inteligencji oraz świadomości zwierząt.
DolphinGemma jest częścią szerszego trendu wykorzystania AI w badaniu komunikacji zwierząt, podobne projekty dotyczą m.in. wron, wielorybów i surykatek. Google planuje udostępnić model społeczności naukowej latem 2025 roku jako otwarte oprogramowanie, aby umożliwić jego adaptację do innych gatunków waleni, np. butlonosów czy delfinów długoszczękich. Otwarty charakter projektu ma zachęcić do globalnej współpracy. Firma zamierza także przetestować model w terenie podczas nadchodzącego sezonu badawczego, co może pogłębić wiedzę o atlantyckich delfinach plamistych.
Wyzwania i sceptycyzm naukowy
Mimo ogromnego potencjału, DolphinGemma napotyka trudności. Nagrania w oceanie są często zakłócane przez hałas tła, co utrudnia analizę dźwięków. Thad Starner z Georgia Tech, zaangażowany w projekt, zwraca uwagę, że wiele danych zawiera odgłosy środowiska, wymagające zaawansowanego filtrowania. Niektórzy badacze kwestionują też, czy komunikacja delfinów rzeczywiście zasługuje na miano języka. Zoolog Arik Kershenbaum twierdzi, że w przeciwieństwie do złożoności ludzkiej mowy, delfiny mogą używać prostszego systemu sygnałów. Thea Taylor, dyrektorka Sussex Dolphin Project, ostrzega przed ryzykiem nieświadomego nauczenia delfinów naśladowania dźwięków. Te głosy podkreślają konieczność rzetelnej weryfikacji wyników uzyskiwanych dzięki AI.
Podsumowanie
Badania Google nad komunikacją delfinów to przełomowy krok w kierunku zrozumienia, jak te zwierzęta porozumiewają się ze sobą i ze środowiskiem. Dzięki sztucznej inteligencji naukowcy odkrywają ukryte wzorce w ich dźwiękach, co może przynieść nowe odkrycia. Choć wyzwania pozostają, dotychczasowe postępy pokazują potencjał AI w badaniach nad zachowaniami zwierząt. W miarę rozwoju projekt może otworzyć nowe możliwości w ochronie przyrody, badaniach poznawczych i interakcjach między ludźmi a zwierzętami.