Google rozszerza rodzinę modeli AI Gemma
Rodzina otwartych modeli sztucznej inteligencji Google o nazwie Gemma właśnie się powiększa.
Nowy model Gemma 3n
Podczas konferencji Google I/O 2025, która odbyła się we wtorek, Google zaprezentował Gemma 3n - model zaprojektowany do sprawnego działania na telefonach, laptopach i tabletach. Od wtorku dostępny jest w wersji testowej. Jak zapewnia Google, model ten potrafi przetwarzać dźwięk, tekst, obrazy i filmy.
W ostatnich latach w środowisku AI popularność zyskują modele na tyle wydajne, by działać offline bez konieczności korzystania z chmury obliczeniowej. Są one nie tylko tańsze w użyciu niż duże modele, ale też lepiej chronią prywatność, eliminując potrzebę przesyłania danych do zdalnych centrów danych.
Podczas prezentacji na I/O, menedżer produktu Gemma, Gus Martins, poinformował, że Gemma 3n może działać na urządzeniach z mniej niż 2 GB pamięci RAM. "Gemma 3n ma tę samą architekturę co Gemini Nano i została zaprojektowana dla niesamowitej wydajności" - dodał.
MedGemma dla sektora zdrowia
Oprócz Gemma 3n, Google udostępnia również MedGemma w ramach swojego programu Health AI Developer Foundations. Według firmy, jest to ich najbardziej zaawansowany otwarty model do analizy tekstów i obrazów związanych ze zdrowiem.
"MedGemma to nasza kolekcja otwartych modeli do wielomodalnego rozumienia tekstu i obrazów w kontekście zdrowotnym" - wyjaśnił Martins. "Model świetnie sprawdza się w różnych zastosowaniach związanych z tekstem i obrazami, dzięki czemu programiści mogą dostosować go do własnych aplikacji zdrowotnych."
SignGemma dla osób niesłyszących
Google zapowiedział także nadchodzący model SignGemma, który będzie tłumaczył język migowy na tekst w języku mówionym. Zdaniem firmy, SignGemma umożliwi programistom tworzenie nowych aplikacji i integracji dla osób głuchych i niedosłyszących.
"SignGemma to nowa rodzina modeli uczących się tłumaczenia języka migowego na tekst, ale najlepiej radzi sobie z amerykańskim językiem migowym i angielskim" - powiedział Martins. "To najbardziej zaawansowany model rozumienia języka migowego w historii i nie możemy się doczekać, aż programiści oraz społeczności osób głuchych i niedosłyszących zaczną na nim budować."
Kontrowersje dotyczące licencji
Warto zauważyć, że Gemma spotkała się z krytyką ze względu na niestandardowe warunki licencyjne. Niektórzy programiści twierdzą, że korzystanie z tych modeli w celach komercyjnych wiąże się z ryzykiem. Nie przeszkodziło to jednak w tym, by modele Gemma zostały pobrane dziesiątki milionów razy.
Aktualizacja o 23:40 czasu polskiego: Dodano kilka cytatów od menedżera produktu Gemma, Gusa Martinsa