Najdroższy model AI Google osiągnął kolejny kamień milowy: pokonał 29-letnią grę wideo
Najnowszy i najbardziej zaawansowany model sztucznej inteligencji Google, Gemini 2.5 Pro, właśnie dokonał imponującego wyczynu – ukończył kultową grę Pokémon Blue.
Sundar Pichai ogłasza sukces na Twitterze
Prezes Google, Sundar Pichai, pochwalił się na platformie X, pisząc: "Co za finisz! Gemini 2.5 Pro właśnie ukończyło Pokémon Blue!".
Twórca projektu to niezależny programista
Warto zauważyć, że transmisja na żywo "Gemini Plays Pokemon" została stworzona przez 30-letniego programistę niezwiązanego z Google, który przedstawia się jako Joel Z. Mimo to, wysokiej rangi pracownicy Google aktywnie kibicowali temu przedsięwzięciu.
Rywalizacja AI w świecie Pokémon
Logan Kilpatrick, kierownik produktu Google AI Studio, ogłosił w zeszłym miesiącu, że Gemini "robi duże postępy w ukończeniu Pokémona" i zdobyło już "piątą odznakę (poprzedni najlepszy model miał tylko trzy, choć z innym systemem agentów)". Pichai odpowiedział na to żartem: "Pracujemy nad API, Artificial Pokémon Intelligence:)".
Dlaczego akurat Pokémon?
W lutym firma Anthropic wykazała postępy swojego modelu Claude w grze "Pokémon Red", twierdząc, że "rozszerzone myślenie i szkolenie agentów" daje mu przewagę w "bardziej nieoczekiwanych" zadaniach, takich jak granie w klasyczne gry. ("Pokémon Red" i "Blue" to różne wersje gry na GameBoy'a wydanej w 1996 roku). Istnieje nawet kanał Twitch "Claude Plays Pokemon", który Joel Z wskazał jako inspirację.
Czy Gemini jest lepsze od Claude'a?
Choć Claude nie ukończył jeszcze "Pokémon Red", Joel Z przestrzega przed pochopnymi wnioskami. Na swoim kanale Twitch napisał: "Proszę nie traktować tego jako testu wydajności LLM w Pokémonie. Nie można dokonywać bezpośrednich porównań – Gemini i Claude mają różne narzędzia i otrzymują różne informacje".
Jak działa system gry AI?
Oba modele AI potrzebują pomocy w grze – tutaj wkraczają specjalne systemy agentów, które dostarczają modelom zrzuty ekranu z dodatkowymi informacjami, pozwalają podejmować decyzje (czasem przy wsparciu wyspecjalizowanych agentów), a następnie symulują odpowiednie przyciski.
Interwencje programisty a uczciwość rozgrywki
Joel Z przyznał, że stosował pewne "interwencje deweloperskie", aby pomóc Gemini ukończyć grę, ale podkreślił, że nie było to oszustwo.
"Moje działania poprawiają ogólną zdolność podejmowania decyzji i rozumowania przez Gemini" – wyjaśnia. "Nie podaję konkretnych podpowiedzi – nie ma instrukcji ani wskazówek dotyczących konkretnych wyzwań, takich jak Mt. Moon. Jedynym wyjątkiem było poinformowanie Gemini, że musi porozmawiać z Rocket Gruntem dwa razy, aby zdobyć Lift Key, co było błędem poprawionym później w Pokémon Yellow".
Dodał również: "Projekt Gemini Plays Pokémon jest wciąż w fazie rozwoju, a cały framework ciągle ewoluuje".