Gemini od Google'a pokonało Pokémon Blue (z niewielką pomocą)

Najdroższy model AI Google osiągnął kolejny kamień milowy: pokonał 29-letnią grę wideo Najnowszy i najbardziej zaawansowany model sztucznej inteligencji Google, Gemini 2.5 Pro, właśnie dokonał imponującego wyczynu – ukończył kultową grę Pokémon Blue. Sundar Pichai ogłasza sukces na Twitterze Prezes Google, Sundar Pichai, pochwalił się na platformie X, pisząc: "Co za finisz! Gemini 2.5 Pro […]

Najdroższy model AI Google osiągnął kolejny kamień milowy: pokonał 29-letnią grę wideo

Najnowszy i najbardziej zaawansowany model sztucznej inteligencji Google, Gemini 2.5 Pro, właśnie dokonał imponującego wyczynu – ukończył kultową grę Pokémon Blue.

Sundar Pichai ogłasza sukces na Twitterze

Prezes Google, Sundar Pichai, pochwalił się na platformie X, pisząc: "Co za finisz! Gemini 2.5 Pro właśnie ukończyło Pokémon Blue!".

Twórca projektu to niezależny programista

Warto zauważyć, że transmisja na żywo "Gemini Plays Pokemon" została stworzona przez 30-letniego programistę niezwiązanego z Google, który przedstawia się jako Joel Z. Mimo to, wysokiej rangi pracownicy Google aktywnie kibicowali temu przedsięwzięciu.

Rywalizacja AI w świecie Pokémon

Logan Kilpatrick, kierownik produktu Google AI Studio, ogłosił w zeszłym miesiącu, że Gemini "robi duże postępy w ukończeniu Pokémona" i zdobyło już "piątą odznakę (poprzedni najlepszy model miał tylko trzy, choć z innym systemem agentów)". Pichai odpowiedział na to żartem: "Pracujemy nad API, Artificial Pokémon Intelligence:)".

Dlaczego akurat Pokémon?

W lutym firma Anthropic wykazała postępy swojego modelu Claude w grze "Pokémon Red", twierdząc, że "rozszerzone myślenie i szkolenie agentów" daje mu przewagę w "bardziej nieoczekiwanych" zadaniach, takich jak granie w klasyczne gry. ("Pokémon Red" i "Blue" to różne wersje gry na GameBoy'a wydanej w 1996 roku). Istnieje nawet kanał Twitch "Claude Plays Pokemon", który Joel Z wskazał jako inspirację.

Czy Gemini jest lepsze od Claude'a?

Choć Claude nie ukończył jeszcze "Pokémon Red", Joel Z przestrzega przed pochopnymi wnioskami. Na swoim kanale Twitch napisał: "Proszę nie traktować tego jako testu wydajności LLM w Pokémonie. Nie można dokonywać bezpośrednich porównań – Gemini i Claude mają różne narzędzia i otrzymują różne informacje".

Jak działa system gry AI?

Oba modele AI potrzebują pomocy w grze – tutaj wkraczają specjalne systemy agentów, które dostarczają modelom zrzuty ekranu z dodatkowymi informacjami, pozwalają podejmować decyzje (czasem przy wsparciu wyspecjalizowanych agentów), a następnie symulują odpowiednie przyciski.

Interwencje programisty a uczciwość rozgrywki

Joel Z przyznał, że stosował pewne "interwencje deweloperskie", aby pomóc Gemini ukończyć grę, ale podkreślił, że nie było to oszustwo.

"Moje działania poprawiają ogólną zdolność podejmowania decyzji i rozumowania przez Gemini" – wyjaśnia. "Nie podaję konkretnych podpowiedzi – nie ma instrukcji ani wskazówek dotyczących konkretnych wyzwań, takich jak Mt. Moon. Jedynym wyjątkiem było poinformowanie Gemini, że musi porozmawiać z Rocket Gruntem dwa razy, aby zdobyć Lift Key, co było błędem poprawionym później w Pokémon Yellow".

Dodał również: "Projekt Gemini Plays Pokémon jest wciąż w fazie rozwoju, a cały framework ciągle ewoluuje".