NVIDIA wydała poprawkę do sterownika powodującego problemy z temperaturą GPU
Wczoraj NVIDIA szybko wypuściła ważną poprawkę, aby zaradzić problemom spowodowanym przez wcześniejszą wersję sterownika. Aktualizacja wywołała zamieszanie wśród graczy i specjalistów od AI, ponieważ powodowała, że systemy błędnie wyświetlały bezpieczne temperatury GPU, podczas gdy w rzeczywistości układy mogły się przegrzewać.
W oficjalnym komunikacie NVIDIA wymieniła problem jako „Narzędzia monitorujące GPU mogą przestać wyświetlać temperaturę po wyjściu komputera z trybu uśpienia”, choć nie była to główna przyczyna aktualizacji.
Kontrowersyjny sterownik o numerze 576.02 szybko stał się tematem gorącej dyskusji. Na subreddicie poświęconym Stable Diffusion pojawił się wątek zatytułowany „Przeczytaj, aby uratować swój GPU!”, gdzie użytkownicy dzielili się swoimi doświadczeniami. Dzięki tym relacjom można prześledzić, jak rozwijała się sytuacja.
Pierwsze doniesienia o błędzie pojawiły się w piątek wieczorem czasu UTC na subreddicie ZephyrusG14. Użytkownik fricy81 powołał się na wpis na forum NVIDIA (archiwum), w którym opisano problemy po aktualizacji.
Problem z pomiarem temperatury
Jak wynika z relacji użytkowników, po zainstalowaniu sterownika 576.02 narzędzia takie jak MSI Afterburner oraz wbudowane monitory w grach (np. w Call of Duty) przestały prawidłowo wyświetlać temperaturę GPU, zatrzymując się na poziomie około 35-36°C.
Restart oprogramowania monitorującego nie pomagał – dopiero ponowne uruchomienie całego systemu przywracało prawidłowe odczyty. Co ciekawe, aplikacje takie jak HWInfo oraz narzędzia samej NVIDIA nadal działały poprawnie. Problem występował nie tylko po wyjściu z trybu uśpienia, ale także podczas normalnej pracy.
Użytkownicy zgłaszali również zaburzenia w działaniu wentylatorów oraz nieprawidłową regulację temperatury, co prowadziło do nieoczekiwanie wysokich temperatur nawet przy standardowym obciążeniu. Jeden z komentarzy na Reddicie (link) szczegółowo opisywał tę sytuację:
„Od razu zauważyłem, że coś jest nie tak. Na zewnątrz było około 12°C, a w moim pokoju było gorąco jak w saunie. Mimo otwartego okna nie czułem różnicy. Wentylatory pracowały na pełnych obrotach, a temperatury wydawały się w normie – około 68-72°C po dłuższej sesji gamingowej.”
„Dopiero rano zdałem sobie sprawę, że to nie są temperatury spoczynkowe, a wentylatory wciąż działały na wysokich obrotach. Początkowo myślałem, że to wina mojego podkręcania GPU, ale po powrocie do starszego sterownika problem zniknął.”
Dlaczego wystąpił problem?
W oficjalnych notatkach do sterownika 576.02 NVIDIA wspomniała o błędzie w sekcji 5.5, dotyczącym systemów z technologią Optimus. Firma wyjaśniła, że narzędzia monitorujące mogą wyświetlać temperaturę GPU jako 0°C, gdy nie są uruchomione żadne aplikacje.
NVIDIA Optimus to technologia przełączająca między zintegrowaną a dedykowaną kartą graficzną w celu oszczędzania energii. W sterowniku 576.02 problem, który dotyczył pierwotnie tylko systemów z Optimus, rozprzestrzenił się na inne konfiguracje, powodując nieprawidłowe odczyty w narzędziach innych firm.
Czy uszkodzenie GPU było realnym zagrożeniem?
W większości przypadków wbudowany VBIOS karty graficznej powinien zapobiec trwałemu uszkodzeniu, wymuszając ograniczenie wydajności lub wyłączenie układu w przypadku przegrzania. Jednak długotrwała ekspozycja na wysokie temperatury może wpłynąć na żywotność podzespołów (źródło).
Problem był szczególnie niebezpieczny dla osób pracujących z AI, gdzie GPU często pracuje na pełnym obciążeniu przez długi czas. Mimo że NVIDIA wydała poprawkę, sterownik 576.02 wciąż jest dostępny* do pobrania na oficjalnej stronie.
Skutki problemu
Użytkownicy zgłaszali różne problemy – od awarii GPU po konieczność wymiany pasty termoprzewodzącej. Jeden z nich (link) napisał:
„Moja karta przestała działać po starcie systemu z powodu przegrzania. Dopiero obniżenie napięcia pomogło. Teraz muszę wymienić pastę termiczną, bo stara pewnie straciła swoje właściwości.”
Inny użytkownik (link) dodał:
„Mój system wyświetlał stałą temperaturę 27°C, więc wentylatory nie włączały się, co prowadziło do przegrzania. Dopiero powrót do poprzedniego sterownika rozwiązał problem.”
Dla specjalistów od AI problem był szczególnie dotkliwy, ponieważ ich praca wymaga długotrwałego, wysokiego obciążenia GPU (więcej), podczas gdy w grach intensywne wykorzystanie karty zwykle występuje tylko okresowo.
* Archiwum: https://archive.ph/ylVR1
Pierwsza publikacja: wtorek, 22 kwietnia 2025