DeepSeek robi furorę
DeepSeek, chińskie laboratorium sztucznej inteligencji, stało się ostatnio tematem numer jeden w mediach. Stało się tak, gdy jego aplikacja z chatbotem wspięła się na szczyt rankingu App Store firmy Apple, a także Google Play. Modele AI DeepSeek, stworzone przy użyciu technik efektywnych obliczeniowo, skłoniły analityków z Wall Street oraz technologów do zadawania pytań o przyszłość amerykańskiej przewagi w wyścigu AI oraz o to, czy popyt na chipsy AI utrzyma się na obecnym poziomie.
Ale skąd wziął się DeepSeek i jak tak szybko zdobył międzynarodową sławę?
Początki DeepSeek w świecie finansów
DeepSeek jest wspierany przez High-Flyer Capital Management, chiński fundusz hedgingowy wykorzystujący AI do podejmowania decyzji inwestycyjnych.
Założycielem High-Flyer w 2015 roku był Liang Wenfeng, entuzjasta sztucznej inteligencji, który podobno zaczynał od handlu jako student Zhejiang University. W 2019 roku przekształcił High-Flyer w fundusz hedgingowy skupiony na rozwoju algorytmów AI.
W 2023 roku High-Flyer powołał do życia DeepSeek jako niezależne laboratorium badające narzędzia AI, oddzielone od działalności finansowej. Dzięki wsparciu High-Flyer, laboratorium przekształciło się w osobną firmę o tej samej nazwie.
Od samego początku DeepSeek budował własne centra danych do trenowania modeli. Jednak, podobnie jak inne firmy AI w Chinach, musiał zmierzyć się z amerykańskimi zakazami eksportu sprzętu. Aby wytrenować jeden ze swoich nowszych modeli, firma była zmuszona użyć chipów Nvidia H800, mniej wydajnych niż H100, dostępnych dla amerykańskich przedsiębiorstw.
Wydarzenie TechCrunch
Zaprezentuj swój projekt na TC Sessions: AI przed ponad 1200 decydentami. Oferta ważna do 9 maja lub do wyczerpania miejsc.
Lokalizacja: Berkeley, CA | Data: 5 czerwca
Zespół techniczny DeepSeek składa się głównie z młodych talentów. Firma aktywnie rekrutuje doktorantów z czołowych chińskich uczelni, a także osoby bez wykształcenia informatycznego, aby poszerzyć zakres wiedzy swoich modeli.
Potężne modele DeepSeek
DeepSeek zaprezentował swoje pierwsze modele – DeepSeek Coder, DeepSeek LLM i DeepSeek Chat – w listopadzie 2023. Jednak prawdziwy przełom nastąpił na wiosnę, gdy firma wypuściła nową generację modeli DeepSeek-V2, które zwróciły uwagę całej branży AI.
DeepSeek-V2, system analizujący tekst i obrazy, wypadł znakomicie w testach porównawczych i był znacznie tańszy w eksploatacji niż konkurencyjne modele. To zmusiło takich rywali jak ByteDance czy Alibaba do obniżenia cen swoich rozwiązań, a nawet udostępnienia ich za darmo.
Kolejny model, DeepSeek-V3, wprowadzony w grudniu 2024, tylko utwierdził pozycję firmy. Według wewnętrznych testów, przewyższa on zarówno otwarte modele, takie jak Llama Meta, jak i zamknięte rozwiązania, takie jak GPT-4o OpenAI.
Równie imponujący jest model R1, specjalizujący się w „rozumowaniu”. Według DeepSeek, dorównuje on wydajnością modelowi o1 OpenAI w kluczowych testach. Modele tego typu są wolniejsze, ale bardziej precyzyjne w dziedzinach takich jak fizyka, nauka czy matematyka.
Jednak modele DeepSeek mają ograniczenia – podlegają chińskim regulacjom, które wymuszają zgodność z „socjalistycznymi wartościami”. Na przykład chatbot firmy nie odpowiada na pytania dotyczące Tiananmen czy autonomii Tajwanu.
W marcu liczba odwiedzin DeepSeek przekroczyła 16,5 miliona, choć wciąż daleko mu do ChatGPT, który w tym samym czasie osiągnął 500 milionów aktywnych użytkowników tygodniowo.
Działania, które zmieniły rynek
Strategia biznesowa DeepSeek pozostaje niejasna. Firma oferuje swoje produkty po bardzo niskich cenach, a niektóre wręcz za darmo. Mimo ogromnego zainteresowania inwestorów, nie przyjmuje zewnętrznego finansowania.
DeepSeek twierdzi, że osiągnął taką efektywność kosztową dzięki przełomowym rozwiązaniom, choć niektórzy eksperci podważają te deklaracje.
Niezależnie od tego, modele DeepSeek zyskały popularność wśród developerów. Choć nie są open source w tradycyjnym rozumieniu, są dostępne na licencjach pozwalających na komercyjne wykorzystanie. Na platformie Hugging Face powstało ponad 500 pochodnych modeli R1, które zostały pobrane 2,5 miliona razy.
Sukces DeepSeek nazywany jest zarówno „przewrotem w AI”, jak i „przesadzoną hype’em”. W styczniu notowania Nvidii spadły o 18%, częściowo z powodu rosnącej popularności chińskiej firmy. Sam Altman, CEO OpenAI, publicznie skomentował osiągnięcia DeepSeek, a w marcu amerykański Departament Handlu zakazał używania ich rozwiązań na urządzeniach rządowych.
Microsoft dodał modele DeepSeek do swojej usługi Azure AI Foundry, podczas gdy Meta zapowiedziała dalsze inwestycje w infrastrukturę AI. OpenAI określiło DeepSeek jako „dotowany przez państwo” i wezwało do rozważenia zakazu jego modeli w USA.
Jensen Huang, CEO Nvidii, pochwalił innowacyjność DeepSeek, podkreślając, że modele oparte na „rozumowaniu” wymagają większej mocy obliczeniowej, co jest korzystne dla jego firmy.
Jednocześnie niektóre przedsiębiorstwa i kraje, w tym Korea Południowa, wprowadziły zakazy korzystania z DeepSeek. W maju Brad Smith z Microsoftu potwierdził, że pracownicy firmy nie mogą używać chińskiej aplikacji ze względów bezpieczeństwa danych.
Przyszłość DeepSeek pozostaje niepewna. Choć rozwój modeli jest pewny, rząd USA coraz bardziej obawia się zagranicznego wpływu. W marcu The Wall Street Journal doniósł, że DeepSeek prawdopodobnie zostanie zakazany na urządzeniach rządowych w Stanach Zjednoczonych.
Artykuł został pierwotnie opublikowany 28 stycznia 2025 roku i będzie regularnie aktualizowany.