Mohammad Abu Sheikh – lider innowacji AI w regionie MENA
Mohammad Abu Sheikh zmienia oblicze sztucznej inteligencji na Bliskim Wschodzie i w Afryce Północnej, przechodząc od biernego korzystania z technologii do tworzenia własnych rozwiązań. Jako dyrektor generalny CNTXT AI oraz założyciel funduszu AI o wartości 10 milionów dolarów doprowadził do trzech udanych wyjść inwestycyjnych i pozyskał ponad miliard dolarów finansowania. Jego działania tworzą podstawy ekosystemu AI opartego na języku, kulturze i suwerenności danych.
CNTXT AI oferuje kompleksowe usługi związane z cyklem życia sztucznej inteligencji, obejmujące przygotowanie danych, tworzenie modeli, testowanie oraz wdrażanie. Platforma wspiera wielojęzyczne aplikacje AI, ze szczególnym naciskiem na modele językowe dla języka arabskiego, kładąc duży nacisk na bezpieczeństwo i kontrolę nad danymi.
Co zainspirowało Cię do stworzenia CNTXT AI i jak narodziła się wizja suwerennej AI dla świata arabskojęzycznego?
Dostrzegliśmy ogromny potencjał niewykorzystanych danych w naszym regionie. Główną przeszkodą w rozwoju AI był brak odpowiednio przygotowanych danych, co przekładało się na brak gotowości do wdrażania rozwiązań. To właśnie stało się impulsem do założenia CNTXT AI.
Początkowo rozwiązywaliśmy problemy, z którymi sami się zmagaliśmy przy tworzeniu LocAI... Doświadczyliśmy tych wyzwań, współpracując z takimi podmiotami jak AI71, TII i G42 (IIAI). Pomagając im, nasza wizja stawała się coraz wyraźniejsza, a biznes naturalnie się rozwijał.
Odegrałeś kluczową rolę w budowie największej cyfrowej biblioteki danych do trenowania AI w języku arabskim. Jakie były największe wyzwania i jak sobie z nimi poradziliście?
Jakość danych stanowiła ogromne wyzwanie. Kolejnym problemem był ograniczony dostęp do wysokiej jakości treści w języku arabskim w internecie – arabski jest poważnie niedoreprezentowany w sieci. Tylko niewielka część arabskojęzycznych materiałów została zdigitalizowana, a zaledwie 3-5% treści online jest w tym języku. To niemal nic. Rozwiązaliśmy ten problem, zatrudniając specjalistów od oznaczania i opracowywania danych, którzy pomogli nam tworzyć i porządkować potrzebne zasoby.
CNTXT AI działa na styku kultury i technologii. Jak łączycie najnowocześniejsze rozwiązania AI z budowaniem kulturowo dopasowanych produktów dla regionu MENA?
Tworzymy modele głęboko zakorzenione w kulturze już od podstaw. Od infrastruktury po gotowy produkt – kultura jest wpisana w każdy etap, a nie dodawana później. Projektujemy i budujemy z myślą o konkretnych kulturach, dialektach i potrzebach od samego początku. Arabski to jeden język, ale obejmuje wiele dialektów i kontekstów kulturowych, dlatego tworzymy lokalne rozwiązania dla poszczególnych krajów. Robimy to, współpracując z miejscowymi specjalistami w ich ojczyznach.
Jesteś również współzałożycielem LocAI i prowadzisz fundusz SMPL AI. W jaki sposób te inicjatywy uzupełniają misję CNTXT AI?
LocAI to warstwa aplikacyjna – część, z którą użytkownicy faktycznie wchodzą w interakcję. Opiera się bezpośrednio na danych i infrastrukturze stworzonej przez CNTXT AI. To właśnie przyczyniło się do jej sukcesu: przekształca fundamenty dostarczone przez CNTXT AI w realne rozwiązania dla ludzi.
SMPL AI z kolei to sposób na oddanie społeczności. Skupiamy się na inwestowaniu w startupy na wczesnym etapie i wspieraniu rozwoju regionalnego ekosystemu AI. Dzielimy się narzędziami i doświadczeniami z budowania AI, aby pomóc innym uniknąć typowych błędów i rozwijać się szybciej.
Munsit został okrzyknięty najdokładniejszym modelem rozpoznawania mowy w języku arabskim na świecie. Co stało za jego rozwojem i dlaczego właśnie teraz?
Powód był prosty: potrzeba.
Zawsze tworzymy w odpowiedzi na realne zapotrzebowanie. Analizując rynek, dostrzegliśmy, że nadszedł odpowiedni moment – zarówno agencje rządowe, jak i prywatni klienci domagali się takiego rozwiązania.
Istniejące modele nie spełniały oczekiwań. Większość z nich powstała w oparciu o technologie anglojęzyczne, które później adaptowano. Nie były projektowane specjalnie dla języka arabskiego, a już na pewno nie z myślą o specyficznych problemach, które my rozwiązujemy.
Właśnie dlatego postanowiliśmy zbudować własny model. Od podstaw stworzony dla języka arabskiego.
Badania stojące za Munsit wykorzystują podejście słabo nadzorowanego uczenia maszynowego. Możesz wyjaśnić, co to oznacza i dlaczego było to kluczowe przy skalowaniu treningu dla arabskiego rozpoznawania mowy?
Oznaczanie danych jest kosztowne. Musieliśmy wyjść poza tradycyjne metody oparte na ręcznej transkrypcji dużych zbiorów. Słabo nadzorowane uczenie pozwoliło nam skalować proces bez konieczności manualnego opisywania każdego pliku audio – co jest szczególnie ważne w przypadku arabskiego, języka o ograniczonych zasobach danych i wielu dialektach.
Zamiast korzystać z profesjonalnie przetranskrybowanych nagrań, zaczęliśmy od 30 000 godzin nieoznakowanej mowy arabskiej. Stworzyliśmy system automatycznego generowania, filtrowania i czyszczenia najlepszych próbek. W ten sposób uzyskaliśmy wysokiej jakości zbiór 15 000 godzin – wszystko bez udziału ludzkich transkrybentów.
To podejście umożliwiło trening modelu od podstaw, uchwycenie bogactwa mówionego arabskiego w różnych sytuacjach życiowych, szybko i przy rozsądnych kosztach. Bez tej metody budowa systemu rozpoznawania mowy na taką skalę zajęłaby lata i wymagała milionowych nakładów na pracę manualną.
Munsit przewyższył modele OpenAI, Microsoftu i Meta w wielu testach porównawczych. Co to osiągnięcie mówi o przyszłości innowacji AI w świecie arabskojęzycznym?
Przyszłość arabskiej AI jest w naszych rękach – i to właśnie potwierdza ten sukces. Nie możemy już polegać na technologiach, których nie posiadamy, ani zależeć od podmiotów, które nie stawiają naszego regionu na pierwszym miejscu.
Munsit dowodzi, że potrafimy budować światowej klasy AI, tworzoną w regionie, dla regionu – wykorzystując lokalne talenty do rozwiązywania lokalnych problemów. To wyraźny sygnał, że kolejna fala innowacji w arabskiej AI przyjdzie z wewnątrz.
Jak widzisz ewolucję Munsit w przyszłych wersjach i jakie są kolejne granice dla technologii głosowych w CNTXT?
Musicie poczekać i zobaczyć. Mogę tylko powiedzieć, że przygotowujemy nową serię rozwiązań AI stworzonych specjalnie dla języka arabskiego – wszystkie oparte na Munsit i innych modelach, nad którymi obecnie pracujemy w CNTXT AI. To dopiero początek.
Często mówisz o znaczeniu "suwerennej AI". Co dla Ciebie oznacza to pojęcie i dlaczego jest kluczowe dla Zatoki Perskiej i szerszego regionu MENA?
Dla mnie suwerenna AI to pełna kontrola i własność danych, infrastruktury oraz modeli, które kształtują naszą przyszłość. To kluczowe, ponieważ musimy sami decydować o swoim losie, a zaczyna się to od danych.
Suwerenność danych to podstawa. Dane są cenne i musimy zapewnić, by pozostawały w naszych rękach.
Nie możemy pozwolić sobie na oddanie przyszłości w czyjeś ręce i bierne przyglądanie się, jak inni budują za nas technologie. Przyszłość AI w tym regionie musi wyjść z tego regionu. Właśnie nad tym pracujemy.
Jak Twoim zdaniem CNTXT AI będzie kształtować ekosystem AI na Bliskim Wschodzie w ciągu najbliższych pięciu lat?
Zapewniając prawdziwą gotowość na AI. Wchodzimy, analizujemy potrzeby firm i rządów, budujemy strategie danych i AI, a następnie pomagamy w tworzeniu, testowaniu, wdrażaniu i skalowaniu rozwiązań.
Jeśli dane to nowa ropa, to dane nieustrukturyzowane to ropa nieprzetworzona – pełna potencjału, ale bezużyteczna bez odpowiedniego przetworzenia. Dlatego stworzyliśmy CNTXT AI, aby pomagać organizacjom czyścić, porządkować i aktywować swoje dane. Bo właśnie tam zaczyna się prawdziwa transformacja AI.
Z Twojej perspektywy jako przedsiębiorcy i inwestora, jaką radę dałbyś innym założycielom startupów AI na rynkach wschodzących?
Zaczynajcie już teraz. Działajcie szybko. Popełniajcie błędy, uczcie się na nich i ciągle udoskonalajcie.
Najważniejsze, aby budować rozwiązania dla realnych problemów. Trzymajcie rękę na pulsie – słuchajcie użytkowników, a nie tylko podążajcie za modą. Na rynkach wschodzących kluczowe są trafność i elastyczność.
Dziękuję za świetny wywiad. Czytelnicy, którzy chcą dowiedzieć się więcej, mogą odwiedzić CNTXT AI.