OpenAI udostępnia narzędzie do generowania obrazów w API
W środę OpenAI wprowadziło do swojego API technologię stojącą za nową i ulepszoną funkcją generowania obrazów w ChatGPT. Dzięki temu deweloperzy mogą teraz zintegrować tę funkcjonalność z własnymi aplikacjami i usługami.
Popularność generatora obrazów OpenAI
Nowy generator obrazów OpenAI, który stał się dostępny dla większości użytkowników ChatGPT pod koniec marca, zyskał ogromną popularność dzięki tworzeniu realistycznych zdjęć w stylu Ghibli oraz generowaniu wirusowych "AI action figures". Dla OpenAI był to mieszany sukces – z jednej strony miliony nowych rejestracji w ChatGPT, z drugiej – ogromne obciążenie infrastruktury. Według firmy, ponad 130 milionów użytkowników ChatGPT wygenerowało więcej niż 700 milionów obrazów w zaledwie pierwszym tygodniu od premiery narzędzia.
Model gpt-image-1
W API OpenAI możliwość generowania obrazów jest zasilana przez model AI o nazwie "gpt-image-1". Jest to model multimodalny, który potrafi tworzyć obrazy w różnych stylach, dostosowywać się do wytycznych, wykorzystywać wiedzę o świecie oraz renderować tekst.
Deweloperzy mogą generować wiele obrazów jednocześnie za pomocą gpt-image-1, a także kontrolować jakość generowania – co wpływa również na szybkość działania.
Zabezpieczenia i znaki wodne
Według OpenAI, gpt-image-1 korzysta z tych samych zabezpieczeń co generator obrazów w ChatGPT, w tym mechanizmów ograniczających tworzenie treści niezgodnych z polityką firmy. Deweloperzy mogą dostosować czułość moderacji, wybierając opcję "auto" dla standardowego filtrowania lub "low" dla mniej restrykcyjnych ustawień. Jak wynika z dokumentacji udostępnionej TechCrunch, tryb "low" ogranicza mniej kategorii potencjalnie nieodpowiednich treści.
OpenAI informuje również, że wszystkie obrazy stworzone za pomocą gpt-image-1 są znakowane metadanymi C2PA, co pozwala identyfikować je jako wygenerowane przez AI na platformach i w aplikacjach, które obsługują ten standard.
Cennik
Ceny korzystania z API wynoszą 5 dolarów za milion tokenów wejściowych dla tekstu i 10 dolarów za milion tokenów wejściowych dla obrazów, a także 40 dolarów za milion tokenów wyjściowych dla obrazów. (Tokeny to podstawowe jednostki danych przetwarzane przez model). Według OpenAI, przekłada się to na około 2 centy, 7 centów i 19 centów za wygenerowany obraz w przypadku obrazów kwadratowych odpowiednio niskiej, średniej i wysokiej jakości.
Wykorzystanie przez firmy
OpenAI podaje, że takie firmy jak Adobe, Airtable, Wix, Instacart, GoDaddy, Canva i Figma już korzystają lub testują gpt-image-1. Na przykład platforma Figma Design umożliwia użytkownikom generowanie i edycję obrazów za pomocą gpt-image-1, a Instacart testuje model do tworzenia obrazów dla przepisów i list zakupowych.