Debiut GPT-4: z dużej chmury mały deszcz

Kazimierz Piekarz

20-03-2023

Debiut GPT-4: z dużej chmury mały deszcz

Jeszcze niecałe 2 miesiące temu z wypowiedzi Sama Altmana można było dowiedzieć się, że premiera kolejnej generacji GPT nie obędzie się w bieżącym roku, a już 14 marca 2023 roku OpenAI wypuściła GPT-4, tj. Generative Pre-trained Transformer czwartej generacji. Tym samym potwierdziły się te pogłoski, według których do debiutu ulubionego narzędzia Microsoftu miało dojść jeszcze w pierwszym kwartale lub półroczu 2023 roku.

Sztuczna inteligencja jest obecnie jednym z najważniejszych i najszybciej rozwijających się dziedzin w branży technologicznej. Wyścig najważniejszych dostawców technologii o palmę pierwszeństwa w dziedzinie AI przybiera na sile, codziennie na światło dzienne wychodzą kolejne inicjatywy związane z sztuczną inteligencją, a podejście AI-first w firmach staje się niezbędne, na giełdach „gorączka AI” rozpala wyobraźnię graczy i inwestorów.

Microsoft mocno ciśnie

Wygląda na to, że koncern z Redmond wziął sobie mocno do serca zasadę pierwszeństwa sformułowaną przez marketingowych guru – Ala Riesa i Jacka Trouta, według której lepiej być pierwszym niż lepszym, gdyż niemiłosiernie ciśnie na konkurencję – jak mówi się w języku potocznym. Ledwie Google poinformował o rozpoczęciu testów nowej usługi AI o nazwie Bard w swej wyszukiwarce i wyjaśnił, że zamierza ją starannie dopracować pod kątem jakości, bezpieczeństwa i pokrycia w faktach zanim udostępni szerokiej publiczności, Microsoft wyprowadził kolejny, szybki cios w postaci nowego, bardziej zaawansowanego modelu językowego GPT-4. Aktualnie narzędzie jest dostępne w wersji beta w abonamencie za 20 dolarów miesięcznie, a deweloperzy mogą zapisywać się na listę oczekujących do testowania API.

Co wyróżnia GPT-4 na tle poprzednika?

W firmowym blogu OpenAI czytamy, że główna różnica między GPT-4 a jego poprzednikiem GPT-3.5 jest „subtelna”. Na pierwszy rzut oka, jak mówią komentatorzy, w prostej rozmowie wyłapanie różnic w działaniu GPT-4 i GPT-3 jest niemożliwe. Ujawniają się dopiero wtedy, gdy przekroczony zostanie pewien próg złożoności zadania, którego poprzednik (GPT-3) nie był w stanie osiągnąć.

Sztuczna inteligencja w nowym wydaniu ma, według intencji jej twórców, więcej rozumieć, popełniać mniej błędów oraz być w stanie analizować i tworzyć treści multimedialne.

Na stronie internetowej OpenAI informuje, że „GPT-4 może przyjmować obrazy jako dane wejściowe i tworzyć napisy, klasyfikacje i analizy”. Potencjalnie może więc analizować zarówno tekst, jak i obraz, lecz obecnie odpowiada tylko za pomocą tekstu.

fot. GPT-4

W przyszłości zdolność GPT-4 do przetwarzania różnych typów danych wejściowych i wyjściowych może zmienić zasady gry dla chatbotów AI, takich jak ChatGPT. Jeśli będą w stanie odpowiadać za pomocą filmów lub obrazów zamiast samego tylko tekstu, wrażenia użytkowników ulegną poprawie, a interakcje staną się bardziej wciągające.

Dalej na stronie www czytamy, że „GPT-4 jest bardziej kreatywny i kooperatywny niż kiedykolwiek wcześniej. Może generować, edytować i iterować z użytkownikami w pisaniu kreatywnym i technicznym, takim jak komponowanie piosenek, pisanie scenariuszy lub uczenie użytkownika stylu pisania”.

Najnowszą wersje modelu ma też cechować dłuższy kontekst, gdyż „GPT-4 jest w stanie obsłużyć ponad 25 000 słów tekstu, co pozwala na tworzenie długich treści, rozszerzone konwersacje oraz wyszukiwanie i analizę dokumentów”.

Twórcy aplikacji na podstawie wewnętrznych ewaluacji twierdzą, że prawdopodobieństwo, że „GPT-4 odpowie na prośby o niedozwolone treści jest o 82% mniejsze, a prawdopodobieństwo uzyskania rzeczowych odpowiedzi jest o 40% większe niż w przypadku GPT-3.5”. Wynika z tego, że najnowszy model jest bezpieczniejszy i dokładniejszy. Większa dokładność GPT-4 może znacząco podnieść wiarygodność informacji w internecie. Wyszukiwarki korzystające z GPT-4 będą mogły zapewniać dokładniejsze i bardziej wiarygodne wyniki, co ograniczy rozprzestrzenianie się dezinformacji i zwiększy zaufanie użytkowników do nich.

Mimo znaczących ulepszeń, GPT-4 nadal ma ograniczenia. Twórcy przyznają, że nowy model, podobnie jak poprzednie, może generować obraźliwe lub złośliwe teksty oraz niewiarygodne informacje. Ponadto GPT-4 nadal nie potrafi odróżnić pewnych faktów od manipulacji w sieci.

Dyrektor generalny OpenAI, Sam Altman napisał na Twitterze, że GPT-4 „nadal jest wadliwy, wciąż ograniczony”, ale „nadal wydaje się robić większe wrażenie przy pierwszym użyciu, niż po spędzeniu z nim więcej czasu”.

GPT-4 a Midjourney i DALL-E

Jak ma się GPT-4 do ulubionych przez tłumy aplikacji tworzących obrazy takich, jak Midjourney i DALL-E?

ChatGPT-4 nie jest jeszcze tak zaawansowany jak one, ale w oprogramowaniu rozszerzono zakres dostępnych danych wejściowych i potrafi ono na przykład określić zawartość zdjęć przesłanych mu przez użytkownika i wyjaśnić, co się stanie jeśli odetniemy linki od balonów na powyższym obrazku. Inna opcja robiąca duże wrażenie – wystarczy wyciąć kadr z filmu, by otrzymać informacje, jacy aktorzy znajdują się na ekranie w danej scenie.

Poniżej zobacz obraz, jaki stworzyła sztuczna inteligencja na moje zapytanie o zobrazowanie świata inspirowanego filmem „Avatar – Istota wody”. Praca powstała pod koniec stycznia 2023 w aplikacji Midjourney.

fot. Obraz stworzony w aplikacji Midjourney

Tu zobaczysz prace innych użytkowników Midjourney, a tu przetestujesz podobne narzędzie – też opracowane przez OpenAI – noszące nazwę DALL-E 2.

Niedługo podobne cuda z obrazami będzie robił GPT-4.

Dlaczego Microsoft tak bardzo chce być pierwszy?

Microsoft zaliczany jest do big techów, natomiast na rynku wyszukiwarek i reklamy należy do outsiderów, ma tu jednak duże ambicje.

Wprowadzenie Bing i Edge z wykorzystaniem sztucznej inteligencji GPT-3 i GPT-4, czyli „wielki upgrade” ma pozwolić na nawiązanie rywalizacji z takimi gigantami jak Google i Chrome – z największej wyszukiwarki korzysta około miliarda użytkowników, tj. 92% użytkowników globalnej sieci, Chrome to jedna z najbardziej popularnych przeglądarek na świecie, z ponad 60% udziałem w rynku (dane StatCounter za 2022 rok).

Nawet jeśli wskutek dopalenia ChatemGPT-3 korzystanie z przeglądarki Edge i wyszukiwarki Bing wzrosłoby o 1/3, co byłoby skokiem w porównaniu do bazowych 3-5% udziału, nadal wyglądałoby mizernie w porównaniu do pozycji, jaką mają Chrome i Google. Trzeba jednak zaznaczyć, że potencjał Edge jest ogromny – występuje u użytkowników ponad 86% komputerów z systemem Windows 10 lub 11.

Microsoft chce zwiększyć udział Binga w rynku wyszukiwań, aby walczyć o gigantyczne pieniądze na rynku reklamy. Jak podaje Statista, na reklamy w wyszukiwarkach wydano zawrotne 260 mld dolarów w 2022 roku, z czego wynika, że 1% udziału w rynku reklamy w wyszukiwarkach wart był 2,6 mld dolarów. Mając 3,2% udziału w rynku wyszukiwań, Bing osiągnął ponad 11,6 mld dolarów przychodów z reklam (źródło: Statista za 2022 rok), co stanowiło ponad 4,4% udziału w rynku reklamy w wyszukiwarkach, a więc znacznie więcej niż wynikałoby z udziału Binga w rynku wyszukiwań. Dla Microsoftu każdy punkt procentowy udziału Binga w rynku wyszukiwań więcej może dać aż o 3,6 mld dolarów więcej przychodów z reklam. Nic dziwnego, że Microsoft z taką ochotą atakuje rynek użytkowników wyszukiwarek.

Zapowiadany debiut GPT-4 rozczarował – stąd powyższy tytuł, jednak piłka jest ciągle w grze, wkrótce może pojawić się GPT-5, itd. Z pewnością ani OpenAI oraz Microsoft, ani konkurencja nie powiedzieli ostatniego słowa.

Tagi: AI ChatGPT

Komentarze:

Comments

comments