Smartfon z ekranem wyświetlającym logo ChatGPT, aplikacji stworzonej przez OpneAI, położony na tle metalicznych heksagonów.

OpenAI odzyskało koronę. GPT-4 Turbo najlepszym modelem językowym w ślepych testach

2 minuty czytania
Komentarze

OpenAI może odetchnąć z ulgą, ponieważ – przynajmniej w kontekście wydajności – korporacji udało się powstrzymać największą konkurencję. Choć twórcy Claude 3 Opus świętowali pod koniec marca 2024 r., teraz muszą ustąpić GPT-4 Turbo. Tylko czas pokaże, czy przepychanka między firmą Sama Altmana i Anthropic będzie trwać.

OpenAI ponownie na szczycie rankingu

Tabela pierwszych 10 pozycji z LMSYS Chatbot Arena. Czołówka została zdominowana przez produkty OpenAI. Fot. LMSYS Chatbot Arena / własny zrzut ekranu

OpenAI objęło pozycję lidera za sprawą modelu GPT-4 Turbo, a dokładniej jego rewizji z 9 kwietnia 2024 r. To on właśnie wyprzedził Claude 3 Opus w ogólnej ewaluacji ślepych testów o 5 punktów, co firma Sama Altmana może już uznać za symbol własnego sukcesu. Warto przypomnieć, że ślepe testy polegają na otrzymaniu odpowiedzi na to samo zapytanie od dwóch modeli i wyborze tej, która bardziej satysfakcjonuje końcowego użytkownika.

Ciekawsze rzeczy dzieją się jednak na 3. i 4. lokacie. To kolejne rewizje GPT-4 Turbo, które doganiają Claude 3 Opus w ogólnej ewaluacji. Za nimi znajduje się Google Gemini Pro i dopiero w końcówce TOP 10 dostrzegamy tańsze modele Anthropic, czyli Claude 3 Sonnet oraz Claude 3 Haiku.

Użytkownicy cieszą się z rozwoju, z dość ciekawego powodu

logo Open AI z napisem "OpenAI" umieszczone na szklanej ścianie w której odbijają się chmury
Fot. Skorzewiak / Depositphotos

Na subreddicie poświęconym dokonaniom OpenAI zapanował spory entuzjazm, ale nie bezpośrednio z powodu wyników GPT-4 Turbo. Choć fani uważają, że Anthropic uda się jeszcze przegonić model firmy Sama Altmana, to na konkurencji zyskują wszyscy użytkownicy sztucznej inteligencji.

Wnioski są proste. Im szybszy rozwój technologii, tym szybciej będzie tanieć dostęp do starszych modeli. Te również nie są najgorsze, a pozwolą użytkownikom rozwijać swoje zainteresowania sprawniej, poszerzać wiedzę i optymalizować procesy. Tak przyszłościowa technologia powinna być dostępna dla mniej zamożnych, co by wyrównywać szanse na sukces. Obecne tempo rozwoju sprawia, że będzie na tym polu tylko coraz lepiej.

Zdjęcie otwierające: Mehaniq / Depositphotos

Część odnośników to linki afiliacyjne lub linki do ofert naszych partnerów. Po kliknięciu możesz zapoznać się z ceną i dostępnością wybranego przez nas produktu – nie ponosisz żadnych kosztów, a jednocześnie wspierasz niezależność zespołu redakcyjnego.

Motyw