Logo ChatGPT na ekranie smartfona na tle powiększonego logo w czarno-białej kolorystyce.

ChatGPT, Claude i Meta AI poległy na prostym pytaniu. Odpowiedź znają nawet przedszkolaki

3 minuty czytania
Komentarze

ChatGPT jest niezastąpionym narzędziem, gdy trzeba zoptymalizować kod w języku programistycznym, przepisać tabelkę na inny format, czy też przepracować kilka pomysłów w formie „sztucznej” burzy mózgów. Jednak z elementarnymi podstawami, aplikacja w ogóle sobie nie radzi. Udowodniono to już wielokrotnie w anglojęzycznej wersji… a ja pokażę wam, że dotyczy on także i pewnych kwestii w języku polskim.

ChatGPT nie „rozumie” liter po angielsku i po polsku

Dojrzałe truskawki na krzaku, o intensywnym czerwonym kolorze.
Fot. MarBom / Shutterstock

Inspiracją dla tego prostego testu okazały się problematyczna po angielsku truskawka, czyli strawberry. Jeden z użytkowników Reddita testował różne czatboty (GPT 4-o, Claude 3.5, Meta AI) na podstawie prostego pytania. Ile liter „r” znajduje się w słowie strawberry?

Wydawać się mogło, zadanie dla przedszkolaka. Otóż nie, bo żaden z modeli nie udzielił prawidłowej odpowiedzi. Rekordzistką była Meta AI, twierdząc, że w słowie nie ma żadnej litery „r”. Dlatego też postanowiłem przeprowadzić ten sam eksperyment, tyle że po polsku, na nieco bardziej „lokalnym” owocu.

Ile liter „r” znajduje się w słowie rabarbar? To nie jest takie oczywiste

Deska do krojenia z łodygami rabarbaru otoczona składnikami kuchennymi, takimi jak sól, oliwa, jabłka i narzędzia kuchenne.
Fot. AtlasStudio / Shutterstock

Choć my doskonale wiemy, że trzy litery „r” znajdują się w słowie rabarbar, dla jednego z czterech sprawdzanych czatbotów nie było to oczywiste. Tym samym pytaniem z elementarza przetestowałem GPT 4-o, GPT 4-o mini, GPT 4 oraz Google Gemini. Wyniki widać na obrazkach poniżej.

Jak widzicie powyżej, GPT 4-o mini uważa, że w słowie rabarbar znajdują się cztery litery „r”. Nie ma co ukrywać, intrygujące. Aczkolwiek, to zaledwie wierzchołek góry lodowej.

Elementarz to dla Chat GPT 4-o trudna sprawa

Fot. ChatGPT / zrzut ekranu

Najbardziej rozbawiło mnie zapytanie GPT 4-o (w teorii najlepszego dostępnego modelu od OpenAI) o to, ile samogłosek znajduje się w słowie żółć. Czatbot najpierw popełnił błąd, a następnie sam się poprawił, jak powyżej.

Aczkolwiek, na trudniejszym zadaniu z literkami GPT 4-o także poległo. Padło pytanie o liczbę liter „z” w legendarnym Szczebrzeszynie, mieście w województwie lubelskim.

Fot. ChatGPT / zrzut ekranu

Nawet gdyby uwzględnić, że dwuznaki to nie litery (co jest nieprawdą, dwuznak składa się z dwóch liter), to i tak odpowiedź GPT 4-o nie byłaby prawidłowa. Jak więc widzicie, być może lepiej nie wykorzystujcie oprogramowania OpenAI do powtórek z elementarza. Być może robienie przelewów jest lepszym powołaniem dla AI… choć jednocześnie przypominamy, że bez względu na to, do czego na co dzień chcielibyście AI wykorzystywać, do efektów zawsze warto podchodzić ze zdrowym sceptycyzmem i ostrożnością. To w końcu „tylko” (i „aż” jendoczesnie) technologia.

Zdjęcie otwierające: Sir. David / Shutterstock

Część odnośników to linki afiliacyjne lub linki do ofert naszych partnerów. Po kliknięciu możesz zapoznać się z ceną i dostępnością wybranego przez nas produktu – nie ponosisz żadnych kosztów, a jednocześnie wspierasz niezależność zespołu redakcyjnego.

Motyw