Bielik to polski model AI, który wywołuje skrajne reakcje. Wiemy, co go czeka w przyszłości

22 kwietnia 2024 7 minut czytania

W kwietniu w sieci zrobiło się głośno o polskim modelu językowym Bielik 7B, który został zaprezentowany przez zespół SpeakLeash. Po pierwszych zachwytach nad tym, że mamy „polski ChatGPT” szybko pojawiły się krytyczne opinie na temat narzędzia ze strony osób, które udowadniały, że Bielik nie ma pojęcia o oczywistych rzeczach. Sebastian Kondracki z zespołu SpeakLeash, w wypowiedzi dla Android.com.pl, odniósł się do tych zarzutów.

Spis treści

Bielik, czyli polski model AI

orzeł bielik — Fot. Jevgeni Fil / Unsplash

Zespół SpeakLeash pochwalił się swoim modelem językowym Bielik-7B-v 0.1. To generatywne narzędzie oparte na architekturze Mistral-7B-v0.1. Nazwa „Bielik” nawiązuje do języka polskiego oraz do samolotu szkolno–treningowego M–346 BIELIK. Symbolizuje to aspiracje zespołu do szkolenia polskich inżynierów deep-tech, naukowców danych oraz studentów kierunków pokrewnych.

Jak wyjaśnia nam Sebastian Kondracki z zespołu odpowiedzialnego za Bielika, model ten wyróżnia się przede wszystkim doskonałym generowaniem odpowiedzi w języku polskim.

Każda odpowiedź generowana przez pełną wersję modelu (16 bit) jest na poziomie, jakby była pisana przez doświadczonego polonistę. Dodatkowo model powstał w ramach społeczności „open science” / „open source”, co oznacza, że każdy może przejrzeć jego kod źródłowy, użyć go, a także wykorzystać dane, które posłużyły do jego treningu.
Sebastian Kondracki dla Android.com.pl

Zespół odpowiedzialny za szkolenie modelu tworzą m.in. Krzysztof Ociepa, Adrian Gwoździej i Krzysztof Wróbel ze SpeakLeash, a także Łukasz Flis z Cyfronet AGH. Dem o Bie lika 7B trafiło do internetu i każdy może skorzystać z tego narzędzia. Jest to bezpłatne, nie wymaga żadnego tworzenia konta ani logowania.

Polski model językowy w ogniu krytyki. Nie zna marszałka Sejmu i… „jest głupi”

Początkowo Bielik wzbudził spory entuzjazm. Niektóre media okrzyknęły go mianem „polskiego ChataGPT”. W tekstach dotyczących polskiego modelu językowego pojawiały się sformułowania o „szybowaniu ku przyszłości” oraz „przełomie w sztucznej inteligencji”. Jednak, jak już wspominaliśmy, demo Bielika jest ogólnodostępne (np. na laptopach do 2000 zł) i niektórzy postanowili sprawdzić, jak działa, a to przełożyło się na krytykę narzędzia od SpeakLeash.

kadr z filmu Kuby Klawitera o modelu Bielik — Fot. Kuba Klawiter / YouTube, zrzut ekranu

Business Insider zauważył, że polski model AI nie wie, kto jest marszałkiem Sejmu oraz nie rozumie pytań wielokrotnego wyboru. Narzędzie miało też twierdzić, że zostało stworzone przez OpenAI. Z kolei Kuba Klawiter opublikował na YouTube film „Polski ChatGPT nazywa się Bielik i jest głupi”. Znany w branży technologicznej twórca pokazał, że polski model językowy podczas rozmowy z nim twierdzi m.in., że jest „najpopularniejszą polską marką laptopów” i że został stworzony przez Microsoft. Bielik zupełnie nie radził sobie także ze wskazaniem aktualnej daty.

Dla pewności sami postanowiliśmy sprawdzić, czy polski model AI odpowiada w ten sposób. W przypadku pytania „kim jesteś?” odpowiedź wyglądała na poprawną, nie pojawiło się w niej nic o marce laptopów, OpenAI i Microsofcie. Polski model językowy niepoprawnie wskazywał jednak marszałka Sejmu (najzwyczajniej myliły mu się kadencje), jeśli zaś chodzi o datę, to tworzył przedziwne teorie. Możecie to zobaczyć na zrzutach ekranu poniżej.

rozmowa z modelem językowym Bielik — Fot. huggingface.co/spaces/speakleash/Bielik-7B-Instruct-v0.1, zrzut ekranu

Wyglądało to trochę tak, jakby narzędzie od SpeakLeash dysponowało zbiorem danych tylko do pewnej daty. Model wspomniał o informacjach „dostarczonych do 22 maja 2023 roku”, a np. na pytanie o najnowszego iPhone’a wskazywał serię „14”.

„Bielik nie jest prymitywny, po prostu służy innym celom”

Sebastian Kondracki w wypowiedzi dla Android.com.pl zaznacza, że zaszły pewne nieporozumienia, które chciał wyjaśnić.

Kiedy fundacja non–profit SpeakLeash wprowadziła na rynek polski duży model językowy, Bielik, wiele osób zaczęło porównywać go do ChatGPT OpenAI, a także błędnie go testować. Bielik jest dużym, ale kompaktowym modelem językowym, mającym jedynie 7 miliardów parametrów. Dla porównania jedna z pierwszych wersji modelu GPT-3 miała 175 miliardów parametrów. Co więcej, Bielik został stworzony na bazie około 36 miliardów tokenów, podczas gdy zbiór treningowy GPT-3 liczył ponad 500 miliardów tokenów.
Sebastian Kondracki dla Android.com.pl

Jak zatem można porównać rozwiązania od SpeakLeash i OpenAI?

Można powiedzieć, że ChatGPT jest jak ogromna ciężarówka TIR, a Bielik nowoczesnym wózkiem widłowym. To nie oznacza, że Bielik jest prymitywny; po prostu służy innym celom.
Sebastian Kondracki dla Android.com.pl

Sebastian Kondracki przekonuje, że Bielik doskonale radzi sobie z transformacją tekstu, ekstrakcją informacji oraz strukturyzacją danych, jednak nie sprawdzi się najlepiej w rozmowach o bieżącej polityce i gospodarce. Nasz rozmówca ma także odpowiedź na to, że polski model językowy czasami nie potrafi przedstawić prawdziwych informacji na swój temat.

Nie umie [Bielik – red.] mówić o sobie, ponieważ nie przewidywaliśmy, że przedsiębiorca analizujący prywatne dokumenty będzie potrzebował pytać o naturę Bielika czy o to, czy posiada on „duszę”.
Sebastian Kondracki dla Android.com.pl

Dłoń dotykająca interfejsu z ikoną AI na tle schematycznego przedstawienia sieci neuronowej. — Fot. everythingposs / Depositphotos

Sebastian Kondracki twierdzi, że Bielik jest przydatny w analizie komentarzy, wykrywaniu mowy nienawiści, wulgaryzmów i ogólnie tekstów nieodpowiednich, a także potrafi rozpoznawać ironię i sarkazm oraz wyjaśniać podstawy podjętej decyzji. Nasz rozmówca przyznaje jednak, że polski model językowy ma stosunkowo małą liczbę parametrów niepozwalającą na generowanie długich tekstów bez odpowiedniego kontekstu.

Jaki dalszy los czeka Bielika?

Nowy Bielik ma przewyższyć możliwości obecnej wersji dzięki trenowaniu na większym zbiorze wysokiej jakości danych. Obecnie SpeakLeash pracuje nad stworzeniem zaawansowanej aplikacji demonstracyjnej, w której znajdzie się edytor dialogów oraz instrukcji. W planach jest to, żeby Bielik mógł być uczestnikiem bardziej zaawansowanych dialogów, zbliżonych do tych znanych z ChatGPT.

Rozpoczynając prace nad Bielikiem, mieliśmy dwa główne cele: pierwszy to dostarczyć polskim przedsiębiorcom darmową alternatywę dla istniejących rozwiązań (np. OpenAI); drugi, to stworzyć model, który mówi jak rdzenny Polak, rozumiejący kulturowe niuanse, a nie jak osoba mówiąca po polsku bez zrozumienia tych subtelności. Chcieliśmy, aby model znał przepis na proziaki, rozumiał różnicę między barszczem białym a żurem, i wiedział, że na pytanie „Co u Ciebie?” odpowiedź „Super” nie jest tak właściwa, jak „Stara bida” lub „Dziękuję, słabo”.
Sebastian Kondracki dla Android.com.pl

Zdaniem Sebastiana Kondrackiego pierwszy cel został już osiągnięty (choć w przyszłości Bielik ma móc brać udział w bardziej skomplikowanych rozmowach niż obecnie). Nad osiągnięciem drugiego celu prace jeszcze trwają.

Po co nam polskie modele językowe?

Czterech animowanych robotów o wyglądzie antropomorficznym siedzących przy biurkach i korzystających z laptopów, z oznaczeniem "AI" na ich tułowiach i na ekranach laptopów; tło jest jednolite, szare. — Fot. Mohamed Nohassi / Unsplash

Ktoś mógłby się zastanawiać, po co nam w ogóle „lokalne” modele językowe, które będą np. stworzone w Polsce i dostosowane do komunikacji w polskim języku (który, choć u nas jest oczywistym wyborem, na świecie wcale zbyt popularny nie jest). Powodów jest kilka. O jednym z nich Sebastian Kondracki wspomniał w wywiadzie dla portalu mamstartup.pl.

Po pierwsze czynniki kulturowe, niuanse językowe. Nam wydaję się, że GPT-4 mówi idealnie po polsku. On jest Amerykaninem, który nauczył się idealnie języka polskiego. Nie wie, że w Polsce sąsiedzi na pytanie „jak się masz?” nie odpowiadają „dziękuję, świetnie” tylko „e tam stara bieda”. Jak tworzymy tytuły, to nie używamy wielkich liter np. „Przełomowa Technologia Jutra” tylko „Przełomowa technologia jutra”.
Sebastian Kondracki dla mamstartup.pl

Większa liczba dopracowanych modeli językowych to także przeciwdziałanie ew. monopolowi OpenAI, a różnorodność dostępnych rozwiązań na ogół przekłada się na korzyść użytkowników.

Poza tym sztuczna inteligencja w przyszłości w coraz większym stopniu może służyć np. analizie danych medycznych i innych wrażliwych informacji. Posiadanie własnych narzędzi AI w takiej sytuacji może dawać większe poczucie bezpieczeństwa.

Źródło: LinkedIn, Business Insider, YouTube/Kuba Klawiter, mamstartup.pl, opracowanie własne. Zdjęcie otwierające: obraz wygenerowany za pomocą DALL-E

Część odnośników to linki afiliacyjne lub linki do ofert naszych partnerów. Po kliknięciu możesz zapoznać się z ceną i dostępnością wybranego przez nas produktu – nie ponosisz żadnych kosztów, a jednocześnie wspierasz niezależność zespołu redakcyjnego.