Google ujawnia Gemini. I twierdzi, że to najpotężniejszy model AI w historii

6 grudnia 2023 3 minuty czytania

Gemini, najnowsze osiągnięcie Google w dziedzinie sztucznej inteligencji, jest opisany jako najbardziej wydajny i wszechstronny model AI firmy, który wyróżnia się w testach porównawczych. W niektórych kategoriach przegonił nawet GPT-4 od OpenAI.

Sprawdź, co możesz zyskać za 40 groszy dziennie

Google ujawnia Gemini – Spis treści

Trzy warianty modelu Gemini

Grafika z napisem "Gemini" w centrum na czarnym tle, z dwiema liniami świetlnymi łączącymi się w punkt i przechodzącymi przez sieć z efektem świetlnym. — Fot. Google

Jak podaje Google w najnowszym wpisie na blogu, Gemini 1.0 został wytrenowany, aby jednocześnie rozpoznawać i rozumieć tekst, obrazy, dźwięki i inne typy danych. Dzięki temu lepiej rozumie niuanse zawarte w informacjach i może odpowiadać na pytania dotyczące skomplikowanych zagadnień.

Introducing Gemini, Google’s largest and most capable AI model. 🧵 #GeminiAI https://t.co/T0tIw9HQyO
— Google (@Google) December 6, 2023

Tłumaczenie: Przedstawiamy Gemini, największy i najpotężniejszy model sztucznej inteligencji Google.

Model Gemini 1.0, pierwsza wersja tego systemu, został stworzony w trzech wersjach – Ultra, Pro i Nano – co pozwala na jego zastosowanie w różnych kontekstach i skalach.

Gemini Ultra – najbardziej wydajny i największy model przeznaczony do realizacji bardzo złożonych zadań.
Gemini Pro – najlepszy model do skalowania bardzo zróżnicowanych zadań.
Gemini Nano – najskuteczniejszy model do realizacji zadań na urządzeniach mobilnych.

To rozwiązanie jest częścią długoterminowej wizji Google w dziedzinie AI, która rozpoczęła się od tworzenia Google DeepMind.

We’re excited to announce 𝗚𝗲𝗺𝗶𝗻𝗶: @Google’s largest and most capable AI model.

Built to be natively multimodal, it can understand and operate across text, code, audio, image and video – and achieves state-of-the-art performance across many tasks. 🧵 https://t.co/mwHZTDTBuG pic.twitter.com/zfLlCGuzmV
— Google DeepMind (@GoogleDeepMind) December 6, 2023

Tłumaczenie: Z radością ogłaszamy Gemini, który jest największym i najbardziej wydajnym modelem sztucznej inteligencji. Zbudowany jako natywnie multimodalny, może rozumieć i obsługiwać tekst, kod, dźwięk, obraz i wideo, a także osiąga najnowocześniejszą wydajność w wielu zadaniach.

Testy porównawcze z GPT-4

Modele Gemini zostały przetestowane w różnorodnych zadaniach, takich jak rozumienie obrazów, rozumowanie matematyczne, analiza materiałów audio i wideo. Google w swoim poście na blogu podaje, że Gemini Ultra wyróżnia się w 30 z 32 powszechnie stosowanych testów i standardów akademickich stosowanych w badaniach dużych modeli językowych (LLM).

Gemini Ultra osiągnął wynik 90% w testach MMLU (ang. Massive Multitask Language Understanding). Jest to zaawansowany test oceniający zdolności modeli sztucznej inteligencji (AI) w zakresie rozumienia języka. MMLU wykorzystuje połączenie 57 dziedzin nauki do testowania światowej wiedzy i możliwości rozwiązywania problemów. Jak wynika z badania, w porównaniu z GPT-4 (ang. Generative Pre-trained Transformer 4, model AI opracowany przez OpenAI) Gemini Ultra osiągnął wyższe wyniki w prawie każdej kategorii, takiej jak generalne rozwiązywanie zadań, matematyka czy kodowanie.

O wynikach testów porównawczych i wysokich wynikach Gemini wspomina także Sundar Pichai, CEO Google, w swoim wpisie na X (dawniej Twitter).

Introducing Gemini 1.0, our most capable and general AI model yet. Built natively to be multimodal, it’s the first step in our Gemini-era of models. Gemini is optimized in three sizes – Ultra, Pro, and Nano

Gemini Ultra’s performance exceeds current state-of-the-art results on… pic.twitter.com/pzIw6iCPPN
— Sundar Pichai (@sundarpichai) December 6, 2023

Tłumaczenie: Przedstawiamy Gemini 1.0, nasz najbardziej wydajny i ogólny model sztucznej inteligencji jak dotąd. Zbudowany natywnie jako multimodalny, jest pierwszym krokiem w naszej erze modeli Gemini. Gemini jest zoptymalizowany w trzech rozmiarach – Ultra, Pro i Nano. Wydajność Gemini Ultra przewyższa najnowocześniejsze wyniki w 30 z 32 powszechnie używanych testów akademickich. Z wynikiem 90,0% Gemini Ultra jest pierwszym modelem, który w MMLU przewyższa ludzkich ekspertów.

Gemini w narzędziach Google

Obecnie model Gemini 1.0 jest wprowadzany w wielu usługach i na różnych platformach. Od 6 grudnia będzie używał go m.in. Google Bard, który dzięki temu ma radzić sobie o wiele sprawniej z rozumieniem i podsumowywaniem, argumentowaniem, pisaniem i planowaniem. Pixel 8 Pro to pierwszy smartfon, który będzie działać z Gemini Nano, dzięki czemu zyska nowe funkcje, np. inteligentną odpowiedź w Gboard (na razie tylko w aplikacji WhatsApp).

O Gemini opowiadają eksperci Google w poniższym filmie.

Na koniec przypominamy także, jak wylogować się z konta Google oraz jak wyłączyć asystenta Google na urządzeniach mobilnych z Android i iOS oraz komputerze.

Sprawdź, co możesz zyskać za 40 groszy dziennie

Źródło: Google, oprac. własne