Gemini, najnowsze osiągnięcie Google w dziedzinie sztucznej inteligencji, jest opisany jako najbardziej wydajny i wszechstronny model AI firmy, który wyróżnia się w testach porównawczych. W niektórych kategoriach przegonił nawet GPT-4 od OpenAI.
Google ujawnia Gemini – Spis treści
Trzy warianty modelu Gemini
Jak podaje Google w najnowszym wpisie na blogu, Gemini 1.0 został wytrenowany, aby jednocześnie rozpoznawać i rozumieć tekst, obrazy, dźwięki i inne typy danych. Dzięki temu lepiej rozumie niuanse zawarte w informacjach i może odpowiadać na pytania dotyczące skomplikowanych zagadnień.
Model Gemini 1.0, pierwsza wersja tego systemu, został stworzony w trzech wersjach – Ultra, Pro i Nano – co pozwala na jego zastosowanie w różnych kontekstach i skalach.
- Gemini Ultra – najbardziej wydajny i największy model przeznaczony do realizacji bardzo złożonych zadań.
- Gemini Pro – najlepszy model do skalowania bardzo zróżnicowanych zadań.
- Gemini Nano – najskuteczniejszy model do realizacji zadań na urządzeniach mobilnych.
To rozwiązanie jest częścią długoterminowej wizji Google w dziedzinie AI, która rozpoczęła się od tworzenia Google DeepMind.
Testy porównawcze z GPT-4
Modele Gemini zostały przetestowane w różnorodnych zadaniach, takich jak rozumienie obrazów, rozumowanie matematyczne, analiza materiałów audio i wideo. Google w swoim poście na blogu podaje, że Gemini Ultra wyróżnia się w 30 z 32 powszechnie stosowanych testów i standardów akademickich stosowanych w badaniach dużych modeli językowych (LLM).
Gemini Ultra osiągnął wynik 90% w testach MMLU (ang. Massive Multitask Language Understanding). Jest to zaawansowany test oceniający zdolności modeli sztucznej inteligencji (AI) w zakresie rozumienia języka. MMLU wykorzystuje połączenie 57 dziedzin nauki do testowania światowej wiedzy i możliwości rozwiązywania problemów. Jak wynika z badania, w porównaniu z GPT-4 (ang. Generative Pre-trained Transformer 4, model AI opracowany przez OpenAI) Gemini Ultra osiągnął wyższe wyniki w prawie każdej kategorii, takiej jak generalne rozwiązywanie zadań, matematyka czy kodowanie.
O wynikach testów porównawczych i wysokich wynikach Gemini wspomina także Sundar Pichai, CEO Google, w swoim wpisie na X (dawniej Twitter).
Gemini w narzędziach Google
Obecnie model Gemini 1.0 jest wprowadzany w wielu usługach i na różnych platformach. Od 6 grudnia będzie używał go m.in. Google Bard, który dzięki temu ma radzić sobie o wiele sprawniej z rozumieniem i podsumowywaniem, argumentowaniem, pisaniem i planowaniem. Pixel 8 Pro to pierwszy smartfon, który będzie działać z Gemini Nano, dzięki czemu zyska nowe funkcje, np. inteligentną odpowiedź w Gboard (na razie tylko w aplikacji WhatsApp).
O Gemini opowiadają eksperci Google w poniższym filmie.
Na koniec przypominamy także, jak wylogować się z konta Google oraz jak wyłączyć asystenta Google na urządzeniach mobilnych z Android i iOS oraz komputerze.
Źródło: Google, oprac. własne