Google prezentuje Gemini - swój najpotężniejszy model sztucznej inteligencji
Google zaprezentował Gemini – swój największy i najpotężniejszy model sztucznej inteligencji. Powstał on w efekcie szeroko zakrojonej współpracy wielu zespołów koncernu, w tym Google DeepMind i Google Research, i jest największym projektem naukowo-inżynierskim w historii Google.
Gemini to model sztucznej inteligencji, zbudowany od podstaw z założeniem, że ma być modelem multimodalnym, czyli takim, który może generalizować i z łatwością rozumieć, wykorzystywać i łączyć różne rodzaje informacji, w tym tekst, obrazy, dźwięki, filmy i kod.
Gemini jest ponadto najbardziej elastycznym z modeli Google, ponieważ działa sprawnie na dowolnych urządzeniach – od centrów danych po urządzenia mobilne – podaje firma.
Trzy rozmiary Gemini
Pierwsza wersja modelu, Gemini 1.0, została zoptymalizowana dla trzech różnych rozmiarów: Gemini Ultra — najbardziej wydajny i największy model do bardzo złożonych zadań; Pro - model do skalowania w szerokim zakresie zadań oraz Nano - model do zadań na urządzeniu.
Przykładowo, Gemini potrafi rozpoznawać i nazywać narysowane kształty i przedmioty, opisywać je i przeprowadzić tłumaczenie takiego tekstu na inne języki. Model potrafi także wyodrębnić sedno informacji z setek tysięcy dokumentów, poprzez ich czytanie, filtrowanie i analizowanie.
Dostępność modelu Gemini na świecie
Obecnie Google wprowadza model Gemini 1.0 w wielu usługach i na różnych platformach.
Od 6 grudnia model Bard będzie używał Gemini Pro. Będzie on dostępny w języku angielskim w ponad 170 krajach i regionach, a w najbliższej przyszłości Google rozszerzy dostępne opcje oraz udostępni usługę w kolejnych miejscach i językach.
Od 13 grudnia deweloperzy i klienci biznesowi będą mieli dostęp do modelu Gemini Pro poprzez Gemini API w Google AI Studio lub Google Cloud Vertex AI.
Gemini zostanie wprowadzone także do Pixela. Pixel 8 Pro to pierwszy smartfon, który będzie działać z Gemini Nano, dzięki czemu zyska nowe funkcje, np. podsumowanie w aplikacji Dyktafon czy Inteligentną odpowiedź w Gboard — początkowo w aplikacji WhatsApp, a w przyszłym roku w kolejnych aplikacjach do obsługi wiadomości.
W najbliższych miesiącach Gemini zostanie dodane do kolejnych kluczowych usług Google, takich jak wyszukiwarka, Google Ads, Chrome i Duet AI.
Z wynikiem 90 proc. Gemini Ultra jest pierwszym modelem, który przewyższa w działaniu ekspertów w zakresie MMLU (masowe wielozadaniowe rozumienie języka). MMLU wykorzystuje połączenie 57 dziedzin nauki, takich jak matematyka, fizyka, historia, prawo, medycyna czy etyka, w celu testowania zarówno światowej wiedzy, jak i możliwości rozwiązywania problemów.
Gemini Ultra osiąga ponadto wynik 59,4 proc. w testach MMMU, które obejmują realizację wielomodalnych zadań z wykorzystaniem wielu domen, wymagających jednocześnie zastosowania przemyślanej argumentacji.
Sztuczna inteligencja od Google potrafi także programować. Wyspecjalizowana wersja Gemini, system generowania kodu AlphaCode 2 radzi sobie z trudnymi problemami programistycznymi obejmującymi nie tylko kodowanie, ale również złożone zagadnienia matematyczne i informatyczne.
Coraz wyższe zyski Google
Przychody całego Alphabetu w zeszłym kwartale sięgnęły 76,69 mld dolarów, rosnąc rok do roku o 11 proc. To znacznie wyższa dynamika niż w pierwszym kwartale br. (o 3 proc. do 69,79 mld dolarów) i drugim kwartale (o 7 proc. do 74,6 mld). Zysk operacyjny koncernu zwiększył się z 17,13 do 21,34 mld dolarów, marża operacyjna - z 25 do 28 proc., a zysk netto - z 13,91 do 19,69 mld dolarów (1,55 dolara na akcję).
Wyniki okazały się lepsze od średniej prognoz analityków, która zakładała 75,9 mld dolarów wpływów i 1,46 dolara zysku netto na akcję. Natomiast przychody Google Cloud poniżej oczekiwań wynoszących 8,6 mld dolarów.
W trzecim kwartale br. wpływy z pozareklamowych usług Google’a poszły w górę z 6,89 do 8,34 mld dolarów, a te z Google Cloud - z 6,87 do 8,41 mld.
Dołącz do dyskusji: Google prezentuje Gemini - swój najpotężniejszy model sztucznej inteligencji