Nowe postępy w dziedzinie sztucznej inteligencji skoncentrowanej na rozumowaniu: Google i OpenAI prezentują nowe modele
We wrześniu OpenAI podniosło poprzeczkę, wprowadzając innowacyjną serię o1 dużych modeli językowych (LLM). Te zaawansowane modele priorytetowo traktują dogłębne rozumowanie przed dostarczeniem odpowiedzi, co czyni je wyjątkowo skutecznymi w przypadku złożonych zadań w takich dziedzinach jak nauka, kodowanie i matematyka.
Przechodząc do dnia dzisiejszego, Google uruchomiło swój własny LLM skoncentrowany na rozumowaniu o nazwie Gemini 2.0 Flash Thinking . Ten eksperymentalny model, zidentyfikowany jako gemini-2.0-flash-thinking-exp-1219
, jest teraz dostępny dla programistów za pośrednictwem Google AI Studio. Google twierdzi, że ten model wyróżnia się w multimodalnym rozumieniu, logicznym rozumowaniu i kodowaniu aplikacji.
Według ogłoszenia Google, wydłużenie czasu obliczeń podczas wnioskowania dało zachęcające rezultaty. Jednak nie opublikowano konkretnych testów wydajności, które mogłyby uzasadnić te twierdzenia. Niemniej jednak wstępna informacja zwrotna z Chatbot Arena wskazuje, że Gemini-2.0-Flash-Thinking osiągnął niezwykłą pozycję, zajmując obecnie pierwsze miejsce we wszystkich ocenianych kategoriach.
Najnowsze wiadomości z Chatbot Arena⚡🤔 @GoogleDeepMind Gemini-2.0-Flash-Thinking debiutuje jako #1 we WSZYSTKICH kategoriach! Skok z Gemini-2.0-Flash: – Ogółem: #3 → #1 – Ogółem (kontrola stylu): #4 → #1 – Matematyka: #2 → #1 – Twórcze pisanie: #2 → #1 – Trudne podpowiedzi: #1 → #1… https://t.co/lO1DiTiOOj pic.twitter.com/cq2MRMbWZ1
— lmarena.ai (dawniej lmsys.org) (@lmarena_ai) 19 grudnia 2024 r.
Kluczowe przypadki użycia Gemini 2.0 Flash Thinking
Firma Google przedstawiła kilka interesujących przypadków użycia dla programistów zainteresowanych eksperymentowaniem z modelem Gemini 2.0 Flash Thinking:
- Rozwiązywanie najbardziej złożonych problemów za pomocą zaawansowanego rozumowania
- Demonstrowanie procesów myślowych modelu w sposób przejrzysty
- Rozwiązywanie trudnych zapytań dotyczących kodowania i matematyki
Ten najnowocześniejszy model może pochwalić się długością kontekstu wynoszącą ponad 128 tys. tokenów i limitem wiedzy trwającym do sierpnia 2024 r. Programiści mogą wykorzystać model rozumowania Gemini, uzyskując dostęp do interfejsu API Gemini w Google AI Studio i w Vertex AI.
Chcesz zobaczyć Gemini 2.0 Flash Thinking w akcji? Sprawdź tę demonstrację, w której model rozwiązuje problem fizyczny i wyjaśnia swoje rozumowanie. pic.twitter.com/Nl0hYj7ZFS
— Jeff Dean (@JeffDean) 19 grudnia 2024 r.
Przewaga konkurencyjna: Aktualizacja modelu o1 firmy OpenAI
Wcześniej w tym tygodniu OpenAI ogłosiło również znaczące wdrożenie swojego modelu rozumowania o1, który jest teraz dostępny dla deweloperów na poziomie użytkowania 5 w ramach API. Ta najnowsza iteracja modelu o1 raportuje najnowocześniejszą wydajność w kilku powszechnie uznanych testach porównawczych AI. Deweloperzy mogą wykorzystać ten model do ulepszenia różnych aplikacji, w tym ulepszonych mechanizmów obsługi klienta, zoptymalizowanej logistyki łańcucha dostaw i dokładniejszych prognoz finansowych.
Dzięki temu, że Google i OpenAI wprowadziły na rynek programy nauczania LLM skoncentrowane na rozumowaniu, krajobraz rozwoju innowacyjnych zastosowań sztucznej inteligencji stał się bardziej dynamiczny w wielu branżach.
Dodaj komentarz