Google wprowadza Gemini Robotics z nowym modelem Gemini 2.0 zapewniającym lepszą wydajność robota

Google wprowadza Gemini Robotics z nowym modelem Gemini 2.0 zapewniającym lepszą wydajność robota

Google DeepMind wkracza w dziedzinę robotyki dzięki Gemini 2.0

Google DeepMind nadal czyni znaczące postępy w dziedzinie sztucznej inteligencji (AI), prezentując postępy w modelach takich jak Gemini, Imagen, Veo, Gemma i AlphaFold. W niedawnym ogłoszeniu zespół oficjalnie wszedł do sektora robotyki, wprowadzając dwa innowacyjne modele oparte na Gemini 2.0: Gemini Robotics i Gemini Robotics-ER.

Przedstawiamy Gemini Robotics

Gemini Robotics reprezentuje najnowocześniejszy model wizji-języka-działania (VLA), który integruje działania fizyczne jako modalność wyjściową, specjalnie zaprojektowany do sterowania robotami. Ten przełomowy model, zbudowany na architekturze Gemini 2.0, wykazuje niezwykłą zdolność rozumienia sytuacji, z którymi nie zetknął się podczas szkolenia.

Według Google, Gemini Robotics wyróżnia się wydajnością, osiągając dwukrotnie wyższy wskaźnik sukcesu w porównaniu do innych wiodących modeli VLA w rozległych testach generalizacji. Ta zdolność jest wzmocniona przez solidne rozumienie języka naturalnego w różnych językach, co pozwala na skuteczniejszą interpretację poleceń ludzkich.

Niezrównana zręczność

Jedną z wyróżniających się cech Gemini Robotics jest jej zręczność. Google twierdzi, że ten model może poradzić sobie ze skomplikowanymi, wieloetapowymi zadaniami, które wymagają precyzyjnej obsługi. Godne uwagi przykłady obejmują składanie origami i pakowanie przekąsek do toreb Ziploc.

Możliwości Gemini Robotics-ER

Z drugiej strony Gemini Robotics-ER służy jako zaawansowany model wizyjno-językowy dostosowany do rozumowania przestrzennego. Model ten wyposaża robotyków w gotowe rozwiązanie do sterowania robotami, obejmujące podstawowe funkcje, takie jak percepcja, szacowanie stanu, świadomość przestrzenna, planowanie i generowanie kodu.

Współpraca w rozwoju robotyki

Aby zwiększyć potencjał tych nowych modeli robotów, Google nawiązało współpracę z firmą Apptronik w celu opracowania humanoidalnych robotów wykorzystujących możliwości Gemini 2.0. Ponadto Google współpracuje z wybranymi zaufanymi liderami branży, w tym Agile Robots, Agility Robotics, Boston Dynamics i Enchanted Tools, którzy badają przyszłe możliwości Gemini Robotics-ER.

Pionierska przyszłość robotyki

Dzięki wyposażeniu robotów w zdolność rozumienia i wykonywania złożonych zadań z większą precyzją i elastycznością, Google DeepMind toruje drogę do przyszłości, w której roboty będą mogły bezproblemowo integrować się z różnymi aspektami codziennego życia, ulepszając zarówno środowisko osobiste, jak i zawodowe.

Źródło i obrazy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *