
Google DeepMind wkracza w dziedzinę robotyki dzięki Gemini 2.0
Google DeepMind nadal czyni znaczące postępy w dziedzinie sztucznej inteligencji (AI), prezentując postępy w modelach takich jak Gemini, Imagen, Veo, Gemma i AlphaFold. W niedawnym ogłoszeniu zespół oficjalnie wszedł do sektora robotyki, wprowadzając dwa innowacyjne modele oparte na Gemini 2.0: Gemini Robotics i Gemini Robotics-ER.
Przedstawiamy Gemini Robotics
Gemini Robotics reprezentuje najnowocześniejszy model wizji-języka-działania (VLA), który integruje działania fizyczne jako modalność wyjściową, specjalnie zaprojektowany do sterowania robotami. Ten przełomowy model, zbudowany na architekturze Gemini 2.0, wykazuje niezwykłą zdolność rozumienia sytuacji, z którymi nie zetknął się podczas szkolenia.
Według Google, Gemini Robotics wyróżnia się wydajnością, osiągając dwukrotnie wyższy wskaźnik sukcesu w porównaniu do innych wiodących modeli VLA w rozległych testach generalizacji. Ta zdolność jest wzmocniona przez solidne rozumienie języka naturalnego w różnych językach, co pozwala na skuteczniejszą interpretację poleceń ludzkich.
Niezrównana zręczność
Jedną z wyróżniających się cech Gemini Robotics jest jej zręczność. Google twierdzi, że ten model może poradzić sobie ze skomplikowanymi, wieloetapowymi zadaniami, które wymagają precyzyjnej obsługi. Godne uwagi przykłady obejmują składanie origami i pakowanie przekąsek do toreb Ziploc.
Możliwości Gemini Robotics-ER
Z drugiej strony Gemini Robotics-ER służy jako zaawansowany model wizyjno-językowy dostosowany do rozumowania przestrzennego. Model ten wyposaża robotyków w gotowe rozwiązanie do sterowania robotami, obejmujące podstawowe funkcje, takie jak percepcja, szacowanie stanu, świadomość przestrzenna, planowanie i generowanie kodu.
Współpraca w rozwoju robotyki
Aby zwiększyć potencjał tych nowych modeli robotów, Google nawiązało współpracę z firmą Apptronik w celu opracowania humanoidalnych robotów wykorzystujących możliwości Gemini 2.0. Ponadto Google współpracuje z wybranymi zaufanymi liderami branży, w tym Agile Robots, Agility Robotics, Boston Dynamics i Enchanted Tools, którzy badają przyszłe możliwości Gemini Robotics-ER.
Pionierska przyszłość robotyki
Dzięki wyposażeniu robotów w zdolność rozumienia i wykonywania złożonych zadań z większą precyzją i elastycznością, Google DeepMind toruje drogę do przyszłości, w której roboty będą mogły bezproblemowo integrować się z różnymi aspektami codziennego życia, ulepszając zarówno środowisko osobiste, jak i zawodowe.
Dodaj komentarz ▼