Rozwój robotów (zwłaszcza humanoidalnych) nie od dziś pobudza wyobraźnię miłośników technologii. Zdaniem wielu jest to jeden z głównych kierunków jej rozwoju. Jednak roboty, z którymi do tej pory mieliśmy do czynienia, miały wiele ograniczeń. Były zaprogramowane do wykonywania określonych czynności, ewentualnie sterowane przez człowieka. Z robotami wyposażonymi w AI ma być inaczej. Modele, których powstanie ogłosiło właśnie Google (a dokładniej Google DeepMind, część Google specjalizująca się w pracach nad sztuczną inteligencją), mają – według firmy – tworzyć podwaliny pod nową generację robotów.
Roboty z AI: Widzą, słyszą, na bieżąco reagują na zmiany
Według Google DeepMind modele sztucznej inteligencji dla robotów muszą spełniać trzy główne kryteria: interaktywność (czyli rozumienie i reagowanie na instrukcje lub zmiany w otoczeniu); umiejętność wyciągania ogólnych wniosków – dostosowywania się do sytuacji; zręczność (ang. dexterous) – czyli umiejętność wykonywania czynności, które ludzie zazwyczaj wykonują rękami i palcami (na przykład ostrożne manipulowanie przedmiotami). „Choć nasze poprzednie prace wykazały postęp w tych obszarach, Gemini Robotics stanowi znaczący krok naprzód w zakresie wydajności we wszystkich trzech obszarach, zbliżając nas do robotów o prawdziwie uniwersalnym przeznaczeniu” – czytamy na blogu Google DeepMind.
Czytaj więcej
Kolejne spółki uruchamiają komputery kwantowe i otwierają je na komercyjne zastosowanie. Są dzięki temu w stanie w kilka minut wykonać operacje, ja...
Co potrafią roboty wyposażone w sztuczną inteligencję od Google?
Roboty zaprezentowane przez Google wyposażone w sztuczną inteligencję reagują na polecenia słowne, potrafią wykonać zadania w zmieniających się okolicznościach (reagując na sygnały wizualne płynące z otoczenia i pokazując, że mają orientację w przestrzeni), wykonują zadania, do których wcześniej nie były szkolone.
Jak to wygląda w praktyce? Na filmach zaprezentowanych przez Google widzimy na przykład robota, który reaguje w sposób adekwatny na krótkie polecenia (np. włożenie bananów do pojemnika). Robot potrafi je spełnić również wtedy, gdy osoba asystująca zmienia na bieżąco pozycję pojemnika. Z kolei zdolności manualne robotów (ich zręczność) pokazuje film, na którym widzimy składanie figurki origami. Roboty potrafią także nałożyć pas transmisyjny, grać w kółko-krzyżyk, układać narzędzia czy grać w karty.
Sztuczna inteligencja dla robotów od Google: Gemini Robotics i Gemini Robotics-ER
AI dla robotów stworzona przez Google DeepMind to Gemini Robotics i Gemini Robotics-ER (ER – embodied reasoning – ucieleśnione rozumowanie). Gemini Robotics to zaawansowany model typu VLA (vision-language-action). Został zbudowany na Gemini 2.0, które dodatkowo zostało wyposażone w nową modalność – bezpośrednie sterowanie robotem w świecie fizycznym.
Czytaj więcej
Wielkie koncerny technologiczne będą w Polsce opodatkowane nawet bez specjalnej nowej daniny.
Drugi model, Gemini Robotics-ER, wyróżnia się zaawansowanym rozumieniem przestrzeni, w tym rozumieniem przestrzeni 3D. Model może na bieżąco wykonać wszystkie kroki niezbędne do sterowania robotem, w tym percepcję, ocenę stanu, zrozumienie przestrzeni, planowanie i generowanie kodu. „W takim kompleksowym ustawieniu model osiąga dwa-trzy razy większy wskaźnik sukcesu w porównaniu do Gemini 2.0. A tam, gdzie generowanie kodu nie jest wystarczające, Gemini Robotics-ER może nawet wykorzystać moc uczenia się kontekstowego, postępując zgodnie ze wzorami kilku demonstracji prowadzonych przez ludzi, aby znaleźć rozwiązanie” – czytamy.
AI od Google dopasowana do różnych typów robotów
Modele Gemini Robotics zostały zaprojektowane tak, aby mogły łatwo dostosowywać się do różnych typów robotów. „Przeszkoliliśmy model głównie na danych z dwuramiennej platformy robota ALOHA 2, ale wykazaliśmy również, że może on kontrolować dwuramienną platformę, opartą na ramionach Franka używanych w wielu laboratoriach akademickich. Gemini Robotics może być nawet wyspecjalizowane w bardziej złożonych wcieleniach, takich jak humanoidalny robot Apollo opracowany przez Apptronik, którego celem jest wykonywanie zadań w świecie rzeczywistym” – informuje Google DeepMind.
Google DeepMind prowadzi prace nad „robotycznymi” modelami Google we współpracy z firmą Apptronik. „Nasz model Gemini Robotics-ER jest również dostępny dla zaufanych testerów, w tym Agile Robots, Agility Robots, Boston Dynamics i Enchanted Tools” – czytamy.