Reklama

Roboty z AI zrobią to, co robi człowiek? Sztuczna inteligencja dla maszyn od Google

Google ogłosiło powstanie dwóch modeli AI opartych na Gemini 2.0 i zaprojektowanych z myślą o robotach. Wykorzystanie sztucznej inteligencji ma im dawać możliwość wykonywania czynności zarezerwowanych dotąd tylko dla człowieka. Firma chwali się, że dzięki Gemini Robotics i Gemini Robotics-ER sztuczna inteligencja, obecna do tej pory w świecie cyfrowym, wkracza do świata fizycznego.

Publikacja: 19.03.2025 09:26

Roboty z AI będą wykonywać czynności zarezerowane do tej pory dla człowieka?

Foto: Adobe Stock

Maria Krzos

Reklama

Rozwój robotów (zwłaszcza humanoidalnych) nie od dziś pobudza wyobraźnię miłośników technologii. Zdaniem wielu jest to jeden z głównych kierunków jej rozwoju. Jednak roboty, z którymi do tej pory mieliśmy do czynienia, miały wiele ograniczeń. Były zaprogramowane do wykonywania określonych czynności, ewentualnie sterowane przez człowieka. Z robotami wyposażonymi w AI ma być inaczej. Modele, których powstanie ogłosiło właśnie Google (a dokładniej Google DeepMind, część Google specjalizująca się w pracach nad sztuczną inteligencją), mają – według firmy – tworzyć podwaliny pod nową generację robotów.

Roboty z AI: Widzą, słyszą, na bieżąco reagują na zmiany

Według Google DeepMind modele sztucznej inteligencji dla robotów muszą spełniać trzy główne kryteria: interaktywność (czyli rozumienie i reagowanie na instrukcje lub zmiany w otoczeniu); umiejętność wyciągania ogólnych wniosków – dostosowywania się do sytuacji; zręczność (ang. dexterous) – czyli umiejętność wykonywania czynności, które ludzie zazwyczaj wykonują rękami i palcami (na przykład ostrożne manipulowanie przedmiotami). „Choć nasze poprzednie prace wykazały postęp w tych obszarach, Gemini Robotics stanowi znaczący krok naprzód w zakresie wydajności we wszystkich trzech obszarach, zbliżając nas do robotów o prawdziwie uniwersalnym przeznaczeniu” – czytamy na blogu Google DeepMind.

Czytaj więcej

Komputery kwantowe są szybsze i wydajniejsze niż komputery klasyczne

Technologie

Kilka minut zamiast miliona lat. Superkomputery pokonane

Kolejne spółki uruchamiają komputery kwantowe i otwierają je na komercyjne zastosowanie. Są dzięk...

Co potrafią roboty wyposażone w sztuczną inteligencję od Google?

Roboty zaprezentowane przez Google wyposażone w sztuczną inteligencję reagują na polecenia słowne, potrafią wykonać zadania w zmieniających się okolicznościach (reagując na sygnały wizualne płynące z otoczenia i pokazując, że mają orientację w przestrzeni), wykonują zadania, do których wcześniej nie były szkolone.

Jak to wygląda w praktyce? Na filmach zaprezentowanych przez Google widzimy na przykład robota, który reaguje w sposób adekwatny na krótkie polecenia (np. włożenie bananów do pojemnika). Robot potrafi je spełnić również wtedy, gdy osoba asystująca zmienia na bieżąco pozycję pojemnika. Z kolei zdolności manualne robotów (ich zręczność) pokazuje film, na którym widzimy składanie figurki origami. Roboty potrafią także nałożyć pas transmisyjny, grać w kółko-krzyżyk, układać narzędzia czy grać w karty.

Reklama

Sztuczna inteligencja dla robotów od Google: Gemini Robotics i Gemini Robotics-ER

AI dla robotów stworzona przez Google DeepMind to Gemini Robotics i Gemini Robotics-ER (ER – embodied reasoning – ucieleśnione rozumowanie). Gemini Robotics to zaawansowany model typu VLA (vision-language-action). Został zbudowany na Gemini 2.0, które dodatkowo zostało wyposażone w nową modalność – bezpośrednie sterowanie robotem w świecie fizycznym.

Czytaj więcej

Prawo w Polsce

Czy Polska wprowadzi podatek cyfrowy? Big techy i tak zapłacą

Wielkie koncerny technologiczne będą w Polsce opodatkowane nawet bez specjalnej nowej daniny.

Drugi model, Gemini Robotics-ER, wyróżnia się zaawansowanym rozumieniem przestrzeni, w tym rozumieniem przestrzeni 3D. Model może na bieżąco wykonać wszystkie kroki niezbędne do sterowania robotem, w tym percepcję, ocenę stanu, zrozumienie przestrzeni, planowanie i generowanie kodu. „W takim kompleksowym ustawieniu model osiąga dwa-trzy razy większy wskaźnik sukcesu w porównaniu do Gemini 2.0. A tam, gdzie generowanie kodu nie jest wystarczające, Gemini Robotics-ER może nawet wykorzystać moc uczenia się kontekstowego, postępując zgodnie ze wzorami kilku demonstracji prowadzonych przez ludzi, aby znaleźć rozwiązanie” – czytamy.

AI od Google dopasowana do różnych typów robotów

Modele Gemini Robotics zostały zaprojektowane tak, aby mogły łatwo dostosowywać się do różnych typów robotów. „Przeszkoliliśmy model głównie na danych z dwuramiennej platformy robota ALOHA 2, ale wykazaliśmy również, że może on kontrolować dwuramienną platformę, opartą na ramionach Franka używanych w wielu laboratoriach akademickich. Gemini Robotics może być nawet wyspecjalizowane w bardziej złożonych wcieleniach, takich jak humanoidalny robot Apollo opracowany przez Apptronik, którego celem jest wykonywanie zadań w świecie rzeczywistym” – informuje Google DeepMind.

Google DeepMind prowadzi prace nad „robotycznymi” modelami Google we współpracy z firmą Apptronik. „Nasz model Gemini Robotics-ER jest również dostępny dla zaufanych testerów, w tym Agile Robots, Agility Robots, Boston Dynamics i Enchanted Tools” – czytamy.