Robot Utilizzano l'IA Gemini di Google per Creare Origami da Istruzioni Semplici

Gemini Robotics: colmare il divario tra software e hardware

Quadro generale: Nonostante il continuo miglioramento del hardware robotico, sviluppare un software di intelligenza artificiale che possa effettivamente animare queste macchine rimane un obiettivo sfuggente. Questo è particolarmente deludente considerando i notevoli progressi nei modelli di lingua “intelligente”. Ora, il laboratorio di ricerca AI di Google si è avvicinato più che mai a colmare questa lacuna.

DeepMind ha presentato Gemini Robotics, un’evoluzione del loro potente modello di linguaggio Gemini 2.0 che potrebbe sbloccare nuove capacità per i robot.

L’obiettivo di Gemini Robotics è quello di creare un sistema di intelligenza artificiale generalizzato in grado di controllare direttamente i robot e aiutarli a padroneggiare la trifecta di flessibilità, interazione e destrezza. Il risultato potrebbero essere robot che si adattano a situazioni nuove, rispondono naturalmente agli esseri umani e al loro ambiente, e svolgono compiti fisici complessi.

E stanno facendo progressi costanti. Guarda solo questo video di ALOHA 2, un robot con due braccia di DeepMind, che mostra le sue abilità. Non solo può piegare con precisione una figura origami, ma può anche improvvisare quando le cose non vanno come previsto – come quando il ricercatore ha spostato il contenitore in cui doveva posizionare la frutta.

La parte migliore è che ciò viene ottenuto con semplici istruzioni come “piega una volpe origami.” I ricercatori non hanno dovuto programmare manualmente questa capacità – il robot ha semplicemente sfruttato la sua comprensione degli origami e del modo di piegare la carta per completare il compito.

Naturalmente, l’origami è solo l’inizio. DeepMind afferma che Gemini Robotics rappresenta un significativo salto in avanti nelle tre abilità chiave robotiche rispetto ai loro lavori precedenti. Il modello AI ha più che raddoppiato le sue prestazioni nei benchmark di compiti generali rispetto ad altri sistemi all’avanguardia.

LEGGI Taiwan insegna ai civili le abilità con i droni apprese dalla guerra in Ucraina

Cosa significa questo? Gemini Robotics potrebbe inaugurare una nuova generazione di robot in grado di generalizzare e adattarsi a situazioni imprevedibili del mondo reale senza necessità di un addestramento specifico per ogni scenario. Questa versatilità è essenziale per lo sviluppo di robot veramente utili e a scopo generale in futuro.

Per realizzare questo potenziale, Google sta collaborando anche con una società chiamata Apptronik. Apptronik si occuperà del hardware costruendo robot umanoidi di nuova generazione alimentati da Gemini.

Non aspettarti di assumere un maggiordomo robot di Gemini a breve, però. Per ora, DeepMind mantiene il progetto in modalità ricerca, rilasciando un sistema “Gemini Robotics-ER” che permetterà a “tester fidati” come Boston Dynamics di accedere alle capacità di ragionamento dell’AI per i loro progetti. “ER” sta per ragionamento incarnato.

I tester fidati potrebbero includere aziende come Boston Dynamics, Agility Robotics e Enchanted Tools.

Naturalmente, i robot del mondo reale alimentati da AI avanzata sollevano importanti preoccupazioni per la sicurezza. DeepMind afferma di adottare un approccio “olistico” ispirato alle leggi della robotica di Asimov e sta sviluppando standard di valutazione attraverso un nuovo dataset “ASIMOV”. L’obiettivo è testare se i modelli AI comprendono le conseguenze più ampie delle azioni robotiche, oltre al solo danno fisico.

Messaggi simili:

Nicola Costanzo

Nicola Costanzo esplora il mondo della tecnologia e dell’innovazione. I suoi articoli illuminano le sfide digitali che plasmano il nostro futuro.

LEGGI Tecnologia E-ink e Narrazione Interattiva: La Nuova Console Portatile Rivoluzionaria!