Gemini Robotics: colmare il divario tra software e hardware
Quadro generale: Nonostante il continuo miglioramento del hardware robotico, sviluppare un software di intelligenza artificiale che possa effettivamente animare queste macchine rimane un obiettivo sfuggente. Questo ĆØ particolarmente deludente considerando i notevoli progressi nei modelli di lingua “intelligente”. Ora, il laboratorio di ricerca AI di Google si ĆØ avvicinato più che mai a colmare questa lacuna.
DeepMind ha presentato Gemini Robotics, un’evoluzione del loro potente modello di linguaggio Gemini 2.0 che potrebbe sbloccare nuove capacitĆ per i robot.
L’obiettivo di Gemini Robotics ĆØ quello di creare un sistema di intelligenza artificiale generalizzato in grado di controllare direttamente i robot e aiutarli a padroneggiare la trifecta di flessibilitĆ , interazione e destrezza. Il risultato potrebbero essere robot che si adattano a situazioni nuove, rispondono naturalmente agli esseri umani e al loro ambiente, e svolgono compiti fisici complessi.
E stanno facendo progressi costanti. Guarda solo questo video di ALOHA 2, un robot con due braccia di DeepMind, che mostra le sue abilitĆ . Non solo può piegare con precisione una figura origami, ma può anche improvvisare quando le cose non vanno come previsto ā come quando il ricercatore ha spostato il contenitore in cui doveva posizionare la frutta.
La parte migliore ĆØ che ciò viene ottenuto con semplici istruzioni come “piega una volpe origami.” I ricercatori non hanno dovuto programmare manualmente questa capacitĆ ā il robot ha semplicemente sfruttato la sua comprensione degli origami e del modo di piegare la carta per completare il compito.
Naturalmente, l’origami ĆØ solo l’inizio. DeepMind afferma che Gemini Robotics rappresenta un significativo salto in avanti nelle tre abilitĆ chiave robotiche rispetto ai loro lavori precedenti. Il modello AI ha più che raddoppiato le sue prestazioni nei benchmark di compiti generali rispetto ad altri sistemi all’avanguardia.
Cosa significa questo? Gemini Robotics potrebbe inaugurare una nuova generazione di robot in grado di generalizzare e adattarsi a situazioni imprevedibili del mondo reale senza necessitĆ di un addestramento specifico per ogni scenario. Questa versatilitĆ ĆØ essenziale per lo sviluppo di robot veramente utili e a scopo generale in futuro.
Per realizzare questo potenziale, Google sta collaborando anche con una societĆ chiamata Apptronik. Apptronik si occuperĆ del hardware costruendo robot umanoidi di nuova generazione alimentati da Gemini.
Non aspettarti di assumere un maggiordomo robot di Gemini a breve, però. Per ora, DeepMind mantiene il progetto in modalitĆ ricerca, rilasciando un sistema “Gemini Robotics-ER” che permetterĆ a “tester fidati” come Boston Dynamics di accedere alle capacitĆ di ragionamento dell’AI per i loro progetti. “ER” sta per ragionamento incarnato.
I tester fidati potrebbero includere aziende come Boston Dynamics, Agility Robotics e Enchanted Tools.
Naturalmente, i robot del mondo reale alimentati da AI avanzata sollevano importanti preoccupazioni per la sicurezza. DeepMind afferma di adottare un approccio “olistico” ispirato alle leggi della robotica di Asimov e sta sviluppando standard di valutazione attraverso un nuovo dataset “ASIMOV”. L’obiettivo ĆØ testare se i modelli AI comprendono le conseguenze più ampie delle azioni robotiche, oltre al solo danno fisico.
Messaggi simili:
- App autonoma “Google Gemini” individuata per iPhone con Gemini Live
- Google Rivoluziona le Ricerche: Scopri la ModalitĆ AI con Integrazione Gemini!
- Google investe cifre enormi per portare l’IA Gemini su dispositivi Samsung
- Amazon punta su robot umanoidi per rivoluzionare le consegne all’ultimo miglio
- Apple sta facendo avanzare lāintelligenza artificiale proprio mentre la concorrenza sta rallentando

Nicola Costanzo esplora il mondo della tecnologia e dell’innovazione. I suoi articoli illuminano le sfide digitali che plasmano il nostro futuro.