Robot Utilizzano l’IA Gemini di Google per Creare Origami da Istruzioni Semplici

Gemini Robotics: colmare il divario tra software e hardware

Quadro generale: Nonostante il continuo miglioramento del hardware robotico, sviluppare un software di intelligenza artificiale che possa effettivamente animare queste macchine rimane un obiettivo sfuggente. Questo ĆØ particolarmente deludente considerando i notevoli progressi nei modelli di lingua “intelligente”. Ora, il laboratorio di ricerca AI di Google si ĆØ avvicinato più che mai a colmare questa lacuna.

DeepMind ha presentato Gemini Robotics, un’evoluzione del loro potente modello di linguaggio Gemini 2.0 che potrebbe sbloccare nuove capacitĆ  per i robot.

L’obiettivo di Gemini Robotics ĆØ quello di creare un sistema di intelligenza artificiale generalizzato in grado di controllare direttamente i robot e aiutarli a padroneggiare la trifecta di flessibilitĆ , interazione e destrezza. Il risultato potrebbero essere robot che si adattano a situazioni nuove, rispondono naturalmente agli esseri umani e al loro ambiente, e svolgono compiti fisici complessi.

E stanno facendo progressi costanti. Guarda solo questo video di ALOHA 2, un robot con due braccia di DeepMind, che mostra le sue abilitĆ . Non solo può piegare con precisione una figura origami, ma può anche improvvisare quando le cose non vanno come previsto – come quando il ricercatore ha spostato il contenitore in cui doveva posizionare la frutta.

La parte migliore ĆØ che ciò viene ottenuto con semplici istruzioni come “piega una volpe origami.” I ricercatori non hanno dovuto programmare manualmente questa capacitĆ  – il robot ha semplicemente sfruttato la sua comprensione degli origami e del modo di piegare la carta per completare il compito.

Naturalmente, l’origami ĆØ solo l’inizio. DeepMind afferma che Gemini Robotics rappresenta un significativo salto in avanti nelle tre abilitĆ  chiave robotiche rispetto ai loro lavori precedenti. Il modello AI ha più che raddoppiato le sue prestazioni nei benchmark di compiti generali rispetto ad altri sistemi all’avanguardia.

LEGGI  Scopri il Nuovo Standard PC BTF 3.0: Addio Cavi tra PSU, Scheda Madre e GPU!

Cosa significa questo? Gemini Robotics potrebbe inaugurare una nuova generazione di robot in grado di generalizzare e adattarsi a situazioni imprevedibili del mondo reale senza necessitĆ  di un addestramento specifico per ogni scenario. Questa versatilitĆ  ĆØ essenziale per lo sviluppo di robot veramente utili e a scopo generale in futuro.

Per realizzare questo potenziale, Google sta collaborando anche con una societĆ  chiamata Apptronik. Apptronik si occuperĆ  del hardware costruendo robot umanoidi di nuova generazione alimentati da Gemini.

Non aspettarti di assumere un maggiordomo robot di Gemini a breve, però. Per ora, DeepMind mantiene il progetto in modalitĆ  ricerca, rilasciando un sistema “Gemini Robotics-ER” che permetterĆ  a “tester fidati” come Boston Dynamics di accedere alle capacitĆ  di ragionamento dell’AI per i loro progetti. “ER” sta per ragionamento incarnato.

I tester fidati potrebbero includere aziende come Boston Dynamics, Agility Robotics e Enchanted Tools.

Naturalmente, i robot del mondo reale alimentati da AI avanzata sollevano importanti preoccupazioni per la sicurezza. DeepMind afferma di adottare un approccio “olistico” ispirato alle leggi della robotica di Asimov e sta sviluppando standard di valutazione attraverso un nuovo dataset “ASIMOV”. L’obiettivo ĆØ testare se i modelli AI comprendono le conseguenze più ampie delle azioni robotiche, oltre al solo danno fisico.

Messaggi simili: