
Il 25 settembre, Google DeepMind ha pubblicato un video che mostra come le sue piattaforme umanoidi gestiscono attività quotidiane articolate in più fasi utilizzando il ragionamento multimodale.
In una serie di dimostrazioni, le macchine hanno eseguito con sicurezza sequenze di azioni, tra cui l’ordinamento di oggetti secondo regole predeterminate.
L’intelligenza di questi sistemi si basa sulla famiglia Gemini Robotics 1.5. Due componenti lavorano insieme: il modello base traduce segnali visivi e messaggi testuali in movimenti specifici, mentre la versione modificata di Gemini Robotics-ER 1.5 crea piani e ragionamenti passo dopo passo sulla situazione attuale, scegliendo la giusta sequenza di passaggi.
Il cosiddetto test della banana dimostra bene i progressi. In precedenza, al robot era richiesto solo di raccogliere una banana e metterla in una ciotola: un comando, un risultato.
Ora, il sistema ordinava tre frutti diversi per colore e li posizionava su piatti. Jie Tang, ricercatore senior di Google DeepMind, ha dimostrato l’esperimento; il sistema a due bracci, basato sui manipolatori Franka, ha completato l’intera sequenza senza intoppi.
La piattaforma umanoide Apollo di Apptronik è stata testata anche in un’attività di lavanderia. La macchina suddivideva i capi in base alla tonalità in due contenitori: uno per i bianchi e uno per i neri. Dopo il primo tentativo riuscito, gli ingegneri hanno scambiato i contenitori per vedere se il sistema avrebbe rilevato lo scambio e modificato le sue azioni. Apollo ha riconosciuto la nuova disposizione e ha completato correttamente la selezione.
Gemini Robotics 1.5 supporta l’apprendimento incarnato: il robot esplora l’ambiente circostante con il corpo, i sensori e le telecamere, e poi agisce in base alle proprie osservazioni. ALOHA 2 è stato utilizzato nella maggior parte delle scene, ma gli stessi scenari possono essere gestiti anche da Apollo e dal sistema Franka a due bracci.
Sono state aggiunte anche funzioni basate su agenti. Ad esempio, il sistema può essere incaricato della raccolta differenziata: cercherà su Internet le normative locali, valuterà visivamente ogni oggetto, lo assegnerà al compost, al riciclaggio o ai rifiuti ed eseguirà l’intero processo, dalla decisione allo smaltimento nel contenitore appropriato.
Questo livello di coerenza è raggiunto attraverso la collaborazione di due componenti: una responsabile del percorso dalla percezione al movimento, l’altra della pianificazione e della logica. Questa architettura rende l’esecuzione di attività nel mondo reale più intuitiva e affidabile.
La sicurezza ha ricevuto particolare attenzione. I robot sono addestrati a valutare i rischi in modo proattivo, rispettare i limiti umani ed evitare situazioni pericolose. Con il supporto di team specializzati e il test ASIMOV aggiornato, Gemini Robotics-ER 1.5 ha raggiunto una posizione di leadership nei test, il che dovrebbe facilitare l’implementazione accurata di sistemi simili al di fuori del laboratorio.
Ti è piaciuto questo articolo? Ne stiamo discutendo nella nostra Community su LinkedIn, Facebook e Instagram. Seguici anche su Google News, per ricevere aggiornamenti quotidiani sulla sicurezza informatica o Scrivici se desideri segnalarci notizie, approfondimenti o contributi da pubblicare.

InnovazioneL’evoluzione dell’Intelligenza Artificiale ha superato una nuova, inquietante frontiera. Se fino a ieri parlavamo di algoritmi confinati dietro uno schermo, oggi ci troviamo di fronte al concetto di “Meatspace Layer”: un’infrastruttura dove le macchine non…
CybercrimeNegli ultimi anni, la sicurezza delle reti ha affrontato minacce sempre più sofisticate, capaci di aggirare le difese tradizionali e di penetrare negli strati più profondi delle infrastrutture. Un’analisi recente ha portato alla luce uno…
VulnerabilitàNegli ultimi tempi, la piattaforma di automazione n8n sta affrontando una serie crescente di bug di sicurezza. n8n è una piattaforma di automazione che trasforma task complessi in operazioni semplici e veloci. Con pochi click…
InnovazioneArticolo scritto con la collaborazione di Giovanni Pollola. Per anni, “IA a bordo dei satelliti” serviva soprattutto a “ripulire” i dati: meno rumore nelle immagini e nei dati acquisiti attraverso i vari payload multisensoriali, meno…
Cyber ItaliaNegli ultimi giorni è stato segnalato un preoccupante aumento di truffe diffuse tramite WhatsApp dal CERT-AGID. I messaggi arrivano apparentemente da contatti conosciuti e richiedono urgentemente denaro, spesso per emergenze come spese mediche improvvise. La…