Dreamer: da Berkeley l'algoritmo AI che fa camminare un cane robot dal nulla in un'ora
Red Hot Cyber
Condividi la tua difesa. Incoraggia l'eccellenza. La vera forza della cybersecurity risiede nell'effetto moltiplicatore della conoscenza.
Cerca
Fortinet 970x120px
LECS 320x100 1
Dreamer: da Berkeley l’algoritmo AI che fa camminare un cane robot dal nulla in un’ora

Dreamer: da Berkeley l’algoritmo AI che fa camminare un cane robot dal nulla in un’ora

Stefano Gazzella : 8 Settembre 2022 08:00

Hai mai visto una piccola gazzella imparare a camminare? Un cerbiatto con le gambe lunghe il quale si alza in piedi, cade, si alza e cade di nuovo. 

Alla fine, rimane abbastanza a lungo ad agitare le sue gambe simili a stuzzicadenti in una serie di cadute. Sorprendentemente, dopo pochi minuti il cerbiatto saltella come un vecchio professionista.

Bene, ora abbiamo una versione robotica di questa classica scena da “il re leone”.


Christmas Sale

Christmas Sale -40%
𝗖𝗵𝗿𝗶𝘀𝘁𝗺𝗮𝘀 𝗦𝗮𝗹𝗲! Sconto del 𝟰𝟬% 𝘀𝘂𝗹 𝗽𝗿𝗲𝘇𝘇𝗼 𝗱𝗶 𝗰𝗼𝗽𝗲𝗿𝘁𝗶𝗻𝗮 del Corso "Dark Web & Cyber Threat Intelligence" in modalità E-Learning sulla nostra Academy!🚀 Fino al 𝟯𝟭 𝗱𝗶 𝗗𝗶𝗰𝗲𝗺𝗯𝗿𝗲, prezzi pazzi alla Red Hot Cyber Academy. 𝗧𝘂𝘁𝘁𝗶 𝗶 𝗰𝗼𝗿𝘀𝗶 𝘀𝗰𝗼𝗻𝘁𝗮𝘁𝗶 𝗱𝗲𝗹 𝟰𝟬% 𝘀𝘂𝗹 𝗽𝗿𝗲𝘇𝘇𝗼 𝗱𝗶 𝗰𝗼𝗽𝗲𝗿𝘁𝗶𝗻𝗮.
Per beneficiare della promo sconto Christmas Sale, scrivici ad [email protected] o contattaci su Whatsapp al numero di telefono: 379 163 8765.


Supporta Red Hot Cyber attraverso: 

  1. L'acquisto del fumetto sul Cybersecurity Awareness
  2. Ascoltando i nostri Podcast
  3. Seguendo RHC su WhatsApp
  4. Seguendo RHC su Telegram
  5. Scarica gratuitamente “Byte The Silence”, il fumetto sul Cyberbullismo di Red Hot Cyber

Se ti piacciono le novità e gli articoli riportati su di Red Hot Cyber, iscriviti immediatamente alla newsletter settimanale per non perdere nessun articolo. La newsletter generalmente viene inviata ai nostri lettori ad inizio settimana, indicativamente di lunedì.

Il cerbiatto in questo caso è un cane robot dell’Università della California, a Berkeley. 

Ed è anche uno studente sorprendentemente veloce (rispetto al resto dei robot). Il robot è anche speciale perché, a differenza di altri robot più appariscenti che potresti aver visto online, usa l’intelligenza artificiale per imparare a camminare.

Comincia a muovere i suo primi passi utilizzando la schiena, le gambe che ondeggiano, il robot impara a capovolgersi, alzarsi e camminare in un’ora. 

Altri dieci minuti di molestie con un rotolo di cartone sono sufficienti per insegnargli come resistere e riprendersi dall’essere spinto dai suoi creatori.

Non è la prima volta che un robot usa l’intelligenza artificiale per imparare a camminare, sia chiaro. Ma mentre i robot precedenti hanno appreso l’abilità per tentativi ed errori su innumerevoli iterazioni, il robot di Berkeley ha imparato a camminare e interagire nel mondo reale in poco tempo.

In un articolo pubblicato recentemente, i ricercatori, Danijar Hafner, Alejandro Escontrela e Philipp Wu, affermano che trasferire gli algoritmi che hanno preparato per questa simulazione non è affatto semplice. Piccoli dettagli e differenze tra il mondo reale e la simulazione possono far inciampare robot alle prime armi. D’altra parte, l’addestramento degli algoritmi nel mondo reale non è pratico: ci vorrebbe troppo tempo e pazienza.

Quattro anni fa, ad esempio, OpenAI ha mostrato una mano robotica gestita da una intelligenza artificiale in grado di manipolare un cubo

L’algoritmo di controllo, Dactyl, necessita di circa 100 anni di esperienza in una simulazione basata su 6.144 CPU e 8 GPU Nvidia V100 per svolgere questo compito relativamente semplice. 

Da allora le cose sono progredite, ma il problema rimane lì in gran parte. Gli algoritmi di apprendimento di rinforzo puro richiedono troppi tentativi ed errori per apprendere le abilità per potersi allenare nel mondo reale. In poche parole, i tempi di computazione sono alti e il processo di apprendimento deluderebbe ricercatori e robot prima di compiere progressi significativi.

Il team di Berkeley ha deciso di risolvere questo problema con un algoritmo chiamato Dreamer. 

Costruendo quello che viene chiamato “world model”. 

Dreamer può quindi proiettare la probabilità che un’azione futura raggiunga il suo obiettivo. Con l’esperienza, l’accuratezza delle sue proiezioni migliora. Filtrando in anticipo le azioni meno riuscite, il modello consente al robot di capire in modo più efficiente cosa funziona e cosa no.

“L’apprendimento tramite world model consente di migliorare si dall’esperienza passata ma consente anche ai robot di immaginare i risultati futuri di potenziali azioni, riducendo la quantità di tentativi ed errori nell’ambiente reale necessari per apprendere comportamenti di successo”

scrivono i ricercatori. 

“Predicendo i risultati futuri, i world model consentono la pianificazione e l’apprendimento del comportamento con solo piccole quantità di interazione nel mondo reale”.

In altre parole, un world model può ridurre l’equivalente di anni di tempo di addestramento in una simulazione a non più di un’ora, come in questo caso. 

L’approccio potrebbe avere una rilevanza più ampia anche rispetto ai cani robot. 

Il team ha anche applicato Dreamer a un braccio robotico pick-and-place e a un robot con ruote. In entrambi i casi, hanno scoperto che Dreamer permetteva ai loro robot di apprendere in modo efficiente le abilità rilevanti, senza bisogno di tempo per la simulazione. 

Applicazioni future più ambiziose potrebbero includere le auto a guida autonoma e altri tipi di intelligenza artificiale.

Seguici su Google News, LinkedIn, Facebook e Instagram per ricevere aggiornamenti quotidiani sulla sicurezza informatica. Scrivici se desideri segnalarci notizie, approfondimenti o contributi da pubblicare.

Immagine del sito
Stefano Gazzella

Privacy Officer e Data Protection Officer, è Of Counsel per Area Legale. Si occupa di protezione dei dati personali e, per la gestione della sicurezza delle informazioni nelle organizzazioni, pone attenzione alle tematiche relative all’ingegneria sociale. Responsabile del comitato scientifico di Assoinfluencer, coordina le attività di ricerca, pubblicazione e divulgazione. Giornalista pubblicista, scrive su temi collegati a diritti di quarta generazione, nuove tecnologie e sicurezza delle informazioni.

Lista degli articoli
Visita il sito web dell'autore

Articoli in evidenza

Immagine del sito
Se pensavi che la VPN servisse a proteggerti… ripensaci!
Di Redazione RHC - 16/12/2025

Le estensioni del browser sono da tempo un modo comune per velocizzare il lavoro e aggiungere funzionalità utili, ma un altro caso dimostra con quanta facilità questo comodo strumento possa trasform...

Immagine del sito
Supply Chain. Aggiornavi Notepad++ e installavi malware: cosa è successo davvero
Di Redazione RHC - 16/12/2025

Una nuova versione, la 8.8.9, del noto editor di testo Notepad++, è stata distribuita dagli sviluppatori, risolvendo una criticità nel sistema di aggiornamento automatico. Questo problema è venuto ...

Immagine del sito
Pornhub: esposta la cronologia dei membri Premium. Scopriamo cos’è successo
Di Luca Galuppi - 16/12/2025

Questa non è la classica violazione fatta di password rubate e carte di credito clonate.È qualcosa di molto più delicato. Il data breach che ha coinvolto Pornhub nel dicembre 2025 rappresenta uno d...

Immagine del sito
Da studenti Cisco a cyber-spie di Stato: la vera origine di Salt Typhoon
Di Redazione RHC - 16/12/2025

Un recente studio condotto da SentinelLabs getta nuova luce sulle radici del gruppo di hacker noto come “Salt Typhoon“, artefice di una delle più audaci operazioni di spionaggio degli ultimi diec...

Immagine del sito
Sicurezza Wi-Fi Multilivello: La Guida Completa a Segmentazione, WPA3 e Difesa Attiva
Di Francesco Demarcus - 16/12/2025

Con l’espansione dell’Internet of Things (IoT), il numero di dispositivi connessi alle reti wireless è in continua crescita, sia nelle case che nelle aziende . Questo scenario rende la sicurezza ...