
Redazione RHC : 5 Luglio 2023 09:02
Gli scienziati dell’Università di Twente (Paesi Bassi) hanno sviluppato un nuovo metodo di intelligenza artificiale in grado di costruire scene da immagini che possono servire come base per generare immagini realistiche e coerenti. Di recente hanno pubblicato i loro risultati sulla rivista IEEE Transactions on Pattern Analysis and Machine Intelligence.
I modelli di intelligenza artificiale generativa possono creare immagini basate su query di testo. Questi modelli funzionano meglio quando creano immagini di singoli oggetti. Creare scene complete è ancora difficile. Michael Ying Yang, ricercatore presso la facoltà ITC dell’Università di Twente, ha sviluppato un nuovo metodo in grado di costruire scene da immagini che possono servire come base per generare immagini realistiche e coerenti.

Gli esseri umani sono bravi a definire le relazioni tra gli oggetti. “Possiamo vedere che la sedia è sul pavimento e il cane sta camminando per strada. I modelli di intelligenza artificiale lo trovano impegnativo”, spiega Yang, professore associato dello Scene Understanding Group presso il Dipartimento di Geoscienze e Osservazione della Terra (ITC).
Prova la Demo di Business Log! Adaptive SOC italiano Log management non solo per la grande Azienda, ma una suite di Audit file, controllo USB, asset, sicurezza e un Security Operation Center PERSONALE, che ti riporta tutte le operazioni necessarie al tuo PC per tutelare i tuoi dati e informati in caso di problemi nel tuo ambiente privato o di lavoro.
Scarica ora la Demo di Business Log per 30gg
Se ti piacciono le novità e gli articoli riportati su di Red Hot Cyber, iscriviti immediatamente alla newsletter settimanale per non perdere nessun articolo. La newsletter generalmente viene inviata ai nostri lettori ad inizio settimana, indicativamente di lunedì. |
Migliorare la capacità del computer di rilevare e comprendere le relazioni visive è essenziale per la generazione di immagini, ma può anche aiutare anche a migliorare i veicoli a guida autonoma e i robot.
Attualmente esistono metodi per costruire una comprensione semantica di un’immagine, ma sono lenti. Questi metodi utilizzano un approccio in due fasi. Innanzitutto, visualizzano tutti gli oggetti nella scena. Nella seconda fase, una rete neurale specifica passa attraverso tutte le possibili connessioni e poi le etichetta con la relazione corretta. Il numero di connessioni che questo metodo deve attraversare aumenta in modo esponenziale con il numero di oggetti. “Il nostro modello fa solo un passo. Prevede automaticamente soggetti, oggetti e le loro relazioni allo stesso tempo”, afferma Yang.
Questo modello analizza il tutto in un’unica fase, esaminando le caratteristiche visive degli oggetti nella scena concentrandosi sui dettagli più importanti per determinare le relazioni. Evidenzia le aree importanti in cui gli oggetti interagiscono o sono correlati tra loro.
Queste tecniche di addestramento sono sufficienti per determinare le relazioni più importanti tra oggetti diversi. Resta solo da generare una descrizione di come sono correlati. “Il modello rileva che nell’immagine campione è molto probabile che una persona interagisca con una mazza da baseball. Poi impara a descrivere la relazione più probabile”, dice Yang.
Redazione
I ladri sono entrati attraverso una finestra del secondo piano del Musée du Louvre, ma il museo aveva avuto anche altri problemi oltre alle finestre non protette, secondo un rapporto di audit sulla s...

Reuters ha riferito che Trump ha detto ai giornalisti durante un’intervista preregistrata nel programma “60 Minutes” della CBS e sull’Air Force One durante il viaggio di ritorno: “I chip pi�...

Il primo computer quantistico atomico cinese ha raggiunto un importante traguardo commerciale, registrando le sue prime vendite a clienti nazionali e internazionali, secondo quanto riportato dai media...

Il CEO di NVIDIA, Jen-Hsun Huang, oggi supervisiona direttamente 36 collaboratori suddivisi in sette aree chiave: strategia, hardware, software, intelligenza artificiale, pubbliche relazioni, networki...

OpenAI ha presentato Aardvark, un assistente autonomo basato sul modello GPT-5 , progettato per individuare e correggere automaticamente le vulnerabilità nel codice software. Questo strumento di inte...