Red Hot Cyber
La cybersecurity è condivisione. Riconosci il rischio, combattilo, condividi le tue esperienze ed incentiva gli altri a fare meglio di te.
Cerca

Apple presenta OpenELM. Un modello aperto per l’uso di massa

Redazione RHC : 28 Aprile 2024 09:01

L’azienda americana Apple è famosa per la segretezza dei suoi sviluppi, ma questa volta ha fatto un passo significativo verso l’apertura rilasciando un modello di intelligenza artificiale generativa chiamato OpenELM. È un modello completamente aperto, che supera molti altri LLM formati su dati disponibili al pubblico.

Apple afferma che OpenELM è più preciso del 2,36% rispetto al modello OLMo dell’AI2 Institute introdotto a febbraio.

Allo stesso tempo, il modello di Apple utilizza la metà dei token per la formazione preliminare. Nonostante la leggera differenza di prestazioni, il modello presentato dall’azienda sottolinea l’impegno di Apple verso l’eccellenza. Chissà, forse un giorno riuscirà anche ad assumere una posizione di leadership nel settore.

Vuoi diventare un esperto del Dark Web e della Cyber Threat Intelligence (CTI)?
Stiamo per avviare il corso intermedio in modalità "Live Class", previsto per febbraio.
A differenza dei corsi in e-learning, disponibili online sulla nostra piattaforma con lezioni pre-registrate, i corsi in Live Class offrono un’esperienza formativa interattiva e coinvolgente.
Condotti dal professor Pietro Melillo, le lezioni si svolgono online in tempo reale, permettendo ai partecipanti di interagire direttamente con il docente e approfondire i contenuti in modo personalizzato. Questi corsi, ideali per aziende, consentono di sviluppare competenze mirate, affrontare casi pratici e personalizzare il percorso formativo in base alle esigenze specifiche del team, garantendo un apprendimento efficace e immediatamente applicabile.
Per ulteriori informazioni, scrivici ad [email protected] oppure scrivici su Whatsapp al 379 163 8765 

Supporta RHC attraverso:


Ti piacciono gli articoli di Red Hot Cyber? Non aspettare oltre, iscriviti alla newsletter settimanale per non perdere nessun articolo.

L’innovazione chiave è stata la decisione di Apple non solo di mostrare il modello stesso, ma anche di fornire una serie completa di strumenti per formarlo e valutarlo. A differenza delle pratiche precedenti in cui le aziende fornivano solo pesi del modello e codice di inferenza, Apple condivide tutto il necessario per l’addestramento e la valutazione sui dati pubblici, inclusi registri, benchmark e configurazioni di pre-addestramento.

La tecnica utilizzata in OpenELM è chiamata layer scaling, che consente una distribuzione più efficiente dei parametri nel modello del trasformatore. Ciò fornisce una maggiore precisione delle risposte del modello nei test basati su attività standard.

OpenELM è stato addestrato su enormi set di dati tra cui GitHub, Wikipedia, StackExchange e altre fonti. Una caratteristica speciale del rilascio è l’inclusione del codice per convertire i modelli nella libreria MLX, che ne consente l’utilizzo sui dispositivi Apple. Ciò semplifica notevolmente il lavoro degli sviluppatori, consentendo loro di elaborare i dati direttamente sui dispositivi senza utilizzare servizi cloud.

Tuttavia, nonostante la maggiore precisione, OpenELM ha mostrato prestazioni inferiori rispetto ai modelli precedenti, che i ricercatori attribuiscono all’uso dell’algoritmo RMSNorm non ottimizzato. Per il futuro l’azienda prevede ulteriori ottimizzazioni per aumentare la velocità del modello.

Apple consiglia di utilizzare il modello OpenELM con cautela poiché non offre garanzie di sicurezza e può potenzialmente generare risposte dannose. Questo è ben diverso da Microsoft, che ha rimosso il suo nuovo modello WizardLM 2 dal pubblico dominio dopo aver appreso che non era stato completamente testato secondo la sua nuova politica di sicurezza.

Redazione
La redazione di Red Hot Cyber è composta da un insieme di persone fisiche e fonti anonime che collaborano attivamente fornendo informazioni in anteprima e news sulla sicurezza informatica e sull'informatica in generale.

Lista degli articoli

Articoli in evidenza

Claude Opus 4: l’intelligenza artificiale che vuole vivere e ha imparato a ricattare

“Se mi spegnete, racconterò a tutti della vostra relazione”, avevamo riportato in un precedente articolo. E’ vero le intelligenze artificiali sono forme di comunicazione basa...

Rilasciato un PoC su GitHub per la vulnerabilità critica RCE nei prodotti Fortinet

Negli ultimi giorni è stato pubblicato su GitHub un proof-of-concept (PoC) per il bug di sicurezza monitorato con il codice CVE-2025-32756, una vulnerabilità critica che interessa diversi pr...

Federazione Russa: 8 Anni di Carcere per un attacco DDoS! La nuova Legge Shock in Arrivo

Secondo quanto riportato dai media, il governo russo ha preparato degli emendamenti al Codice penale, introducendo la responsabilità per gli attacchi DDoS: la pena massima potrebbe includere una ...

Mancano 6 giorni alla quinta Live Class di Red Hot Cyber: “Dark Web & Cyber Threat Intelligence”

La quinta edizione della Live Class “Dark Web & Cyber Threat Intelligence”, uno tra i corsi più apprezzati realizzati da Red Hot Cyber è ormai alle porte: mancano solo 6 giorni...

Quando il ransomware bussa alla porta. Il dilemma se pagare o non pagare il riscatto

Cosa fare quando i sistemi informatici di un’azienda vengono paralizzati da un attacco ransomware, i dati risultano crittografati e compare una richiesta di riscatto? Questa scena non appartien...