
Anthropic ha rilasciato Claude Opus 4.5 , il suo nuovo modello di punta, che, secondo l’azienda, è la versione più potente finora rilasciata e si posiziona al vertice della categoria nella programmazione pratica, negli scenari basati su agenti di produttività.
Il modello ha inoltre registrato miglioramenti significativi nella ricerca approfondita, nell’analisi e nelle attività di presentazione. Opus 4.5 è ora disponibile tramite app, API e in tutti e tre le principali tecnologie cloud.
Nel test SWE-bench Verified, il nuovo modello mostra il risultato migliore tra tutti i modelli di frontiera : Anthropic sottolinea in particolare che Opus 4.5 rappresenta un significativo passo avanti rispetto a Sonnet 4.5, superando compiti che solo poche settimane fa erano considerati “quasi impossibili” per la generazione precedente.

Oltretutto:
Opus 4.5 è leader in 7 linguaggi di programmazione su 8 su SWE-bench Multilingual.
I miglioramenti non si limitano al codice: il modello ha registrato notevoli progressi nella visione, nella matematica, nel ragionamento e nelle attività multimodali.
Nel contesto delle intelligenze artificiali, “SOTA” (State of the Art) indica il modello o la tecnica che raggiunge le migliori prestazioni note su uno o più benchmark rilevanti.

Un esempio di miglioramento è stato un caso del benchmark τ²: il modello si sarebbe posizionato in settima posizione, dopo GPT 5.1.

Secondo il team, Opus 4.5 è il modello Anthropic più sicuro e resistente alle iniezioni immediate. Ha superato tutti i concorrenti in una serie di test di resilienza alle richieste di attacco. Oltretutto:

Opus 4.5 introduce una nuova importante funzionalità per gli sviluppatori: il parametro effort, che determina la profondità del ragionamento:

Secondo Anthropic, tutto ciò comporta un incremento del 15% nelle attività di ricerca approfondita degli agenti.
Claude Opus 4.5 di Anthropic adotta un modello di pricing flessibile, suddiviso tra API e abbonamenti. Per gli sviluppatori che utilizzano l’API, il costo è calcolato per milione di token: la tariffa è di $5,00 per l’input (i dati che invii al modello) e $25,00 per l’output (la risposta generata), rendendolo sensibilmente più economico rispetto al suo predecessore Opus 4.1.
Anthropic offre anche sconti significativi tramite funzionalità come l’elaborazione batch (sconto del 50%) e il caching dei prompt (fino al 90%). Per gli utenti finali che utilizzano l’interfaccia web, Opus 4.5 è accessibile tramite i piani in abbonamento: il piano base è il “Pro” a $20 al mese, che offre l’accesso al modello con un limite di utilizzo giornaliero, mentre il piano “Max” (a partire da $100 al mese) offre un utilizzo notevolmente maggiore.
Con il rilascio di Opus 4.5 sono stati introdotti i seguenti aggiornamenti:
Anthropic ha inoltre aumentato i limiti di utilizzo di Opus 4.5, rendendolo più adatto come strumento di lavoro principale. L’azienda ha dichiarato che gli utenti riceveranno approssimativamente lo stesso volume di token Opus rispetto ai token Sonnet disponibili in precedenza.
Ti è piaciuto questo articolo? Ne stiamo discutendo nella nostra Community su LinkedIn, Facebook e Instagram. Seguici anche su Google News, per ricevere aggiornamenti quotidiani sulla sicurezza informatica o Scrivici se desideri segnalarci notizie, approfondimenti o contributi da pubblicare.

InnovazioneL’evoluzione dell’Intelligenza Artificiale ha superato una nuova, inquietante frontiera. Se fino a ieri parlavamo di algoritmi confinati dietro uno schermo, oggi ci troviamo di fronte al concetto di “Meatspace Layer”: un’infrastruttura dove le macchine non…
CybercrimeNegli ultimi anni, la sicurezza delle reti ha affrontato minacce sempre più sofisticate, capaci di aggirare le difese tradizionali e di penetrare negli strati più profondi delle infrastrutture. Un’analisi recente ha portato alla luce uno…
VulnerabilitàNegli ultimi tempi, la piattaforma di automazione n8n sta affrontando una serie crescente di bug di sicurezza. n8n è una piattaforma di automazione che trasforma task complessi in operazioni semplici e veloci. Con pochi click…
InnovazioneArticolo scritto con la collaborazione di Giovanni Pollola. Per anni, “IA a bordo dei satelliti” serviva soprattutto a “ripulire” i dati: meno rumore nelle immagini e nei dati acquisiti attraverso i vari payload multisensoriali, meno…
Cyber ItaliaNegli ultimi giorni è stato segnalato un preoccupante aumento di truffe diffuse tramite WhatsApp dal CERT-AGID. I messaggi arrivano apparentemente da contatti conosciuti e richiedono urgentemente denaro, spesso per emergenze come spese mediche improvvise. La…