Arriva il nuovo Claude Sonnet 5: prestazioni quasi da Opus 4.8 a meno della metà del prezzo (aggiornato: 1 luglio 2026, ore 09:34)

Autore umano, supporto AI

Gli articoli di TurboLab.it sono curati dagli utenti della nostra community, ma possono essere generati o migliorati tramite intelligenza artificiale.

Anthropic ha lanciato Claude Sonnet 5, il nuovo modello che occupa la fascia intermedia della sua gamma ma punta a mordere i talloni al più costoso Opus 4.8. La proposta si riassume in una riga: prestazioni quasi da ammiraglia, a un prezzo sensibilmente inferiore. Per chi sviluppa applicazioni basate su API, il calcolo economico potrebbe cambiare in modo sostanziale. Prima di fare i conti, però, c'è un dettaglio nel meccanismo di fatturazione - un nuovo tokenizer - che vale la pena capire bene.

Immagine 1 Claude Sonnet 5

Su SWE-bench Pro, il riferimento per la capacità di risolvere problemi di programmazione in modo autonomo, Sonnet 5 arriva al 63,2% contro il 69,2% di Opus 4.8 e il 58,1% del precedente Sonnet 4.6. Un balzo netto rispetto al predecessore, ma con sei punti percentuali di distacco dal modello di punta.

Su GDPval-AA v2, un benchmark di Artificial Analysis che valuta le prestazioni su 44 tipologie di lavoro intellettuale tramite confronti ciechi a coppie, i due modelli si guardano quasi in faccia: Sonnet 5 segna un Elo di 1.618, Opus 4.8 di 1.616. Un pareggio statistico. Anche su Humanity's Last Exam la differenza è trascurabile - 57,4% contro 57,9%.

Immagine 2 claude-sonnet-5

Anthropic calibra il messaggio con cura: «Opus 4.8 resta il modello da preferire quando serve la massima accuratezza su questi compiti, ma Sonnet 5 offre agli sviluppatori un'opzione a prezzo inferiore con una qualità molto superiore a quanto era disponibile in precedenza». Tradotto: per la maggior parte dei casi d'uso, Sonnet 5 basta e avanza.

Sul prezzo: durante il periodo introduttivo, valido fino al 31 agosto 2026, Sonnet 5 costa 2 dollari per milione di token in ingresso e 10 dollari per milione di token in uscita. Dopo quella data si sale a 3 e 15 dollari rispettivamente. Per confronto, Opus 4.8 richiede 5 dollari in ingresso e 25 in uscita. Anche a prezzo pieno, Sonnet 5 costa il 40% in meno per token sia in input che in output. Secondo TechCrunch, il nuovo modello risulta più economico anche di GPT-5.5 di OpenAI e di Gemini 3.1 Pro di Google, pur restando più caro di Gemini 3.5 Flash.

Il trucco del tokenizer: leggere le note a piè di pagina

Anthropic ha relegato questo punto in una nota a piè di pagina del suo annuncio di lancio. Per chi gestisce budget API, è tutt'altro che marginale. Sonnet 5 introduce un nuovo tokenizer - il componente che spezza il testo in unità fatturabili - e con la nuova versione lo stesso identico input può generare dal 1,0 al 1,35 volte più token rispetto ai modelli precedenti.

Il prezzo introduttivo è stato pensato esplicitamente per compensare questa inflazione, rendendo la transizione «quasi a costo zero» fino a fine agosto. Ma dopo il 31 agosto gli sviluppatori si troveranno a fare i conti con un doppio rincaro simultaneo: il ritorno ai prezzi standard e l'aumento del numero di token generati dallo stesso contenuto. Un effetto composto che il materiale promozionale di Anthropic non mette certo in evidenza.

Per rendere l'idea: se un certo prompt oggi genera 1.000 token con il vecchio tokenizer, con Sonnet 5 potrebbe generarne fino a 1.350. Moltiplicati per il prezzo pieno di 3 dollari per milione di token in ingresso, il costo effettivo per quello stesso prompt sale in modo non trascurabile. Chi pianifica migrazioni verso Sonnet 5 farebbe bene a profilare i propri carichi di lavoro con il nuovo tokenizer prima di fare qualsiasi proiezione di spesa.

Un modello progettato per agire in autonomia

Al di là dei costi, la vera novità di Sonnet 5 è la sua vocazione agentica. Anthropic lo definisce «il modello Sonnet più agentico di sempre»: elabora piani, usa strumenti come browser e terminali, e porta a termine compiti complessi in più passaggi senza intervento umano. Capacità che, secondo l'azienda, «solo pochi mesi fa erano raggiungibili soltanto con modelli grandi e costosi».

Sonnet 5 verifica i propri risultati senza che gli venga chiesto esplicitamente. Daniel Shepard, ingegnere senior di Zapier, ha descritto un caso d'uso concreto: «Abbiamo assegnato a Claude Sonnet 5 un lavoro in due fasi - aggiornare i livelli degli account Salesforce e inviare un annuncio di lancio ai contatti enterprise - e l'ha completato dall'inizio alla fine». Il tipo di operazione concatenata che con i modelli precedenti tendeva a bloccarsi a metà.

Anthropic ha inoltre introdotto una sorta di regolatore dello sforzo che consente agli sviluppatori di modulare il compromesso tra costo e accuratezza su uno stesso compito, scegliendo se affidarlo a Sonnet 5 o a Opus 4.8. Un approccio pragmatico che riconosce la realtà del mercato: non tutti i task richiedono il modello migliore in assoluto. I limiti di frequenza sulle richieste sono stati aumentati su tutte le piattaforme - Chat, Cowork, Claude Code e Claude Platform - per gestire il carico di elaborazione aggiuntivo.

Sicurezza: promesse senza cifre

Anthropic dichiara che Sonnet 5 presenta tassi inferiori di allucinazione e di comportamento sycofantico rispetto a Sonnet 4.6, oltre a una migliore resistenza agli attacchi di prompt injection. Il problema è che non vengono fornite cifre specifiche - solo dichiarazioni generiche di «tassi inferiori». In assenza di dati, la cautela è d'obbligo.

Le capacità di cybersicurezza del modello restano inferiori a quelle dei modelli di classe Opus e Mythos, e le relative protezioni sono abilitate per impostazione predefinita. Sonnet 5 non è stato addestrato su compiti di cybersicurezza e viene distribuito senza le restrizioni sui controlli all'esportazione che si applicano ai modelli di fascia più alta.

Il contesto competitivo: tutti vogliono essere "i più agentici"

Il lancio di Sonnet 5 arriva in un momento delicato per Anthropic. I modelli di punta dell'azienda - Fable 5 e Mythos 5 - restano sospesi in seguito a una direttiva statunitense sui controlli all'esportazione emessa il 12 giugno, legata a una contestata scoperta di jailbreak. I cittadini stranieri non possono accedervi. Sonnet 5 è stato posizionato come indipendente da queste restrizioni, il che lo rende di fatto il modello più potente accessibile senza limitazioni geografiche nella gamma di Anthropic.

La capacità agentica è diventata il nuovo terreno di scontro dell'industria. OpenAI con GPT-5.6 Sol e Google con Gemini 3.5 Flash (lanciato a maggio 2026) avanzano rivendicazioni analoghe nelle rispettive fasce di prezzo. Tutti promettono modelli che «agiscono da soli»: la sfida si sposta sulla qualità dell'esecuzione autonoma e, soprattutto, sui costi per ottenerla.

C'è anche un sottotesto che merita menzione. Parte della comunità degli sviluppatori aveva accusato Anthropic di praticare una sorta di svalutazione silenziosa dei modelli - lasciando degradare le prestazioni di Opus 4.6 nel tempo per far apparire il salto generazionale successivo più impressionante. Anthropic ha negato di aver intenzionalmente degradato alcun modello. Con Sonnet 5, l'azienda sembra voler ricostruire fiducia offrendo un rapporto qualità-prezzo difficile da contestare. Ma quel tokenizer sepolto in nota a piè di pagina ricorda che, anche nell'era dell'intelligenza artificiale, il diavolo si nasconde nei dettagli contrattuali.

Fonti: anthropic.com, mashable.com, techcrunch.com, decrypt.co