Intelligenza artificiale: Microsoft lancia 7 modelli "MAI" per ridurre la dipendenza da OpenAI (aggiornato: 3 giugno 2026, ore 08:55)

Autore umano, supporto AI

Gli articoli di TurboLab.it sono curati dagli utenti della nostra community, ma possono essere generati o migliorati tramite intelligenza artificiale.

Martedì 2 giugno, mentre il sole californiano illuminava il Fort Mason Center di San Francisco, Satya Nadella saliva sul palco del Build 2026 con un messaggio che non lasciava spazio a interpretazioni: Microsoft non vuole più limitarsi a rivendere l'intelligenza artificiale altrui. Sette nuovi modelli sviluppati internamente, un modello di ragionamento che punta a competere con i migliori del settore e una strategia che ridisegna i rapporti con OpenAI. La conferenza per sviluppatori di quest'anno segna il momento in cui la strategia multi-modello di Microsoft smette di essere una slide in una presentazione e diventa prodotto.

Immagine 1 microsoft ai models

MAI-Thinking-1: il primo modello di ragionamento targato Microsoft

Il pezzo forte della giornata è MAI-Thinking-1, descritto da Microsoft come il proprio modello "di punta". Sviluppato dal team AI Superintelligence dell'azienda, è il primo modello di ragionamento costruito interamente a Redmond - territorio finora presidiato da OpenAI con la serie o1/o3, da Google con Gemini e da Anthropic con Claude.

L'architettura è ambiziosa. MAI-Thinking-1 è un modello di dimensioni medie con 35 miliardi di parametri attivi, ma si appoggia a una struttura sparse Mixture of Experts (MoE) che conta circa un trilione di parametri totali. Il modello attiva solo una frazione della rete per ogni richiesta - un approccio che consente di contenere i costi di inferenza pur disponendo di una capacità complessiva enorme. La finestra di contesto arriva a 256.000 token: sufficiente, secondo Microsoft, per elaborare un documento di 600 pagine in un'unica passata.

C'è un dettaglio su cui Redmond insiste con forza: la provenienza dei dati di addestramento. Il modello è stato costruito da zero su dati con licenza commerciale, senza distillazione da modelli di terze parti, GPT inclusi. Microsoft definisce questa trasparenza «un differenziatore chiave per le imprese» - un messaggio rivolto direttamente ai clienti aziendali che temono contenziosi sulla proprietà intellettuale. Nel mercato enterprise, è un argomento che funziona.

MAI-Thinking-1 è progettato per istruzioni complesse a più passaggi, ragionamento su contesti lunghi e generazione di codice. Supporta la chiamata a funzioni, il rispetto di istruzioni stratificate ed è compatibile con la Chat Completions API, il che ne facilita l'integrazione in flussi di lavoro esistenti.

Benchmark: numeri buoni, ma da verificare

I risultati dichiarati sono notevoli. Su AIME 2025, il benchmark di ragionamento matematico e scientifico multifase, MAI-Thinking-1 raggiunge il 97,0%. Su AIME 2026 il punteggio scende al 94,5%, ma resta un risultato solido considerando la difficoltà crescente del test.

Sul fronte della programmazione, Microsoft afferma che il modello eguaglia Claude Opus 4.6 di Anthropic sul benchmark SWE-Bench Pro.

» Leggi: Anthropic lancia Claude Opus 4.8: supera GPT-5.5 su SWE-Bench Pro e introduce Dynamic Workflows

Immagine 2 Claude Opus 4.8 (2)

Detto questo, nessun soggetto esterno ha ancora riprodotto indipendentemente questi risultati. I benchmark auto-dichiarati nel mondo dei modelli linguistici vanno sempre presi con le pinze: la vera prova sarà l'utilizzo sul campo da parte di sviluppatori e aziende. Microsoft ha pubblicato un preprint che descrive la metodologia di valutazione, ma un preprint non è una peer review.

MAI-Thinking-1 è disponibile fin da ora in anteprima privata su Microsoft Foundry. In futuro tutti i modelli MAI saranno accessibili anche tramite un nuovo ambiente dedicato chiamato MAI Playground e su piattaforme di terze parti come Fireworks AI, Baseten e OpenRouter.

Non solo ragionamento: codice, immagini e voce

Il modello di ragionamento è la punta dell'iceberg. Gli altri sei modelli annunciati coprono uno spettro decisamente più ampio.

MAI-Code-1-Flash è un modello di programmazione ottimizzato per l'inferenza, già disponibile in GitHub Copilot e VS Code, con rilascio graduale su tutti i livelli di abbonamento a Copilot - Free, Pro, Pro+ e Max. Curiosamente, invece di essere misurato su benchmark esterni, è stato addestrato direttamente all'interno dell'ambiente di produzione di GitHub Copilot. Microsoft sostiene che questo migliori l'affidabilità nei flussi di lavoro di programmazione agentici - quelli in cui il modello deve eseguire catene di azioni autonome. Un approccio non ortodosso, che rende però più difficile il confronto diretto con la concorrenza.

MAI-Image-2.5, con la sua variante Flash, gestisce generazione di immagini da testo e modifica di immagini esistenti. Secondo Kyle Daigle, CMO degli sviluppatori in Microsoft e COO di GitHub, il modello supera il "Nano Banana Pro" di Google sul benchmark ELO. È già integrato in PowerPoint e presto arriverà su OneDrive e in Microsoft Foundry.

MAI-Transcribe-1.5 coprirà la trascrizione in 43 lingue e viene descritto come cinque volte più veloce dei modelli concorrenti. MAI-Voice-2, con la relativa variante Flash, è disponibile in 15 lingue aggiuntive con molteplici opzioni vocali - la variante Flash è ancora in arrivo.

Il quadro strategico: meno dipendenza da OpenAI

Per capire il peso reale di questi annunci bisogna guardare al contesto. Fino all'anno scorso Microsoft dipendeva interamente dai modelli di OpenAI per alimentare Copilot e i propri servizi di intelligenza artificiale. La recente rinegoziazione dell'accordo tra le due aziende ha allentato i vincoli, e Build 2026 è la dimostrazione plastica di dove stia andando Redmond: un approccio multi-fornitore e multi-modello in cui i modelli proprietari MAI affiancano - e in prospettiva potranno sostituire - quelli di OpenAI.

Nadella aveva anticipato la direzione in una precedente earnings call, parlando della trasformazione di Copilot: non più un semplice chatbot, ma «collaboratori asincroni capaci di eseguire attività di lunga durata in ambiti chiave». I modelli annunciati al Build forniscono l'infrastruttura necessaria per realizzare quella visione.

Il verdetto (provvisorio)

MAI-Thinking-1 entra in un campo affollato dove OpenAI, Google e Anthropic hanno già modelli maturi, e lo fa con numeri sulla carta impressionanti ma ancora da verificare in modo indipendente. La scelta dell'architettura MoE con un trilione di parametri totali ma soli 35 miliardi attivi è intelligente sul piano dell'efficienza, e l'insistenza sulla provenienza pulita dei dati di addestramento risponde a un'esigenza concreta del mercato enterprise.

Il segnale più significativo, però, non è un singolo modello. Microsoft sta costruendo un portafoglio completo - ragionamento, codice, immagini, voce, trascrizione - che le consente di dipendere sempre meno da un unico fornitore. Per gli sviluppatori e gli utenti di Copilot, questo significa più opzioni e, si spera, più competizione sui costi. Per OpenAI, significa che il proprio investitore più importante è diventato anche un concorrente diretto. Un cambiamento di equilibri che vale la pena tenere d'occhio.

Fonti: mashable.com, theverge.com, techtimes.com