Commenti a "Claude Mythos Preview sfonda il tetto di METR: è il punteggio più alto mai raggiunto"

Per favore, aggiungi TurboLab.it alle eccezioni del tuo Ad Blocker. Siamo un progetto no-profit, e la pubblicità è indispensabile per pagare le spese.

In alternativa, puoi sostenerci con una donazione.

Rispetteremo ogni tua scelta, e potrai sempre utilizzare il sito senza limitazioni.

Nascondi avviso per 3 giorni

Commenti a "Claude Mythos Preview sfonda il tetto di METR: è il punteggio più alto mai raggiunto"

Regole del forum
Puoi rispondere alle discussioni già presenti, ma non aprirne di nuove.

1 messaggio • Pagina 1 di 1

massimo.valenti: Livello: Scheda perforata (1/15); Messaggi: 0; Iscritto il: sab mar 28, 2026 6:55 pm; Has thanked: 6 times; Been thanked: 5 times

Commenti a "Claude Mythos Preview sfonda il tetto di METR: è il punteggio più alto mai raggiunto"

Messaggio da massimo.valenti » lun mag 11, 2026 3:14 pm

Per favore, aggiungi TurboLab.it alle eccezioni del tuo Ad Blocker. Siamo un progetto no-profit, e la pubblicità è indispensabile per pagare le spese.

In alternativa, puoi sostenerci con una donazione.

Rispetteremo ogni tua scelta, e potrai sempre utilizzare il sito senza limitazioni.

Nascondi avviso per 3 giorni

Claude Mythos Preview sfonda il tetto di METR: è il punteggio più alto mai raggiunto

Quando METR - l'organizzazione che traccia la capacità degli agenti AI di svolgere compiti autonomi - pubblica nuovi risultati, il settore tende a prestare attenzione. I dati più recenti riguardano Claude Mythos Preview, un modello di Anthropic valutato in una finestra temporale limitata a marzo 2026, e il quadro che ne emerge è tutt'altro che ordinario: il modello ha raggiunto il tetto massimo di ciò che il benchmark di METR è attualmente in grado di misurare. Non un prodotto commerciale disponibile al pubblico, ma un'anteprima che ha messo sotto pressione lo strumento di misura stesso. [continua..]

---

Cosa ne pensi? Lascia il tuo commento qui sotto.

1 messaggio • Pagina 1 di 1

Torna a “Commenti agli articoli”

Per favore, aggiungi TurboLab.it alle eccezioni del tuo Ad Blocker. Siamo un progetto no-profit, e la pubblicità è indispensabile per pagare le spese.

In alternativa, puoi sostenerci con una donazione.

Rispetteremo ogni tua scelta, e potrai sempre utilizzare il sito senza limitazioni.

Nascondi avviso per 3 giorni

Creazione issue GitHub

Ricerca articoli

Commenti a "Claude Mythos Preview sfonda il tetto di METR: è il punteggio più alto mai raggiunto"

Commenti a "Claude Mythos Preview sfonda il tetto di METR: è il punteggio più alto mai raggiunto"