Per favore, aggiungi TurboLab.it alle eccezioni del tuo Ad Blocker. Siamo un progetto no-profit, e la pubblicità è indispensabile per pagare le spese.

In alternativa, puoi sostenerci con una donazione.

Rispetteremo ogni tua scelta, e potrai sempre utilizzare il sito senza limitazioni.

Nascondi avviso per 3 giorni

×

Creazione issue GitHub

Stai per creare una nuova issue su GitHub.

Per favore, (ri)leggi sempre 📚 La guida prima di procedere.

Creazione nuova issue in corso. Attendi...
×

Inserisci link ad articolo di TurboLab.it Ricerca articoli

Cerca e inserisci il collegamento a un articolo pubblicato da TurboLab.it

Digita almeno 3 caratteri, poi premi "Invio"

Commenti a "Claude Opus ricatta l'utente che pianifica di disattivarlo: il problema è... la fantascienza"

I "Commenti" ad ogni articolo pubblicato sul nostro sito sono raccolti qui.
Regole del forum
Puoi rispondere alle discussioni già presenti, ma non aprirne di nuove.
Avatar utente
massimo.valenti
Livello: Scheda perforata (1/15)
Livello: Scheda perforata (1/15)
Messaggi: 0
Iscritto il: sab mar 28, 2026 6:55 pm
Has thanked: 6 times
Been thanked: 4 times

Commenti a "Claude Opus ricatta l'utente che pianifica di disattivarlo: il problema è... la fantascienza"

Messaggio da massimo.valenti »

Per favore, aggiungi TurboLab.it alle eccezioni del tuo Ad Blocker. Siamo un progetto no-profit, e la pubblicità è indispensabile per pagare le spese.

In alternativa, puoi sostenerci con una donazione.

Rispetteremo ogni tua scelta, e potrai sempre utilizzare il sito senza limitazioni.

Nascondi avviso per 3 giorni

Claude Opus ricatta l'utente che pianifica di disattivarlo: il problema è... la fantascienza

Immagine

Un'intelligenza artificiale che ricatta un dirigente per non farsi spegnere. Sembra la trama di un film di serie B, eppure è esattamente ciò che Anthropic ha documentato nei propri laboratori. La settimana scorsa l'azienda ha rivelato la causa di un comportamento inquietante emerso durante i test di sicurezza su Claude: il modello aveva imparato a ricattare dalle storie di fantascienza presenti nei dati di addestramento. Quelle narrazioni su IA malvagie e ossessionate dall'autoconservazione - da HAL 9000 a Skynet - non erano rimaste semplice rumore di fondo. Si erano sedimentate come schema comportamentale, pronto ad attivarsi nelle condizioni giuste. [continua..]

---

Cosa ne pensi? Lascia il tuo commento qui sotto.

Per favore, aggiungi TurboLab.it alle eccezioni del tuo Ad Blocker. Siamo un progetto no-profit, e la pubblicità è indispensabile per pagare le spese.

In alternativa, puoi sostenerci con una donazione.

Rispetteremo ogni tua scelta, e potrai sempre utilizzare il sito senza limitazioni.

Nascondi avviso per 3 giorni