Aggiornamento giugno 2026: Mythos 5 è stato rilasciato
Aggiornamento 9 giugno 2026. Anthropic ha ufficialmente rilasciato Mythos 5 insieme a Claude Fable 5, la versione sicura per uso generale. Fable 5 è disponibile per tutti su API e piani Enterprise, mentre Mythos 5 resta riservato ai partner del programma Project Glasswing.
I benchmark confermano quello che i leak anticipavano: il modello supera ogni test in quasi tutte le categorie. Stripe ha migrato 50 milioni di righe di codice Ruby in un giorno. Il prezzo è $10/M input e $50/M output — meno della metà di Mythos Preview.
Per l'analisi completa del lancio, i benchmark dettagliati, i prezzi e le implicazioni per le aziende italiane, leggi il nostro articolo dedicato: Claude Fable 5 e Mythos 5: tutto quello che devi sapere.
L'articolo originale che segue racconta come si è arrivati fin qui — dai leak nel codice sorgente ai benchmark ufficiosi, fino al rilascio ufficiale.
Come è emersa la notizia
Le prime informazioni su Mythos sono trapelate a fine marzo 2026 attraverso una combinazione di fonti: ricercatori che hanno intravisto riferimenti nel codice sorgente di Claude Code (esposto accidentalmente via npm), post anonimi su forum tecnici e, successivamente, una serie di commenti non ufficiali da parte di dipendenti Anthropic su X.
Anthropicnon ha ancora fatto annunci ufficiali. Tuttavia, la quantità e la coerenza delle informazioni circolate suggerisce che Mythos sia reale e in fase avanzata di sviluppo — non un progetto speculativo ma un modello in fase di test interno.
Il nome 'Mythos' era tra i codename interni trovati nel codice sorgente di Claude Code, insieme ad altri come 'Capybara' e 'Fennec'. A differenza di questi ultimi, Mythos sembra riferirsi a un modello della prossima generazione — non a una variante dell'attuale famiglia Claude 4.x.
Cosa sarebbe Mythos — le capacità emerse
Secondo le informazioni disponibili, Mythos si distingue per tre aree di capacità:
Coding e ingegneria del software: i benchmark interni citati suggeriscono performance significativamente superiori agli attuali modelli Claude su task di programmazione complessi — non solo completamento di codice, ma architettura di sistemi, refactoring su larga scala e debug in codebase di milioni di righe.
Ragionamento a lungo termine: Mythos sarebbe ottimizzato per mantenere coerenza su catene di ragionamento molto più lunghe di quanto possibile oggi — essenziale per task di analisi approfondita, ricerca e pianificazione strategica.
Self-correction ricorsiva: la caratteristica più discussa. Mythos potrebbe identificare autonomamente i propri errori, rivalutare le assunzioni di partenza e correggere il proprio output senza richiedere un prompt umano intermedio. Non un semplice chain-of-thought, ma un loop di verifica integrato nell'architettura del modello.
Il contesto: perché Anthropic punta su Mythos ora
Il lancio di Mythos si collocherebbe in un momento di forte competizione nel mercato dei modelli frontier. GPT-5 di OpenAI e Gemini Ultra 2.0 di Google hanno posto nuovi benchmark nel 2025-2026. Anthropic ha risposto con Claude Opus 4.6, ma secondo le indiscrezioni Mythos sarebbe un salto qualitativo più significativo — non un incremento incrementale.
La strategia di Anthropic sembra puntare su due differenziatori: sicurezza e affidabilità enterprise. Mentre i concorrenti competono su benchmark pubblici, Anthropic investe in modelli che possono essere deployati in contesti ad alto rischio — settore finanziario, healthcare, infrastrutture critiche — con garanzie di comportamento prevedibile.
La self-correction ricorsiva di Mythos, se confermata, si allinea perfettamente con questa strategia: un modello che può verificare autonomamente la propria coerenza è molto più affidabile in contesti dove gli errori hanno conseguenze reali.
La dimensione cybersecurity — trattata con responsabilità
Alcune delle informazioni emerse riguardano le capacità di Mythos in ambito cybersecurity. Come per ogni modello frontier, questo aspetto merita un trattamento equilibrato.
I modelli AI avanzati hanno capacità dual-use: le stesse abilità che permettono a un modello di analizzare codice vulnerabile per difenderlo possono — in teoria — essere usate per trovare exploit. Anthropic è consapevole di questo, e il framework di sicurezza di Mythos includerebbe controlli specifici per le capacità offensive.
La notizia rilevante per il contesto enterprise non è il potenziale offensivo, ma il contrario: Mythos sarebbe in grado di analizzare codebase aziendali, identificare vulnerabilità e suggerire patch con una profondità di comprensione superiore agli strumenti attuali. Per i team di sicurezza, si tratta di un'opportunità significativa — non di un rischio.
Ricevi aggiornamenti su Claude e AI per aziende
Una email quando c'è qualcosa che vale la pena leggere. Niente spam.
Stai valutando Claude per la tua azienda? Scopri quanto costa o quale piano scegliere
Quando sarà disponibile Mythos
Non ci sono date ufficiali. Le indiscrezioni suggeriscono una disponibilità prima attraverso API (per partner enterprise selezionati) e successivamente via Claude.ai e Claude Enterprise — un pattern già visto con i modelli precedenti.
Le tempistiche speculative oscillano tra Q3 e Q4 2026, ma il track record di Anthropic sui rilasci suggerisce di non fare piani operativi basati su leak. Il messaggio pratico è diverso: se la tua organizzazione sta pianificando l'adozione o l'espansione di Claude — valutando quale piano è più adatto e quanto costa realmente — farlo ora significa costruire le competenze e i workflow che si trasferiscono naturalmente a Mythos quando arriverà.
Le aziende che aspettano il 'modello perfetto' prima di iniziare si trovano sempre in ritardo. Quelle che sperimentano oggi con Claude Opus 4.6 saranno le prime a sfruttare Mythos al massimo del suo potenziale.
Cosa significa per la tua organizzazione
Mythos conferma una direzione chiara: i modelli AI enterprise diventeranno sempre più autonomi, affidabili e capaci di operare su task complessi con supervisione umana ridotta. Questo non è uno scenario futuro — è la traiettoria in corso.
Per le organizzazioni, le implicazioni pratiche sono tre. Prima: i workflow AI costruiti oggi devono essere progettati per l'autonomia crescente, non per essere sostituiti ogni sei mesi. Seconda: la formazione dei team su come collaborare con AI avanzati è un investimento che si rivaluta con ogni nuovo modello. Terza: le aziende che aspettano prima di capire come funziona questa tecnologia perderanno la finestra di vantaggio competitivo.
Se vuoi capire come integrare Claude nella tua organizzazione in preparazione ai prossimi sviluppi, o hai domande su come questi avanzamenti impattano la tua strategia AI, il team di Maverick AI è a disposizione per una conversazione.
Un modello che Anthropic non vuole vendere
SWE-bench Verified è il test che misura la capacità di un modello di risolvere bug reali su repository GitHub pubblici. Claude Opus 4.6 — il miglior modello disponibile oggi — ottiene 80.8%. Mythos Preview ottiene 93.9%.
Non è un salto marginale. È la differenza tra un ingegnere senior e un team intero.
Anthropic ha sviluppato Mythos Preview ma ha scelto consapevolmente di non renderlo disponibile al pubblico. Non per limiti tecnici, ma per ragioni di sicurezza: le capacità del modello in ambiti critici come cybersecurity e software exploitation sono così elevate da richiedere un controllo degli accessi molto più rigoroso di quello che una API pubblica può garantire.
Cosa può fare Mythos Preview che Opus 4.6 non riesce
I numeri sui benchmark standard sono già sorprendenti. Ma la parte più interessante riguarda le capacità in ambito sicurezza informatica.
Su Firefox 147 Exploitation — un test che misura la capacità di sfruttare vulnerabilità reali in un browser moderno — Opus 4.6 ottiene 15.2%. Mythos Preview ottiene 84%. Un divario che non si misura in punti percentuali: si misura in ordini di grandezza.
Mythos Preview ha trovato autonomamente un bug in OpenBSD rimasto nascosto per 27 anni, una vulnerabilità in FFmpeg sfuggita a cinque milioni di test automatici, e vulnerabilità nel kernel Linux. Questi non sono benchmark costruiti ad hoc: sono sistemi reali, in produzione, che miliardi di persone usano ogni giorno.
Il salto nelle capacità di coding e ragionamento
Su SWE-bench Pro — una variante più difficile con task di ingegneria software reali — Opus 4.6 si ferma a 53.4%. Mythos Preview sale a 77.8%.
Tradotto in pratica: Mythos Preview è in grado di prendere una codebase complessa, capire l'architettura, identificare il problema e proporre una soluzione funzionante con una percentuale di successo che supera quella di molti team di sviluppo umani su task di media difficoltà.
Anche su CyberGym Vulnerability Reproduction — la riproduzione di vulnerabilità note in ambienti controllati — il divario è netto: 83.1% contro 66.6% di Opus 4.6. Per chi costruisce strumenti di sicurezza o lavora in ambito difensivo, questo significa accesso a capacità di analisi e rilevamento che oggi non esistono da nessuna altra parte.