Le polemiche su Claude 5 aumentano, gli utenti accusano Anthropic di aver “ingabbiato” la sua principale IA

Claude Fable 5 di Anthropic sta affrontando un crescente malcontento dopo il suo rilascio del 1° luglio. Gli utenti sostengono che regole più severe abbiano compromesso la capacità del modello di punta nel coding, debugging e nelle prestazioni agentiche.Il gruppo di benchmark BridgeMind ha riportat…

Il gruppo di benchmark BridgeMind ha riportato forti cali nei punteggi dell’intera suite BridgeBench. Nel frattempo, Anthropic sostiene che il modello di base sia rimasto invariato e attribuisce questi problemi a classificatori di sicurezza più restrittivi.

Crollano i punteggi di benchmark di Claude Fable 5 dopo il nuovo rilascio

BridgeMind ha rieseguito la versione del 1° luglio di Fable 5 registrando forti diminuzioni. Il debugging è sceso da 86,2 a 25,9, il refactoring da 73,6 a 38,4 e la gestione delle allucinazioni da 75,9 a 61,7.

Punteggi BridgeBench per Claude Fable 5 prima e dopo il nuovo rilascio, Fonte: Utenti su X

I meccanismi dietro questi numeri sono importanti. Solo tre dei 12 task di debugging sono stati completati senza ricorrere a Claude Opus 4.8, e ogni fallback ha ottenuto punteggio zero.

Pertanto, il crollo riflette task bloccati e non un ragionamento più debole.

BridgeMind ha sottolineato che Fable 5 mantiene le stesse prestazioni di giugno quando un compito viene portato a termine.

“Il modello non è peggiorato. È stato ingabbiato,” hanno indicato.

Seguici su X per ricevere le ultime notizie in tempo reale

La sequenza temporale chiarisce la tensione. Anthropic ha lanciato Fable 5 il 9 giugno, e Washington lo ha rimosso tre giorni dopo. Le autorità di regolamentazione il 30 giugno, quattro giorni dopo aver ripristinato l’accesso a Mythos 5 per circa 100 istituzioni statunitensi.

L’accesso ripristinato prevede anche dei limiti. Fable 5 può essere utilizzato solo fino al 50% dei limiti settimanali fino al 7 luglio, poi passerà a crediti a pagamento.

Anthropic difende il suo margine di sicurezza ampliato

Anthropic ha affrontato il compromesso in una dichiarazione del 30 giugno. L’azienda ha spiegato in dettaglio di aver intenzionalmente ampliato il suo margine di sicurezza, il che significa che ora i classificatori bloccano richieste probabilmente innocue. Un filtro migliorato blocca la tecnica di bypass, come riportato dai ricercatori Amazon in oltre il 99% dei tentativi.

Le richieste bloccate vengono indirizzate a Opus 4.8 e gli utenti ricevono una notifica. Tuttavia, Anthropic ha ammesso che il filtro ora segnala più attività legittime di coding e debugging rispetto al passato.

Secondo i propri test, inoltre, Fable 5 non rappresenta un rischio unico. Modelli concorrenti, fra cui GPT-5.5 e Kimi K2.7, hanno infatti rilevato le stesse vulnerabilità.

Anthropic spiega che i ricercatori del Dipartimento del Commercio USA hanno testato entrambe le versioni di salvaguardia, giudicandole eccezionalmente robuste.

Le conseguenze vanno oltre un singolo ciclo di prodotto. La sospensione ha spinto l’Europa a corteggiare Anthropic, mentre i modelli di intelligenza artificiale cinesi stanno guadagnando terreno rispetto ai laboratori di frontiera statunitensi.

Attualmente, Anthropic sta sviluppando un framework per valutare la gravità dei jailbreak insieme ad Amazon, Microsoft e Google. Se i classificatori saranno in grado di ridurre rapidamente i falsi positivi, ciò potrà essere determinante per trattenerne gli utenti più esperti o rischiare di perderli.

Leggi la storia originale di Lockridge Okoth su