Anthropic’in Claude Fable 5 modeli, 1 Temmuz’daki yeniden yayınlanmasının ardından giderek artan bir tepkiyle karşı karşıya. Kullanıcılar, daha sıkı güvenlik önlemleri nedeniyle amiral gemisi modelin kodlama, hata ayıklama ve bağımsız hareket alanının kısıtlandığını öne sürüyor.

Kıyaslama platformu BridgeMind, BridgeBench testlerinde büyük bir düşüş yaşandığını duyurdu. Ancak Anthropic, temel modelde değişiklik olmadığını savunuyor ve yaşanan sorunları daha sıkı güvenlik denetleyicilerine bağlıyor.

Claude Fable 5’te Skorlar Neden Düştü?

BridgeMind, Fable 5’in 1 Temmuz güncellemesini tekrar test etti ve ciddi oranda düşüşler kaydetti. Hata ayıklama puanı 86,2’den 25,9’a, yeniden yapılandırma 73,6’dan 38,4’e, halüsinasyonla başa çıkma ise 75,9’dan 61,7’ye geriledi.

Claude Fable 5’in yeniden yayınlanmadan önce ve sonraki BridgeBench skorları, Kaynak: X platformundaki kullanıcılar

Bu rakamların arka planı önemli. 12 hata ayıklama görevinden sadece üçü Claude Opus 4.8’e başvurmadan tamamlanabildi ve fallback görevlerinin hepsi sıfır puan aldı.

Yani, puanlardaki çöküş zayıf akıl yürütmeden değil engellenen görevlerden kaynaklanıyor.

BridgeMind, bir görev tamamlandığında Fable 5’in haziran ayındaki formunu koruduğunu vurguladı.

BridgeMind, ‘Model kötüleşmedi, sadece kafese alındı’ dedi.

X hesabımızı takip edin gelişmeleri anında öğrenin!

Takvim gerginliğin sebebini anlatıyor. Anthropic, Fable 5’i 9 Haziran’da yayımladı, Washington üç gün sonra erişimi durdurdu. Düzenleyiciler, 30 Haziran’da ihracat kısıtlamalarını kaldırdı; bundan dört gün önce de yaklaşık 100 ABD kurumu için Mythos 5 erişimini .

Ancak erişimde bazı kısıtlar da var. Fable 5, 7 Temmuz’a kadar haftalık kullanım kotasının sadece %50’sini kullanabiliyor; ardından ücretli kullanım kredisi devreye girecek.

Anthropic, Güvenlik Marjını Neden Genişletti?

Anthropic, bu dengeyi 30 Haziran’da yayımladığı bir açıklamada ele aldı. Şirket, bilerek güvenlik marjını genişlettiğini, yani denetleyicilerin artık muhtemelen zararsız talepleri bile engellediğini belirtti. Güçlü bir filtre, Amazon araştırmacılarının da gibi, bypass yöntemine karşı %99’un üzerinde başarı sağladı.

Claude Fable 5 will be available again globally tomorrow.After a series of productive conversations with the US government, we're redeploying the model with a new set of classifiers to target and block more cybersecurity tasks. In the near term, some routine tasks like coding…

Engellenen talepler Opus 4.8’e yönlendirilirken, kullanıcıya bildirim gönderiliyor. Ancak Anthropic, artık filtrelerin eskisinden daha fazla sayıda geçerli kodlama ve hata ayıklama görevi de bloke ettiğini kabul ediyor.

Şirketin kendi testleri de Fable 5’in ortaya koydu. GPT-5.5 ve Kimi K2.7 gibi rakip modeller de aynı açıkları yakaladı.

Anthropic, ABD Ticaret Bakanlığı araştırmacılarının, iki farklı koruma sistemini de ‘olağanüstü güçlü’ bulduğunu belirtti.

Buradaki riskler bir üründen fazlasını etkiliyor. Bu askıya alma, Avrupa’nın Anthropic ile daha yakın ilişki kurmasına yol açarken Çin merkezli yapay zeka modelleri de ABD’deki öncü laboratuvarlara yaklaşmaya başladı.

Anthropic, şimdi Amazon, Microsoft ve Google ile birlikte bir jailbreak şiddet framework’ü hazırlıyor. Bundan sonraki süreçte, denetleyicilerin yanlış engellemeleri hızla azaltıp azaltamayacağı, güçlü kullanıcıların platformda kalıp kalmayacağını belirleyebilir.