Yayınlanma : 22 Ocak 2026 17:59

Anthropic, Claude'un kendisini kandırmasını engellemek için teknik testini sürekli güncelliyor

Anthropic, iş başvurusu yapan adaylar için hazırladığı teknik testi, kendi geliştirdiği Claude yapay zeka modelinin testi geçmesini engellemek için sürekli güncellemek zorunda kalıyor.

2024 yılından bu yana, Anthropic'in performans optimizasyon ekibi, iş başvurusu yapan adaylara bilgilerini test etmek için evde yapılabilen bir sınav veriyor. Ancak yapay zeka kodlama araçları geliştikçe, yapay zeka destekli kopya çekmenin önüne geçmek için bu testin sürekli değiştirilmesi gerekti.

HER YENİ CLAUDE MODELİ TESTİ YENİDEN TASARLAMAYI ZORUNLU KILDI

Ekip lideri Tristan Hume, bu zorluğun geçmişini Çarşamba günü bir blog yazısında anlattı. Hume, "Her yeni Claude modeli, testi yeniden tasarlamamızı zorunlu kıldı" diye yazıyor. "Aynı zaman sınırı verildiğinde, Claude Opus 4 insan adayların çoğundan daha iyi performans gösterdi. Bu, en güçlü adayları ayırt etmemize hâlâ izin veriyordu - ancak daha sonra, Claude Opus 4.5 onlarla bile eşleşti."

ADAY DEĞERLENDİRMESİNDE CİDDİ BİR SORUN ORTAYA ÇIKTI

Sonuç, ciddi bir aday değerlendirme sorunu oldu. Yüz yüze gözetim olmadan, birinin testte yapay zeka kullanarak kopya çekmediğini garanti etmenin bir yolu yok - ve eğer yaparlarsa, hızla en üste yükselecekler. Hume, "Evde yapılabilen testin kısıtlamaları altında, en iyi adaylarımızın çıktıları ile en yetenekli modelimizin çıktıları arasında ayrım yapmanın artık bir yolu yoktu" diye yazıyor.

YAPAY ZEKA LABORATUVARLARI DA BU SORUNLA MÜCADELE EDİYOR

Yapay zeka kopya çekme sorunu, dünya çapındaki okullarda ve üniversitelerde zaten büyük bir karmaşaya neden oluyor, bu yüzden yapay zeka laboratuvarlarının da bununla uğraşmak zorunda kalması ironik. Ancak Anthropic, bu sorunla başa çıkmak için benzersiz bir şekilde donanımlı. Sonuçta Hume, donanımı optimize etmekle daha az ilgili, çağdaş yapay zeka araçlarını şaşırtacak kadar yeni bir test tasarladı. Ancak yazının bir parçası olarak, orijinal testi, okuyan herhangi birinin daha iyi bir çözüm bulup bulamayacağını görmek için paylaştı. Yazıda, "Eğer Opus 4.5'ten daha iyisini yapabilirseniz, sizden haber almak isteriz" deniyor.

#Anthropic #Yapayzeka

HABER MERKEZİ

Bakmadan Geçme

Son Dakika