AGI, bir yapay zekanın çok az bilgiyle yeni durumlara adapte olabilme ve genelleme yapabilme yeteneğini tabir ediyor. İnsan zekasının temelini oluşturan bu marifet, hala derin öğrenme modelleri için büyük bir mani teşkil ediyor.
ARC TESTLERİ NEDİR VE NEYİ ÖLÇÜYOR?
Yapay zekaların genelleme yeteneğini ölçmek için geliştirilen en kıymetli testlerden biri “Abstraction and Reasoning Corpus” (ARC) oldu. Birinci olarak 2019’da AI araştırmacısı François Chollet tarafından geliştirilen bu test, renkli küçük ızgaralardan oluşan bulmacalar sunuyor ve çözenden saklı bir kuralı öğrenip bunu yeni bir ızgaraya uygulamasını istiyor.
ARC günümüzde tüm büyük yapay zeka modellerinin kullandığı bir sanayi standardı haline geldi. Testin son versiyonu ARC-AGI-3, bu hafta tanıtıldı ve evvelki sürümlerden farklı olarak, yapay zekaların görüntü oyunları aracılığıyla test edilmesini hedefliyor.
YAPAY ZEKALAR NEDEN ZORLANIYOR?
ARC Prize Foundation Başkanı Greg Kamradt, bu testlerin aslında zekayı “yeni bir şeyi öğrenebilme yeteneği” olarak tanımladığını söylüyor. Beşerler çok az örnekle bir kalıbı fark edebiliyor ve bu beceriyi öteki durumlara uygulayabiliyor. Bu örnek verimliliği, şu anki yapay zeka sistemlerinin şimdi ulaşamadığı bir nokta.
Örneğin ARC-AGI-2 testinde 400 kişi üzerinde yapılan çalışmada, bireyler ortalama yüzde 66 muvaffakiyet sağladı. Üstelik 5-10 kişilik bir kümenin toplam karşılıkları, tüm soruların hakikat tahlillerini içeriyordu. Öte yandan, birçok gelişmiş AI modeli bu testlerde başarısız oluyor.
VIDEO OYUNLARIYLA TEST: ARC-AGI-3
ARC-AGI-3 ile birlikte test formatı büsbütün değişiyor. Artık yapay zekalar, beşerler üzere etkileşimli ortamlar olan görüntü oyunlarında test edilecek. Bu iki boyutlu piksel tabanlı bulmacalarda her düzey, makul bir küçük beceriyi öğretmeyi amaçlıyor. Seviyeyi muvaffakiyetle tamamlamak için oyuncunun (ya da yapay zekanın) planlı bir dizi aksiyonla bu beceriyi uygulaması gerekiyor.
Bugüne kadar test edilen hiçbir yapay zekanın, bu oyunlarda tek bir seviyeyi bile geçememiş olması, AI araştırmalarında hâlâ kat edilmesi gereken çok yol olduğunu gösteriyor.