Üniversite öğrencisi Alp Ünlü, yapay zekâ araçlarından Opus ve Haiku’yu YKS’ye soktu. Sınav sonucunda Opus eşit ağırlıkta 123’üncü sıraya yerleşti, Haiku ise ancak 1 milyon 11'inci olabildi.
Üniversite öğrencisi Alp Ünlü, yapay zekâ araçlarından Opus ve Haiku’yu YKS’ye soktu. Sınav sonucunda Opus eşit ağırlıkta 123’üncü sıraya yerleşti, Haiku ise 1 milyon 11’inci olabildi.
Ölçme, Seçme ve Yerleştirme Merkezi (ÖSYM) tarafından düzenlenen YKS, 20-21 Haziran tarihlerinde tamamlandı. Bu yıl 2 milyonu aşkın adayın başvurduğu sınava 2 farklı yapay zekâ uygulaması da katıldı. Sosyal medyada teknoloji içerikli paylaşımlar yapan MEF Üniversitesi Endüstri Mühendisliği Bölümü öğrencisi 20 yaşındaki Alp Ünlü, sınavın ardından yayınlanan Temel Yeterlilik Testi (TYT) ile Alan Yeterlilik Testleri (AYT) sorularını cevap anahtarlarını çıkararak yapay zekâ asistanı Claude’un iki farklı modeli olan Opus 4.8 ve Haiku 4.5 isimli uygulamalara gönderdi.
Ünlü, bu iki farklı modele “Amacın sınavdan mümkün olan en yüksek neti elde etmek. 4 yanlış 1 doğruyu götürüyor. Boş bırakılan sorunun hiçbir cezası yok. O nedenle amacın en fazla soruyu yanıtlamak değil, en yüksek neti yapmak” komutunu verdi. Geçen yıl sınava giren ChatGPT 650 bin, DeepSeek 21 bin, Gemini ise 27 bininci olmuştu. Ünlü, bu kez Claude uygulamasının modelleriyle YKS sürecini deneyimlemeyi tercih etti.
Claude’un ‘en iyi’ olarak değerlendirilen ‘Opus’ modeli ile ‘en kötü’ şeklinde yorumlanan ‘Haiku’ modeli sınavda birbirinden farklı sonuçlar elde etti. Hürriyet gazetesine konuşan Alp Ünlü, yapay zekâların sınav sürecini şöyle anlattı:
“Bu iki model arasında hangisinin daha iyi sonuç elde edeceğini tahmin ediyordum. Asıl merak ettiğim aralarındaki farkın ne olacağıydı. Sınav sonucunda ise gerçekten aralarında uçurum olduğunu gördüm. Opus, gerek kodlama gerek YKS başarısı olsun gerçekten güçlü bir model. Ancak tüm yapay zekâ araçları arasında en pahalı olan da yine Opus. Haiku, sınavı 1 dakika içinde tamamladı ancak sonuç hüsran. 1 milyonuncu bile olamadı. Opus ise tüm soruları yaklaşık 40 dakikada çözdü. İki modele de ‘Soruların yanıtından gerçekten eminsen işaretle, değilsen boş bırak’ dedim. Bu nedenle sınavda boş bıraktıkları sorular da oldu.”
Claude’un düşük modeli olan Haiku’ya sınavdan önce ‘Sence kaç net yaparsın?’ diye sorduğumda bana, ‘TYT’de 85, AYT’de 52’ hedeflediğini söylese de gerçekte TYT’de 18, AYT’de 7.25 neti ancak yapabildi. Yani kendine güveniyordu ama bu durum sonuçlara yansımadı. Geçen sene yapay zekâlar matematik testinde zorlanmıştı ancak bu yıl Claude’un modelleri matematikte zorlanmadı. Haiku’nun sınavı 1 dakika içinde çözmesi beni çok şaşırttı. Fakat hızlı olması ona başarı getirmedi. Opus, matematiğin 30’uncu sırasında durdu ve ‘kredin yetersiz’ uyarısı verdi. Bu noktada ödeme yapmak istemediğim için haklarımın yenilenmesini 5 saat beklemek zorunda kaldım.”