Davos bu yıl yapay zekayı ve ‘güvenin yeniden inşasını’ konuşacak
Trieu H. Trinh son dört yılını ilginç bir araştırmayla geçirdi: Matematik alanında başarılı liselilerin katıldığı Uluslararası Matematik Olimpiyatları'ndaki geometri problemlerini çözebilecek yapay zeka modeli geliştirmek. Bunda başarılı oldu da.
Lise öğrencileri için muhtemelen en prestijli yarışmalardan biri Uluslararası Matematik Olimpiyatları. Her yıl dünyanın dört bir yanından gelen öğrenciler bronz, gümüş ve altın madalyalar için yarışıyor. 2023’te yarışmaya katılan ülkelerin sayısı 112’ydi. Ancak olimpiyata yeni bir değişiklik geliyor: Lise öğrencilerinin yeni rakibi, Google’ın meşhur yapay zeka şirketi DeepMind’da geliştirilen yeni bir yapay zeka programı olabilir.
Google DeepMind ve New York Üniversitesi’nden Trieu H. Trinh öncülüğündeki bir ekip, 17 Ocak’ta Nature dergisinde AlphaGeometry adındaki yeni yapay zeka programını tanıttı. Araştırmacılar, programın önceki matematik olimpiyatlarında çıkan 30 geometri probleminden 25’ini başarıyla çözebildiğini duyurdu. Bu da yapay zeka modelinin yarışmada altın madalya kazanan lise öğrencisiyle benzer başarı oranına sahip olduğunu gösteriyor. AlphaGeometry bununla da kalmadı üstelik, 2004 yılında Uluslararası Matematik Olimpiyatları’nda çıkan ve daha önce uzmanların gözünden kaçmış bir probleme daha basit bir çözüm de üretti.
Matematik Olimpiyatları dünyanın en meşhur teorem kanıtlama yarışması. Yarışan her bir öğrenci iki gün boyunca matematiğin farklı alanlarında toplam altı problem çözmek zorunda. Bazı problem öylesine karışık oluyor ki bunu uzmanlar bile çözmekte zorlanıyor, hatta çözemiyor. Genelde de bu problemlerin çözümleri kısa, incelikli oluyor ama ulaşabilmek için yaratıcılık gerekiyor. Yaratıcı becerilere sahip yapay zeka modelleri yaratmak isteyen araştırmacılar için modellerinin matematik problemlerini çözebilmesi işte bu yüzden önemli. Şimdiye kadar OpenAI’ın GPT-4’ü gibi büyük dil modelleri bile matematik görevlerinde büyük ölçüde başarısız oldu.
Bir teoriye göre, yapay zeka modellerinin şimdiye kadar matematikte başarı elde edememesinde verilere erişimlerinin eksik kalması yatıyor. GPT-4 gibi dil modelleri kelimelerle dolu onlarca gigabaytlık metin dosyalarıyla eğitiliyor. Bir matematik teorisinin ispatını bilgisayarların anlayabileceği programlama diline çevirmek için meşakkatli bir çalışma gerekiyor. Bu durum geometri alanında çok daha zor, çünkü ispatların çözümünün hesaplanabilmesi için şekillerin de programlama diline aktarılması gerekiyor.
Geometri için özel olarak geliştirilmiş programlama dilleri olmasına rağmen bunlar matematiğin diğer alanlarındaki yöntemlerden çok az yararlanıyor. Dolayısıyla diyelim ki bir geometri ispatı, negatif değerlerin kareköklerini içeren karmaşık sayıların sayılar içeriyorsa geometriye özel programlama dilleri işe yaramıyor.
Trinh ve meslektaşları ise insanların ispatlarının resmi yazı diline çevrilmesini gerektirmeyen bir veri seti oluşturdu. Bunu yapmak için de algoritmanın önce birtakım geometrik başlangıç noktaları oluşturmasını sağladılar. Bu başlangıç noktalarından birine yükseklikleri çizilmiş, kenarlarına noktalar eklenmiş bir üçgeni verebiliriz. Araştırmacılar daha sonra tümdengelim yöntemini kullanarak üçgenin hangi açılarının eşleştiği ve hangi doğruların birbirine dik olduğu gibi diğer özellikleri açıkladılar.
Geometrik yapılar hakkında açıklamalar yapabilmek için önceden tanımlanan geometrik ve cebirsel kurallardan yararlanan programlar son on yıldır mevcut. Araştırmacılar önceki çalışmalardan faydalanarak yapay zeka modeli için teoremlerden ve bunlara karşılık gelen ispatlardan oluşan uygun veri setini oluşturabildiler. Veri setinde 100 milyondan fazla problem ve bu problemlere karşılık gelen kanıtlar var.
Tabii Uluslararası Matematik Olimpiyatları düzeyindeki problemlerle başa çıkmak için bu kadarı yeterli değil. Olimpiyatlarda karşılaşılan problemler basit çıkarımlar yapma becerisinin ötesine geçmeyi gerektiriyor. Trinh ve meslektaşları, makalelerinde “Olimpiyat seviyesindeki problemleri çözebilmek için eksik olan parça ispat üretebilmek” diye belirtiyor. Mesela bir üçgen hakkında bir şeyler kanıtlamak için bazen problemde hiç de bahsedilmeyen yeni noktalar ve çizgiler eklemeniz gerekebiliyor. İşte yapay zeka modellerinin sahip olması gereken beceri de tam olarak bu.
Büyük dil modelleri bir kelimenin ardından diğer kelimenin ne kadar uygun olup olmadığı olasılığına dayalı olarak cevap üretir. Yani aslında dili bizim bildiğimiz gibi bilmez, sadece tahmin yürütür. Buna rağmen GPT-4 gibi büyük miktarlarda veriyle beslenen dil modeleri, çoğu zaman sorulara anlamlı yanıtlar verebiliyor, hatta insan benzeri diyaloglar bile kurabiliyorlar.
Trinh ve ekibi AlphaGeometry’yi teoremler ve ispatlar konusunda eğitirken buna benzer bir veritabanı oluşturmayı başardı. Model henüz tümdengelim yaklaşımını kullanamıyor ama noktaları, çizgileri ve diğer yardımcı ögeleri bulmaya çalışıyor. ‘Tümdengelim’ bilimsel duran şık bir kavram ama aslında bu model de aynen dil modeli gibi yapay zekanın geçmiş problemleri bilip tahminler yapmasını esas alıyor.
Örnek üzerinden gidelim. AlphaGeometry’nin önüne bir problem koydunuz. Önce verilen özellikler değerlendiriliyor, kanıtlanması gereken ifade problemin içinde değilse büyük dil modeli yardımcı ögelerden faydalanıyor. Mesela ABC üçgenine dördüncü bir X noktası ekleyebiliyor. Bu da algoritmaya geometrik cisim hakkında başka özellikler türetmek için kullanabileceği yeni bilgiler veriyor. Bu işlem, yapay zeka ve tümdengelim programı istenen sonuca ulaşana kadar tekrarlanabiliyor. Matematik Olimpiyatları’nda üç kez altın madalya kazanan Peter Scholze Scientific American’a yaptığı değerlendirmede, “Yöntem kulağa mantıklı geliyor. Bazı yönlerden olimpiyat katılımcılarının aldığı eğitime benziyor” diyor. Gerçekten de benziyor, çünkü matematikte başarılı çoğu öğrenci de, aslında bu başarısını o güne kadar çok sayıda problem çözmesine borçlu. Yani onlar da geçmişi hatırlıyor, benzer problemlerle karşılarındaki problem arasında ilişki kuruyor.
AlphaGeometry’yi test etmek için 30 geometri problemi seçildi. Daha önce geometri problemleri çözmek için kullanılan Wu’nun algoritması denen standart yapay zeka programı sadece 10 tanesini doğru yanıtlarken GPT-4 hepsinde başarısız oldu. AlphaGeometry ise 25 soruyu doğru çözebildi. Araştırmacılara göre olimpiyat katılımcılarının 30 problemde ortalama başarısı 15,2. Altın madalya kazananlar ise ortalama 25,9 problemi doğru çözebiliyor. Tabii olimpiyatlarda yarışanlar sadece geometri problemleri çözmüyor. Bunların içinde cebir de var, sayı teorisi de var.
Üstelik araştırmacılar yapay zekanın ispatlarını incelediklerinde programın 2004’teki bir problemde verilen tüm bilgileri kullanmadığını da fark ettiler. Bu da AlphaGeometry’nin kendi başına 2004’teki cevaptan çok daha basit bir şekilde aynı sonuca ulaştığını gösteriyor. Ayrıca olimpiyat katılımcılarının kötü performans sergilediği daha karmaşık sorunlarda AlphaGeometry’nin de daha uzun ispatlar üretmesi gerekmişti. Yani yapay zeka programının da insanlarla aynı zorlukları yaşadığını söyleyebiliriz.
AlphaGeometry henüz olimpiyatlarda insanlarla yarışamıyor. Çünkü geometri problemleri olimpiyattaki problemlerin sadece üçte birini oluşturuyor. Ama Trinh ve ekibi bu yaklaşımın ileride diğer matematik alanlarına uygulanabileceğini söylüyor. Yani matematik olimpiyatlarına birkaç yıl sonra insan olmayan bir katılımcı gelir de altın madalya kazanırsa şaşırmayın.
Hemen ‘Artık yapay zeka matematik de yapıyor’ diye telaşa kapılmayın. Google’ın DeepMind’ının geliştirdiği AlphaGeometry çok önemli bir aşama olmakla birlikte, haberde de anlattığımız gibi aslında kendi başına akıl yürüten ve cevaplara kendi aklıyla ulaşan bir yapay zeka değil. Daha çok geçmiş yanıtlardan hareketle problem çözen bir yapay zeka.
Bu alanda esas büyük ilerleme, yapay zekanın kendi kendine ‘matematiksel akıl yürütme’ adı verilen yöntemi kullanabilmesiyle sağlanacak ama henüz o noktaya çok uzağız. İster Matematik Olimpiyatı seviyesinde bir öğrenci olalım ister dolmuşta şöföre uzattığımız paranın üstünü akıldan hesaplamaya çalışan herhangi biri, gündelik hayatta matematik gerektiren olaylarla karşılaştığımızda iki yöntemi bir arada kullanırız. Hem ezberimizde olan bazı sonuçlar vardır (mesela çoğumuz çarpım tablosunu ezbere biliriz) hem de o sonuçları ‘yaratıcı’ bir yöntemle kullanmamızı gerektiren bir matematiksel akıl yürütme yaparız.