Temel korkuya bir adım daha: Bilgisayarınızı sizin yerinize kullanan yapay zeka

Bilgisayarınızın kontrolünü bir yapay zeka modeline devretmenin nasıl bir şey olacağını hayal ettiyseniz fırsat ayağınıza geldi: Anthropic'in Claude 3.5 Sonnet modeli artık bilgisayarda yapılacak en temel işleri yapabiliyor.

Bilim Teknoloji 24 Ekim 2024

Bu haber 1 yıl önce yayınlandı

Fotoğraf: Anthropic

Dışarıdan bakınca kendi akılları, fikirleri varmış gibi görünen sohbet robotlarına alışmak insanlar için kolay olmadı. Bilinmeyene doğru atacağımız bir sonraki adım, yapay zekanın bilgisayarlarımızın kontrolünü ele geçirmesine güvenmek olabilir. ChatGPT ile yapay zeka alanında önde gelen şirketlerden biri olduğunu kanıtlayan OpenAI’ın en iddialı rakiplerinden biri Anthropic ve bu şirketin de OpenAI ile benzer bir yanı var: Yüksekten uçmak. Anthropic, yapay zeka modeli Claude’a bilgisayarda arama yapmak, uygulamaları açmak ve fareyle klavyeyi kullanarak metin yazmak gibi şeyleri öğrettiğini duyurdu.

Anthropic’in baş bilim sorumlusu ve aynı zamanda Johns Hopkins Üniversitesi’nde doçent Jared Kaplan, “Bence yapay zeka modellerinin, görevleri yerine getirmek için kullandığımız tüm araçları kullanabileceği yeni bir döneme gireceğiz” diyor. Benzer bir özelliği yakın zamanda Microsoft da 365 ürün paketi için duyurdu.

Neler yapabiliyor?

Kaplan, bilim ve teknoloji haberleri yapan WIRED’a Claude’un nasıl çalıştığını gösteren önceden kaydedilmiş bir demosunu göstermiş. Demoda Claude’dan Golden Gate Köprüsü’nde bir arkadaşla güneşin doğuşunu seyretme planı yapması isteniyor. Claude bu talebe yanıt olarak önce Chrome tarayıcısını bizzat kendi açarak ilgili bilgileri arama motoruna yazmış. Google’dan güneşin doğuşunun en iyi nereden izlenebileceğinin ve saat kaç gibi orada olunması gerektiği gibi bilgileri bulmuş. Sonra da takvim uygulamasını açarak etkinlik oluşturarak bunu söz konusu arkadaşla paylaşmış. Ancak bunları yaparken yolculuğun en kısa sürede nasıl yapılacağı gibi başka öneriler yapmamış.

Başka bir demoda Claude’dan kendini tanıtmak için basit bir internet sitesi oluşturması istenmiş. Model gerekli kodu oluşturmak için kendi arayüzüne bir metin istemi girmiş. Daha sonra basit bir internet sitesi yazmak için Microsoft’un geliştirdiği kod editörü Visual Studio Code’u kullanmış. Daha sonra siteyi test etmek için bir de sunucu kurmuş. Kurduğu site 90’lar temalı bir açılış sayfasına sahip. Bu da nostaljik bir hava yaratıyor. Sitedeki bir problemi çözmesi istendiğinde Claude yeniden kod editörüne girerek hatalı kodu tespit ederek silmiş.

Antropic’in baş ürün sorumlusu Mike Krieger, yapay zeka araçlarının rutin ofis işlerini otomatik hale getirerek insanları başka alanlarda üretken olmaya iteceğini söylüyor. “Saatlerce süren kopyalama ve yapıştırma işlerinden kurtulsanız ne yapardınız?” diye soruyor Krieger: “Gider daha fazla gitar çalardım.” Eminiz patronlar da iş başında durmak yerine gitar çalan bir çalışana maaş ödemeyi daha çok tercih edecektir.

Amazon’un desteğini arkasına alan Anthropic’in en güçlü büyük dil modeli Claude 3.5 Sonnet’ye getirdiği bu yeni özellikler kullanıma açıldı bile. Şirket daha küçük dil modeli Claude 3.5 Haiku’nun yeni ve gelişmiş versiyonunu da tanıttı.

En başarılısı olabilir ama kusursuz değil

Yapay zeka araçlarının demoları dikkat çekici görünse de teknolojinin gerçek hatta güvenilir bir şekilde ve can sıkıcı hatalar olmadan performans göstermesini beklemek şimdilik mümkün görünmüyor. Eldeki modeller soruları yanıtlayabiliyor ve neredeyse bir insan gibi sohbet edebiliyor. Şu anda bazı modeller basit komutlar verildiğinde bilgisayar ekranı, klavye ve trackpad gibi giriş aygıtlarına erişerek bilgisayardaki görevleri yerine getirebiliyor.

Anthropic Claude’un bilgisayar kullanma konusunda diğer yapay zeka araçlarından daha başarılı olduğunu söylüyor. Bunu da yapay zeka araçlarının yazılım geliştirme becerilerini ölçen SWE-bench ile OSWorld gibi kriterlerini dikkate alarak söylüyor. Buna göre OSWorld’deki görevleri 14,9 oranında doğru bir şekilde yapan Claude, genelde başarı oranı yüzde 75 olan insanların epey altında ama OpenAI’ın 7,7 puan alan GPT-4 modelinden çok daha başarılı görünüyor.

Anthropic bazı şirketlerin Claude’un ajan versiyonunu test ettiğini söylüyor. Bu şirketler arasında tasarım ve düzenleme işlerini otomatikleştirmek isteyen Canva ile kodlama alanında varlık gösteren Replit var.

Nobel Ödülleri’nden ikisi yapay zekaya verilince: Akademinin yolu şaşar mı?