Kaliforniya merkezli çip üreticisi Nvidia’nın piyasa değeri üç trilyon doları geçti ve şirket 3 trilyon 244 milyar dolarla Apple’ı geride bırakarak dünyanın üçüncü en değerli şirketi oldu. Çip üreticisinin hisse fiyatı yılbaşından bu yana yüzde 150’den fazla arttı. Artışta Nvidia’nın yapay zeka çiplerine talebin artması ve şirketin kârındaki yükselişin hız kesmemesi de etkili oldu. Yani yatırımcılar memnun, Nvidia çipini kullanan şirketler memnun ve Nvidia’nın siyah deri ceketli kırlaşmış saçlı kurucusu ve CEO’su Jensen Huang her geçen gün hedef yükseltiyor.
Ancak yapay zeka dünyası üstün performasına rağmen Nvidia’nın üstünlüğünü ne kadar daha koruyabileceğini konuşmaya başladı. Kendisini “Yapay zekaya dayalı bilgi işlemde dünya lideri” olarak tanımlayan Nvidia’nın tahtına göz dikenler arasında dev rakiplerinin yanısıra işin henüz başlarında olsalar da yenilikçi yaklaşımlarıyla ön çıkan startuplar da var. The Economist dergisi yayınladığı “Nvidia tahtından indirilebilir mi?” başlıklı analizde durumu irdeledi:
“Gpu’yu (Grafik işlemci birimi) kontrol eden evreni kontrol eder.” Bir bilim-kurgu klasiği olan “Dune”un ünlü bir repliğinden uyarlanan bu cümle bugünlerde sıkça duyuluyor. Gpu’lara ve özellikle de önde gelen tedarikçi Nvidia tarafından üretilenlere erişim yapay zeka alanında ciddiye alınmak isteyen her şirket için hayati önem taşıyor. Analistler bu çiplerden ne kadarına sahip olduklarına bağlı olarak şirketlerin “gpu zengini” ya da “gpu fakiri” olduğundan bahsediyor. Teknoloji patronları ellerindeki dev Gpu stoklarıyla övünüyor. Nvidia’nın bu alandaki tartışılmaz hakimiyeti şirketin piyasa değerini 3 trilyon doların üzerine çıkardı. Şirket 22 Mayıs’ta, Nisan ayında sona eren çeyrekte satışlarının bir önceki yıla göre yüzda 262 oranında arttığını açıkladı.
NVİDİA DURMAK BİLMİYOR (Çeyrekler itibarıyla satış- Milyar dolar)
Grafik işlem birimleri (Gpu) büyük yapay zeka modellerini eğitmek ve çalıştırmak için gereken ağır hesaplama işlerini yapıyor. İşin garibi başlangıçta bunun için tasarlanmamaları. Baş harflerinin “grafik işlem birimi” anlamına gelmesinin nedeni de bu tür çiplerin başlangıçta video oyunu grafiklerini işlemek için tasarlanmış olması. Ancak Nvidia’nın şansına, yapay zeka iş yüklerini hafifletmek için de kullanılabilecekleri anlaşıldı.
Uzman yapay zeka çiplerini sıfırdan tasarlamak daha iyi olabilir mi? Nvidia’yı alt etmek isteyen irili ufaklı pek çok şirket şu an bunu yapıyor. Özel yapay zeka çipleri, yapay zeka modellerinin oluşturulmasını ve çalıştırılmasını daha hızlı, daha ucuz kılıyor veya her ikisini de yapmayı vaat ediyor. Şampiyonun yani Nvidia’nın hüküm süren hakimiyetine karşı şampiyona karşı inandırıcı tehdit oluşturabilen herhangi bir şirket yüksek fiyatlarından ve sınırlı tedarikten hoşlanmayan müşteri sıkıntısı çekmeyecek.
Dizüstü ve masaüstü bilgisayarların içinde bulunanlar gibi sıradan işlemci çipleri özünde birbiri ardına bir işi yapmak üzere tasarlanmış. Gpu’lar ise bunun aksine, aynı basit görevin (bir sahnenin bir bölümünü çizmek gibi) binlerce versiyonunu aynı anda çalıştırmalarını sağlayan birkaç bin işlem motoru veya “çekirdek” içeriyor. Yapay zeka modellerini çalıştırmak da benzer şekilde aynı görevin çok sayıda kopyasını paralel olarak çalıştırmayı gerektiriyor. Yapay zeka kodunun gpu’larda çalışacak şekilde nasıl yeniden yazılacağını bulmak mevcut yapay zeka patlamasını tetikleyen faktörlerden biriydi.
Grafik işlem birimlerinin en önemli performans kriteri ne?
Yine de gpu’ların, özellikle de verileri yükleme ya da veri alma hızı söz konusu olduğunda sınırlamaları var. Modern yapay zeka modelleri çok sayıda birbirine bağlı gpu ve bellek yongası üstünde çalışıyor. Verilerin bunlar arasında bir şekilde taşınma hızı en önemli performans kriteri. Bazı gpu çekirdekleri çok büyük yapay zeka modellerini eğitim sürecinde veri beklerken zamanının yarısını boşta geçirebiliyor. Sunnyvale, California merkezli bir startup olan Cerebras’ın patronu Andrew Feldman bu durumu Şükran Günü’nden bir gün önce markette yaşanan tıkanıklığa benzetiyor. “Herkes kuyrukta, bu yüzden otoparkta tıkanmalar var, koridorlarda tıkanmalar var, kasada tıkanmalar var. Gpu’da da aynen böyle oluyor.”
Cerebras’ın buna yanıtı 900.000 çekirdeği ve çok sayıda belleği tek ve devasa bir çipe yerleştirerek birden fazla çipi birbirine bağlamanın ve bunlar arasında veri aktarmanın karmaşıklığını azaltmak oldu. Feldman geliştirdikleri Cs-3 çipinin 50 kat farkla dünyanın en büyüğü olduğunu belirterek “Çipimiz bir yemek tabağı büyüklüğünde, bir gpu ise posta pulu büyüklüğünde” diyor. Cerebras, çekirdekler arasındaki yonga üstü bağlantıların, ayrı gpu’lar arasındaki bağlantılardan yüzlerce kat daha hızlı çalıştığını söylüyor. Bu yaklaşımın ise belirli bir performans seviyesi için enerji tüketimini Nvidia’nın en güçlü gpu’suna göre yarıdan fazla azalttığını iddia ediyor.
Bir başka startup olan Groq ise farklı bir yaklaşım benimsiyor. Dil işleme birimleri (lpu) olarak adlandırılan yapay zeka çipleri büyük dil modellerini (llm) özellikle hızlı bir şekilde çalıştırmak için optimize edilmiş. Bu çipler kendi belleklerini içermenin yanı sıra, birbirine bağlı lpu’lar arasında veri aktaran yönlendiriciler olarak da işlev görüyor. Akıllı yönlendirme yazılımı, gecikme süresindeki veya veri beklemek için harcanan zamandaki değişkenliği ortadan kaldırarak tüm sistemin uyumlu çalışmasını sağlıyor. Bu da verimliliği ve dolayısıyla hızı büyük ölçüde artırıyor: Groq, lpu’larının büyük llm’leri mevcut sistemlerden on kat daha hızlı çalıştırabildiğini söylüyor.
Kaliforniya merkezli MatX adlı şirketin ise farklı bir yaklaşımı var. Şirketin kurucularından Reiner Pope’a göre grafik işlem birimleri (Gpu) grafikler için esneklik sağlayan ancak büyük dil modelleri (llm) için gerekli olmayan özellikler ve devreler içeriyor. MatX’in üstünde çalıştığı grafik işlem birimi (gpu) benzeri çip bu tür gereksiz işlerden kurtuluyor ve daha az işi daha iyi yaparak performansı artırıyor.
Bir çip tasarlamak kaç yıl sürüyor?
Bu alandaki diğer startuplar arasında İsrail merkezli Hailo, Toronto merkezli Taalas, yapay zeka çipleri oluşturmak için açık kaynaklı işlemci tasarımı ve mikroişlemci mimarisi RISC-V’yi kullanan Amerikan şirketi Tenstorrent ve Japon SoftBank’a satılmak üzere olduğu söylenen İngiliz şirketi Graphcore yer alıyor. Büyük teknoloji firmaları da yapay zeka çipleri üretiyor. Google bulut bilişim hizmeti olarak kullanıma sunduğu kendi “tensör işlem birimlerini” (tpus) geliştirdi ve en son sürümünü 14 Mayıs’ta tanıttı. Amazon, Meta ve Microsoft da bulut tabanlı yapay zeka için özel çipler üretti; OpenAI da bunu yapmayı planlıyor. İki büyük önemli çip üreticisi olan Advanced Micro Devices (AMD) ve Intel zaten gpu benzeri çipler üretiyor.
Yeni gelenler için bir tehlike, uzmanlaşma çabalarının çok ileri gidebilmesi. Stanford Üniversitesi’nde bilgisayar bilimcisi olan Christos Kozyrakis, bir çip tasarlamanın tipik olarak iki ya da üç yıl sürdüğünü ve yapay zeka modellerinin ne kadar hızlı geliştiği düşünüldüğünde bunun “çok uzun bir süre” olduğunu söylüyor. Kozyrakis’e göre fırsat, girişimlerin gelecekteki modelleri çalıştırmada Nvidia’nın daha az uzmanlaşmış gpu’larından daha iyi bir çipe sahip olabilmeleri. Risk ise yanlış konuda uzmanlaşmaları.
Daha önce llm’lerde kullanılan ve şu anda baskın olan “transformatör” mimarisini geliştiren Google eski çalışanı ve MatX’in kurucularından Pope, şirketinin geleceği okuyabilen “biraz iyi bir kristal küreye” sahip olduğundan emin. Ve eğer yeni bir yaklaşım ortaya çıkarsa çipinin buna uyum sağlayacak kadar çok yönlü olduğunu söylüyor. Cerebras’ın patronu Feldman, tüm modern yapay zekânın kaputun altında hala sadece “seyrek doğrusal cebir” olduğunu ve kendi çiplerinin bunu çok bir şekilde yapabildiğini söylüyor.
Nvidia neden büyük avantaja sahip?
Bir başka zorluk da Nvidia’nın ‘cuda’ olarak bilinen gpu’larını programlamaya yarayan yazılım katmanının kullanımı oldukça zahmetli olmasına rağmen fiili bir endüstri standardı haline gelmiş olması.
Stanford’dan Kozyrakis’e göre “Yazılım kraldır” ve yıllar içinde kendi yazılı ekosistemini oluşturan Nvidia bu konuda büyük avantaja sahip. Yapay zeka çip startupları ancak programcıları kodlarını kendi çiplerinde çalışacak şekilde yeniden düzenlemeye ikna edebilirlerse başarılı olacak. Bunu yapmak için yazılım araç setleri sunuyorlar ve başlıca makine öğrenimi altyapılarına uyum sağlıyorlar. Ancak yeni bir mimaride performansı optimize etmek için yazılımda ince ayar yapmak zor ve karmaşık bir iş. Nvidia’nın yerinden edilmesinin zor olmasının bir nedeni de bu.
Yapay zeka çiplerinin ve bunların etrafında inşa edilen sistemlerin en büyük müşterileri arasında model oluşturucular (OpenAI, Anthropic ve Mistral gibi) ve teknoloji devleri (Amazon, Meta, Microsoft ve Google gibi) var. Bu tür şirketlerin bir yapay zeka startup’ını satın alması ve rekabette üstünlük sağlama umuduyla teknolojisini kendilerine saklaması mantıklı olabilir. Çip startupları bu nedenle Nvidia ile rekabet etmeye çalışmak yerine kendilerini satın alma hedefi olarak konumlandırabilirler.
Pope, MatX’in pazarın “en yüksek kaliteli bölümünü” hedeflediğini söylüyor; bu da şirketin tamamını olmasa da çiplerini yapay zeka modelleri en gelişmiş olan OpenAI, Google veya Anthropic gibi şirketlere satmayı umduğunu gösteriyor. “Pek çok türde exit’ten mutlu oluruz” diyor, “ancak burada bağımsız bir şirket olarak sürdürülebilir bir iş olduğunu düşünüyoruz.”
Bunu zaman gösterecek. Cerebras’ın ise halka arz için hazırlık yaptığı söyleniyor. Şimdiye kadar hiçbir girişim Nvidia’nın hakim konumuna bir darbe vuramadı. Pek çok startup içlerinden birinin bunu başaracağını umuyor.”