Endüstri lideri AI kapsamındaki en son güncellemeler ve özel içerik için günlük ve haftalık bültenlerimize katılın. Daha fazla bilgi edin
Son NVIDIA GTC Konferansı’nda şirket, bir exaflop yapabilen ilk tek rantlı sunucu sistemi olarak tanımladığını açıkladı-bir milyar milyar veya bir quintillion, yüzen nokta operasyonları (flop). Bu atılım, NVIDIA’nın en yeni Blackwell Grafik İşleme Birimlerini (GPU) içeren en son GB200 NVL72 sistemine dayanmaktadır. Standart bir bilgisayar rafı yaklaşık 6 feet boyunda, 3 feet derinlikte ve 2 feet genişliğinde.
Bir Exaflop’u küçültüyor: Frontier’den Blackwell’e
Duyuru hakkında birkaç şey beni vurdu. Birincisi, dünyanın ilk exaflop özellikli bilgisayarı sadece birkaç yıl önce, 2022’de Oak Ridge Ulusal Laboratuvarı’na kuruldu. Karşılaştırma için, HPE tarafından üretilen ve AMD GPU’lar ve CPU’lar tarafından desteklenen “sınır” süper bilgisayar, başlangıçta 74 raf sunucudan oluşuyordu. Yeni NVIDIA sistemi, sadece üç yıl içinde yaklaşık 73x daha fazla performans yoğunluğu elde etti ve her yıl performans üçe değer verdi. Bu ilerleme, hesaplama yoğunluğu, enerji verimliliği ve mimari tasarımdaki kayda değer ilerlemeyi yansıtmaktadır.
İkincisi, her iki sistem de Exascale kilometre taşına çarparken, biri hız için optimize edilmiş, diğeri hassasiyet için farklı zorluklar için inşa edildikleri söylenmelidir. NVIDIA’nın exaflop spesifikasyonu, eğitim ve büyük dil modelleri (LLMS) gibi görevler de dahil olmak üzere AI iş yükleri için en uygun olduğu düşünülen düşük hassasiyetli matematiğe-özellikle 4 bit ve 8 bit yüzen nokta işlemlerine dayanmaktadır. Bu hesaplamalar hassasiyet üzerindeki hıza öncelik verir. Buna karşılık, Frontier için exaflop derecesi, doğruluğun kritik olduğu bilimsel simülasyonlar için altın standart olan 64 bit çift hassasiyetli matematik kullanılarak elde edildi.
Uzun bir yol kat ettik (çok çabuk)
Bu ilerleme düzeyi neredeyse inanılmaz görünüyor, özellikle de bilgisayarım endüstrisinde kariyerime başladığımda en son teknolojiyi hatırladığım gibi. İlk profesyonel işim DEC KL 1090’da bir programcı olarak idi. DEC’nin PDP-10 Serisi devrem alanı ana bilgisayarlarının bir parçası olan bu makine, saniyede 1,8 milyon talimat (MIPS) sundu. CPU performansının yanı sıra, katot ışın tüpüne (CRT) bağlı makine, kablolu kablolar aracılığıyla görüntülenir. Grafik özellikleri yoktu, sadece karanlık bir arka planda hafif metin. Ve elbette internet yok. Uzak kullanıcılar, saniyede 1.200 bite kadar hızlarda çalışan modemler kullanarak telefon hatlarına bağlandı.
500 milyar kez daha fazla hesaplama
MIP’leri floplarla karşılaştırmak genel bir ilerleme duygusu verirken, bu metriklerin farklı bilgi işlem iş yüklerini ölçtüğünü hatırlamak önemlidir. MIP’ler, özellikle iş uygulamalarında genel amaçlı bilgi işlem için yararlı olan tamsayı işleme hızını yansıtır. Flops, bilimsel iş yükleri için çok önemli olan yüzen nokta performansı ve modern yapay zekanın arkasındaki ağır sayı, örneğin Makine Öğrenimi (ML) modellerini eğitmek ve çalıştırmak için kullanılan matris matematiği ve doğrusal cebir gibi ölçer.
Doğrudan bir karşılaştırma olmasa da, o zaman MIP’ler ve floplar arasındaki farkın saf ölçeği şimdi hesaplama performansındaki hızlı büyümenin güçlü bir örneğini sunmaktadır. Bunları gerçekleştirilen çalışmaları ölçmek için kaba bir sezgisel olarak kullanan yeni NVIDIA sistemi, DEC makinesinden yaklaşık 500 milyar kat daha güçlüdür. Bu tür bir sıçrama, tek bir profesyonel kariyer üzerindeki bilgi işlem gücünün üstel büyümesini örneklendirir ve şu soruyu gündeme getirir: 40 yıl içinde bu kadar ilerleme mümkünse, sonraki 5 ne getirebilir?
Nvidia, kendi adına bazı ipuçları sundu. GTC’de şirket, “Vera Rubin” ultra mimarisine dayanan yeni nesil tam raf sisteminin, bu yıl Blackwell Ultra Rack nakliyesinin performansını 14 kat sunacağını ve önümüzdeki yıl veya iki kez AI-optimize edilmiş çalışmada 14 ila 15 exafloplara ulaşacağını tahmin eden bir yol haritası paylaştı.
Verimlilik de dikkat çekicidir. Bu performans seviyesini tek bir rafta elde etmek, birim iş başına daha az fiziksel alan, daha az malzeme ve operasyon başına daha düşük enerji kullanımı anlamına gelir, ancak bu sistemlerin mutlak güç talepleri muazzam kalır.
Yapay zeka gerçekten bu güç hesaplama ihtiyacına mı ihtiyaç duyuyor mu?
Bu tür performans kazanımları gerçekten etkileyici olsa da, AI endüstrisi şimdi temel bir soru ile boğuşuyor: ne kadar bilgi işlem gücü gerçekten gerekli ve ne pahasına? Büyük yeni AI veri merkezleri inşa etme yarışı, exascale bilgi işlem ve her zamankinden daha yetenekli AI modellerinin artan taleplerinden kaynaklanmaktadır.
En iddialı çaba, her biri yarım milyon metrekarelik 20 veri merkezi öngören 500 milyar dolarlık Project Stargate. Şirketler ve ülkeler, yarının AI iş yüklerini destekleyecek altyapıya sahip olduklarından emin olmak için mücadele ederken, ya da dünyanın dört bir yanında ya da dünyanın dört bir yanında planlama aşamalarında bir dalga.
Bazı analistler şimdi AI veri merkezi kapasitesini aşırı inşa edebileceğimizden endişe ediyorlar. Endişe, Çin’in Deepseek’ten akranlarının çoğundan önemli ölçüde daha az hesaplama gerektiren bir akıl yürütme modeli olan R1’in serbest bırakılmasından sonra yoğunlaştı. Microsoft daha sonra kiralamaları birden fazla veri merkezi sağlayıcıyla iptal ederek gelecekteki AI altyapı talebi için beklentilerini yeniden kalibre edebileceğine dair sparking yaptı.
Fakat, Kayıt önerilen Bu geri çekilme, yeni nesil AI sistemlerinin güç ve soğutma ihtiyaçlarını desteklemek için yeterince sağlam bir yeteneğe sahip olmayan planlanan AI veri merkezlerinin bazılarıyla daha fazla ilgisi olabilir. Zaten, AI modelleri mevcut altyapının destekleyebileceği sınırları zorluyor. MIT Teknoloji İncelemesi bildirilmiş Bu, Çin’deki birçok veri merkezinin, önümüzdeki birkaç yılın yerine, mevcut ihtiyaç için en uygun olmayan özelliklere göre inşa edilmesinin mücadele etmesinin ve başarısız olmasının nedeni olabilir.
AI çıkarım daha fazla flop gerektirir
Akıl Yürütme Modelleri, çalışmalarının çoğunu çalışma zamanında çıkarım olarak bilinen bir süreçle gerçekleştirir. Bu modeller, derin araştırma asistanları ve ortaya çıkan ajan AI sistemleri dalgası da dahil olmak üzere günümüzde en gelişmiş ve kaynak yoğun uygulamalardan bazılarını güçlendirmektedir.
Deepseek-R1 başlangıçta endüstriyi gelecekteki AI’nın gerektirebileceğini düşünmeye teşvik ederken az Bilgi işlem gücü, Nvidia CEO’su Jensen Huang sert bir şekilde geri döndü. Konuşuyorum CNBC’ye göre bu algıya karşı çıktı: “Herkesin sahip olduğu tam tersi.” Yetkili, akıl yürütme yapay zekanın, mantıksız AI’dan 100 kat daha fazla bilgi işlem tükettiğini de sözlerine ekledi.
Yapay zeka, akıl yürütme modellerinden özerk ajanlara ve ötesine dönüşmeye devam ettikçe, bilgi işlem talebinin bir kez daha artması muhtemeldir. Bir sonraki atılımlar sadece dil veya vizyonda değil, AI ajan koordinasyonunda, füzyon simülasyonlarında veya hatta büyük ölçekli dijital ikizlerde de gelebilir, her biri sadece tanık olduğumuz bilgi işlem yeteneği sıçramasıyla mümkün kıldı.
Görünüşe göre haklı olarak, Openai yeni duyurdu 40 milyar dolar yeni finansmankayıtta en büyük özel teknoloji finansmanı turu. Şirket dedi Blog yazısı Finansman “AI araştırmasının sınırlarını daha da zorlamamızı, hesaplama altyapımızı ölçeklendirmemizi ve her hafta ChatGPT kullanan 500 milyon kişi için giderek daha güçlü araçlar sunmamızı sağlıyor.”
Neden bu kadar sermaye yapay zekaya akıyor? Nedenleri rekabet gücünden ulusal güvenliğe kadar değişmektedir. Belirli bir faktör göze çarpmasına rağmen, bir McKinsey tarafından örneklendiği gibi başlık: “AI, kurumsal karları yılda 4,4 trilyon dolar artırabilir.”
Sırada ne olacak? Kimse Tahmin
Özünde, bilgi sistemleri, bir zamanlar Fortran’da, COBOL’da inşa edilmiş bir öğrenci başarı raporlama aracı veya ilaç keşfini hızlandıran modern AI sistemlerinde yazdığım bir acil durum araç yönlendirme sistemi aracılığıyla karmaşıklığı soyutlamakla ilgilidir. Amaç her zaman aynıydı: dünyayı daha fazla anlamlandırmak.
Şimdi, güçlü AI ortaya çıkmaya başlamasıyla, bir eşiği geçiyoruz. İlk kez, bir zamanlar insan erişiminin ötesinde olan sorunların üstesinden gelmek için bilgi işlem gücüne ve zekaya sahip olabiliriz.
New York Times köşe yazarı Kevin Roos Son zamanlarda bu anı iyi yakaladı: “Her hafta, AI üzerinde çalışan, değişimin-büyük değişim, dünyayı sarsan değişim, daha önce hiç görmediğimiz dönüşüm türü-hemen köşede olduğunu söyleyen mühendisler ve girişimcilerle tanışıyorum.” Ve bu her hafta gelen atılımları bile saymıyor.
Sadece son birkaç gün içinde Openai’nin GPT-4O üretimini gördük neredeyse mükemmel görüntüler Metinden, Google En Gelişmiş Olabilecek Ne Olabilir akıl yürütme modeli Yine de Gemini 2.5 Pro ve Runway’de, çekimden çekim karakteri ve sahne tutarlılığına sahip bir video modeli, bir şey ventureBeat notalar şimdiye kadar çoğu AI video jeneratöründen kaçtı.
Bundan sonra gelen şey gerçekten bir tahmin. Füzyon enerjisini çözmeye veya yeni biyolojik riskleri serbest bırakmaya yardımcı olup olmayacağını, güçlü AI’nın bir atılım mı yoksa arıza mı olacağını bilmiyoruz. Ancak önümüzdeki beş yıl içinde daha fazla flop çevrimiçi olarak, bir şey kesin görünüyor: İnovasyon hızlı ve zorla gelecek. Flopların ölçeklenmesi olarak, sorumluluk, düzenleme ve kısıtlama hakkındaki konuşmalarımızın da olduğu açıktır.
Gary Grossman, teknoloji uygulamasının EVP’sidir. Edelman ve Edelman AI Mükemmellik Merkezi’nin küresel kurşun.
Kaynak: https://venturebeat.com/ai/mips-to-exaflops-in-just-40-years-compute-power-is-exploding-and-it-will-transform-ai/