Bu hafta Amazon’un Las Vegas’taki yıllık bulut bilişim etkinliği olan AWS re:Invent 2024 var ve her zamanki gibi şirketin duyuracak o kadar çok şeyi var ki, her şeyi beş (!) açılış konuşmasına sığdıramıyor. Gösterinin resmi açılışı öncesinde AWS, Pazartesi günü genel veri merkezi stratejisine ilişkin dikkate değer bir dizi güncellemeyi ayrıntılı olarak açıkladı.
Bunlardan en önemlisi, AWS’nin yakında yapay zeka sunucuları ve diğer makineleri için, bunların kendi geliştirdiği Trainium çipleri ve Nvidia’nın hızlandırıcılarını temel alıp almadığına bakılmaksızın sıvı soğutmayı kullanmaya başlayacak olmasıdır. AWS özellikle Trainium2 çiplerinin (hala ön izleme aşamasındadır) ve “NVIDIA GB200 NVL72 gibi raf ölçeğinde yapay zeka süper bilgi işlem çözümlerinin” bu şekilde soğutulacağını belirtiyor.
AWS’nin bu güncellenmiş soğutma sistemlerinin hem hava hem de sıvı soğutmayı entegre edebileceğini vurguladığını vurgulamakta fayda var. Sonuçta, veri merkezlerinde hâlâ ağ ve depolama işlemlerini gerçekleştiren, örneğin sıvı soğutma gerektirmeyen çok sayıda başka sunucu var. AWS şöyle açıklıyor: “Bu esnek, çok modlu soğutma tasarımı, ister geleneksel iş yüklerini ister yapay zeka modellerini çalıştırıyor olsun, AWS’nin en düşük maliyetle maksimum performans ve verimlilik sağlamasına olanak tanıyor.”
Şirket ayrıca sunucuları ve sunucu rafları için daha basitleştirilmiş elektrik ve mekanik tasarımlara geçeceğini duyurdu.
“AWS’nin en son veri merkezi tasarım iyileştirmeleri arasında %99,9999 oranında altyapı kullanılabilirliği sağlayan basitleştirilmiş elektrik dağıtımı ve mekanik sistemler yer alıyor. Basitleştirilmiş sistemler aynı zamanda elektrik sorunlarından etkilenebilecek potansiyel raf sayısını da %89 oranında azaltıyor” diye belirtiyor şirket duyurusunda. AWS bunu kısmen, elektriğin elektrik ağından sunucuya giderken dönüştürülme sayısını azaltarak yapıyor.
AWS bundan daha fazla ayrıntı sunmadı, ancak bu muhtemelen sunucuları ve/veya HVAC sistemini çalıştırmak için DC gücü kullanmak ve aksi takdirde gerekli olan AC-DC-AC dönüştürme adımlarının çoğundan (varsayılan kayıplarla birlikte) kaçınmak anlamına gelir.
AWS Altyapı Hizmetleri başkan yardımcısı Prasad Kalyanaraman Pazartesi günkü duyuruda, “AWS, dünya çapındaki müşteriler için en performanslı, dayanıklı, güvenli ve sürdürülebilir bulutu oluşturmak için altyapısını durmaksızın yenilemeye devam ediyor” dedi. “Bu veri merkezi yetenekleri, artan enerji verimliliği ve ortaya çıkan iş yükleri için esnek destek ile ileriye doğru atılmış önemli bir adımı temsil ediyor. Ancak daha da heyecan verici olan şey, bunların modüler olacak şekilde tasarlanmış olmaları, böylece sıvı soğutma ve enerji verimliliğine yönelik mevcut altyapımızı üretken yapay zeka uygulamalarına güç verecek ve karbon ayak izimizi azaltacak şekilde iyileştirebiliyoruz.”
AWS, yeni çok modlu soğutma sisteminin ve yükseltilmiş güç dağıtım sisteminin toplamda, kuruluşun “önümüzdeki iki yıl içinde raf güç yoğunluğunda 6 kat, gelecekte ise 3 kat daha fazla artışı desteklemesine” olanak tanıyacağını söylüyor.
Bu bağlamda AWS, kullanılmayan veya az kullanılan güç miktarını azaltmak amacıyla rafları veri merkezinde konumlandırmanın en verimli yolunu tahmin etmek için artık yapay zekayı kullandığını da belirtiyor. AWS ayrıca veri merkezindeki elektrikli ve mekanik cihazlarında, gerçek zamanlı teşhis ve sorun giderme için yerleşik telemetri hizmetleriyle birlikte gelecek kendi kontrol sistemini de kullanıma sunacak.
Nvidia hiper ölçek ve HPC başkan yardımcısı Ian Buck, “Veri merkezleri yapay zekanın dönüştürücü taleplerini karşılayacak şekilde gelişmelidir” dedi. “Gelişmiş sıvı soğutma çözümleri etkinleştirilerek yapay zeka altyapısı, enerji kullanımı en aza indirilirken verimli bir şekilde soğutulabilir. Sıvı soğutma rafı tasarımı konusunda AWS ile yaptığımız çalışmalar, müşterilerin zorlu yapay zeka iş yüklerini olağanüstü performans ve verimlilikle çalıştırmasına olanak tanıyacak.”
Kaynak: https://techcrunch.com/2024/12/02/aws-bets-on-liquid-cooling-for-its-ai-servers/