Üretken yapay zeka alanındaki rakiplerini yakalamaya kararlı olan Meta, kendi yapay zeka çalışmalarına milyarlarca dolar harcıyor. Bu milyarların bir kısmı yapay zeka araştırmacılarını işe almaya gidiyor. Ancak donanımın, özellikle de Meta’nın yapay zeka modellerini çalıştıracak ve eğitecek çiplerin geliştirilmesine daha da büyük bir miktar harcanıyor.
Meta, bugün, Intel’in en yeni AI hızlandırıcı donanımını duyurmasından bir gün sonra, çip geliştirme çabalarının en yeni meyvesini açıkladı. Geçen yılın MTIA v1’inin devamı olan ve “yeni nesil” Meta Eğitim ve Çıkarım Hızlandırıcısı (MTIA) olarak adlandırılan çip, Meta’nın mülklerinde (örneğin Facebook) görüntülü reklamların sıralanması ve önerilmesi de dahil olmak üzere modelleri çalıştırıyor.
7 nm’lik bir süreç üzerine inşa edilen MTIA v1 ile karşılaştırıldığında yeni nesil MTIA 5 nm’dir. (Çip üretiminde “süreç”, çip üzerinde oluşturulabilecek en küçük bileşenin boyutunu ifade eder.) Yeni nesil MTIA, önceki modele göre daha fazla işlem çekirdeğiyle dolu, fiziksel olarak daha büyük bir tasarımdır. Daha fazla güç tüketirken (25W’a karşı 90W) aynı zamanda daha fazla dahili belleğe sahiptir (64MB’a karşı 128MB) ve daha yüksek bir ortalama saat hızında çalışır (800MHz’den 1,35GHz’e kadar).
Meta, yeni nesil MTIA’nın şu anda 16 veri merkezi bölgesinde çalıştığını ve MTIA v1’e kıyasla 3 kata kadar daha iyi genel performans sunduğunu söylüyor. Eğer bu “3x” iddiası biraz belirsiz geliyorsa, yanılmıyorsunuz; biz de öyle düşündük. ancak Meta sadece bu rakamın her iki çipte de “dört temel modelin” performansının test edilmesinden geldiğini söyledi.
Meta, TechCrunch ile paylaştığı bir blog yazısında, “Tüm yığını kontrol ettiğimiz için, piyasada bulunan GPU’lara kıyasla daha yüksek verimlilik elde edebiliyoruz” diye yazıyor.
Şirketin devam eden çeşitli üretken yapay zeka girişimlerine ilişkin basın toplantısından sadece 24 saat sonra gelen Meta’nın donanım vitrini, çeşitli nedenlerden dolayı alışılmadık bir durum.
Birincisi, Meta blog yazısında şu anda üretken yapay zeka eğitimi iş yükleri için yeni nesil MTIA’yı kullanmadığını açıklıyor, ancak şirket bunu araştıran “birkaç programın devam ettiğini” iddia ediyor. İkincisi, Meta, yeni nesil MTIA’nın çalıştırma veya eğitim modelleri için GPU’ların yerini almayacağını, bunun yerine onları tamamlayacağını kabul ediyor.
Satır aralarını okuduğunuzda Meta yavaş hareket ediyor; belki de istediğinden daha yavaş.
Meta’nın yapay zeka ekipleri neredeyse kesinlikle maliyetleri düşürme baskısı altında. Şirketin, üretken yapay zeka modellerini eğitmek ve çalıştırmak için GPU’lara 2024 yılı sonuna kadar tahminen 18 milyar dolar harcaması bekleniyor ve son teknoloji üretken modellerin eğitim maliyetleri on milyonlarca dolar arasında değişirken şirket içi donanım, çekici bir alternatif.
Ve Meta’nın donanımı gerilerken, rakipleri öne çıkıyor; bu da Meta’nın liderliğini hayrete düşürecek şekilde, diye düşünüyorum.
Google bu hafta, AI modellerinin eğitimi için beşinci nesil özel çipi TPU v5p’yi genel olarak Google Cloud müşterilerinin kullanımına sundu ve çalışan modeller için ilk özel çipi Axion’u tanıttı. Amazon’un kendi bünyesinde birçok özel AI çip ailesi bulunmaktadır. Microsoft da geçen yıl Azure Maia AI Accelerator ve Azure Cobalt 100 CPU ile mücadeleye dahil oldu.
Blog yazısında Meta, yeni nesil MTIA’nın “ilk silikondan üretim modellerine geçişin” dokuz aydan kısa sürdüğünü ve bu sürenin Google TPU’lar arasındaki tipik aralıktan daha kısa olduğunu söylüyor. Ancak Meta’nın, üçüncü taraf GPU’lardan bir ölçüde bağımsızlık elde etmeyi ve zorlu rekabetine ayak uydurmayı umuyorsa, yapması gereken çok şey var.
Kaynak: https://techcrunch.com/2024/04/10/meta-unveils-its-newest-custom-ai-chip/