Yapay zeka laboratuvarları yapay zeka modellerini geliştirme şeklini değiştirirken Nvidia’nın CEO’su hendeğini savunuyor

Şirketin Çarşamba günü bildirdiğine göre, Nvidia son çeyrekte 19 milyar dolardan fazla net gelir elde etti, ancak bu, yatırımcılara hızlı büyümenin devam edeceğine dair güvence vermek için çok az şey yaptı. Analistler, kazanç çağrısında CEO Jensen Huang’a, teknoloji şirketlerinin yapay zeka modellerini geliştirmek için yeni yöntemler kullanmaya başlaması durumunda Nvidia’nın nasıl bir performans sergileyeceği konusunda dürttü.

OpenAI’nin o1 modelini veya “test zamanı ölçeklendirmesini” destekleyen yöntem oldukça fazla gündeme geldi. Bu, onlara sorular üzerinde “düşünmeleri” için daha fazla zaman ve bilgi işlem gücü verirseniz, yapay zeka modellerinin daha iyi yanıtlar vereceği fikridir. Spesifik olarak, yapay zeka çıkarım aşamasına daha fazla bilgi işlem ekler; bu, kullanıcının komut isteminde enter tuşuna basmasından sonra gerçekleşen her şeydir.

Nvidia’nın CEO’suna yapay zeka modeli geliştiricilerinin bu yeni yöntemlere geçiş yapıp yapmadığı ve Nvidia’nın eski çiplerinin yapay zeka çıkarımı için nasıl çalışacağı soruldu.

Huang, yatırımcılara o1 ve daha geniş kapsamlı test zamanı ölçeklendirmesinin Nvidia’nın işinde ilerlemede daha büyük bir rol oynayabileceğini söyledi ve bunu “en heyecan verici gelişmelerden biri” ve “yeni bir ölçeklendirme yasası” olarak nitelendirdi. Huang, yatırımcılara Nvidia’nın değişime uygun bir konumda olduğundan emin olmak için elinden geleni yaptı.

Nvidia CEO’sunun sözleri, Microsoft CEO’su Satya Nadella’nın Salı günü bir Microsoft etkinliğinde sahnede söyledikleriyle uyumluydu: o1, AI endüstrisinin modellerini geliştirmesi için yeni bir yolu temsil ediyor.

Bu çip endüstrisi için büyük bir mesele çünkü yapay zeka çıkarımına daha fazla önem veriyor. Nvidia’nın çipleri yapay zeka modellerinin eğitimi için altın standart olsa da, Groq ve Cerebras gibi ışık hızında yapay zeka çıkarım çipleri üreten, iyi finanse edilen çok sayıda girişim var. Nvidia’nın faaliyet gösterebileceği daha rekabetçi bir alan olabilir.

Üretken modellerdeki gelişmelerin yavaşladığı yönündeki son raporlara rağmen Huang, analistlere yapay zeka model geliştiricilerinin ön eğitim aşamasında daha fazla bilgi işlem ve veri ekleyerek modellerini geliştirmeye devam ettiklerini söyledi.

Anthropic CEO’su Dario Amodei de Çarşamba günü San Francisco’daki Cerebral Valley zirvesinde sahnede yapılan bir röportajda model geliştirmede bir yavaşlama görmediğini söyledi.

Huang Çarşamba günü yaptığı açıklamada, “Temel model ön eğitim ölçeklendirmesi sağlam ve devam ediyor” dedi. “Bildiğiniz gibi bu ampirik bir yasa, temel bir fiziksel yasa değil, ancak bunun ölçeklenmeye devam ettiğine dair kanıtlar var. Ancak öğrendiğimiz şey bunun yeterli olmadığıdır” dedi Huang.

Bu kesinlikle Nvidia yatırımcılarının duymak istediği şeydi, çünkü çip üreticisinin hisseleri OpenAI, Google ve Meta’nın modellerini eğittiği AI çiplerini satarak 2024’te %180’den fazla arttı. Ancak Andreessen Horowtiz ortakları ve diğer bazı yapay zeka yöneticileri daha önce bu yöntemlerin zaten azalan getiriler göstermeye başladığını söylemişti.

Huang, günümüzde Nvidia’nın bilgi işlem iş yüklerinin çoğunun, çıkarım değil, yapay zeka modellerinin ön eğitimi ile ilgili olduğunu belirtti ancak bunu daha çok yapay zeka dünyasının bugünkü durumuna bağladı. Bir gün yapay zeka modellerini çalıştıran daha fazla insan olacağını, bunun da daha fazla yapay zeka çıkarımının gerçekleşeceği anlamına geldiğini söyledi. Huang, Nvidia’nın bugün dünyanın en büyük çıkarım platformu olduğunu ve şirketin ölçeği ve güvenilirliğinin ona startup’lara kıyasla büyük bir avantaj sağladığını belirtti.

Huang, “Umutlarımız ve hayallerimiz, bir gün dünyanın tonlarca çıkarım yapması ve işte o zaman yapay zekanın gerçekten başarılı olması yönünde” dedi. “Herkes, CUDA ve Nvidia mimarisinin üstüne yenilik yaparlarsa daha hızlı yenilik yapabileceklerini ve her şeyin işe yaraması gerektiğini biliyor.”

Kaynak: https://techcrunch.com/2024/11/20/nvidias-ceo-defends-his-moat-as-ai-labs-change-how-they-improve-their-ai-models/