Reddit AMA’da OpenAI CEO’su Sam Altman, bilgi işlem kapasitesi eksikliğinin şirketin ürünleri istediği sıklıkta göndermesini engelleyen önemli bir faktör olduğunu itiraf etti.
OpenAI’nin bir sonraki yapay zeka modellerinin neden bu kadar uzun sürdüğüne ilişkin bir soruya yanıt olarak “Bu modellerin tümü oldukça karmaşık hale geldi” diye yazdı. “Ayrıca bilgi işlem gücümüzü birçok harika fikre ayırmamız konusunda birçok sınırlamayla ve zor kararlarla karşı karşıya kalıyoruz.”
Birçok rapor, OpenAI’nin üretken modellerini çalıştırmak ve eğitmek için yeterli bilgi işlem altyapısını güvence altına almakta zorlandığını öne sürüyor. Daha bu hafta Reuters, kaynaklara atıfta bulunarak OpenAI’nin aylardır Broadcom ile birlikte çalışan modeller için 2026 gibi kısa bir sürede gelebilecek bir AI çipi oluşturmak için çalıştığını söyledi.
Kısmen kısıtlı kapasitenin bir sonucu olarak Altman, OpenAI’nin ChatGPT için gerçekçi ses veren konuşma özelliği olan Gelişmiş Ses Modunun yakın zamanda Nisan ayında ilk kez tanıtılacak görüş yeteneklerine sahip olmayacağını söyledi. Nisan ayı basın etkinliğinde OpenAI, ChatGPT uygulamasının bir akıllı telefonda çalıştığını ve telefonun kamerasının görüş alanında birinin giydiği kıyafetler gibi görsel ipuçlarına yanıt verdiğini gösterdi.
Daha sonra Fortune’dan gelen bir rapor, demonun dikkatleri aynı hafta gerçekleşen Google’ın I/O geliştirici konferansından uzaklaştırmak için aceleye getirildiğini ortaya çıkardı. OpenAI içindeki pek çok kişi GPT-4o’nun tanıtılmaya hazır olduğunu düşünmüyordu; açıkçası Gelişmiş Ses Modunun yalnızca ses sürümü aylarca ertelenmişti.
AMA’da Altman, OpenAI’nin görüntü oluşturucusunun bir sonraki büyük sürümü olan DALL-E’nin lansman zaman çizelgesinin olmadığını belirtti. (“Henüz bir yayın planımız yok” dedi.) Bu arada OpenAI’nin video oluşturma aracı Sora, “modeli mükemmelleştirme, güvenlik/kimliğe bürünme/diğer şeyleri doğru yapma ihtiyacı ve AMA’ya da katılan OpenAI’nin baş ürün sorumlusu Kevin Weil, “ölçekli hesaplama” diye yazdı.
Sora’nın Luma, Runway ve diğer rakip sistemlere karşı kendisini zayıf konumlandıran teknik aksaklıklar yaşadığı bildirildi. The Information’a göre, Şubat ayında ortaya çıkan orijinal sistem, 1 dakikalık bir video klip oluşturmak için 10 dakikadan fazla işlem süresi gerektirdi.
Ekim ayında Sora’nın yardımcı liderlerinden biri olan Tim Brooks Google’a gitti.
Daha sonra AMA’da Altman, OpenAI’nin “bir gün” ChatGPT’de “NSFW” içeriğine izin vermeyi düşündüğünü (“yetişkin kullanıcılara yetişkinler gibi davranılması gerektiğine tamamen inanıyoruz” diye yazdı) ve şirketin en büyük önceliğinin o1 serisini geliştirmek olduğunu söyledi. “Akıl yürütme” modelleri ve onların ardılları. OpenAI, bu hafta Londra’daki DevDay konferansında görüntü anlama da dahil olmak üzere bir dizi özelliğin önizlemesini yaptı.
Altman, “Bu yılın sonlarında çok iyi yayınlarımız olacak” diye yazdı. “Ama GPT-5 diyeceğimiz bir şey yok.”
Kaynak: https://techcrunch.com/2024/10/31/openai-ceo-sam-altman-says-lack-of-compute-is-delaying-the-companys-products/