OpenAI, önümüzdeki birkaç hafta içinde şirketin geliştirici ve tüketiciye yönelik ürünlerinde “yinelemeli olarak” kullanıma sunulacak olan, GPT-4o adı verilen yeni bir amiral gemisi üretken yapay zeka modelini piyasaya sürüyor.
OpenAI CTO’su Muri Murati, GPT-4o’nun “GPT-4 düzeyinde” zeka sağladığını ancak GPT-4’ün metin ve görselin yanı sıra ses yeteneklerini de geliştirdiğini söyledi.
OpenAI ofislerinde yapılan açılış sunumu sırasında Murati, “GPT-4o’nun ses, metin ve görüntü ile ilgili nedenleri” dedi. “Ve bu inanılmaz derecede önemli çünkü kendimiz ve makineler arasındaki etkileşimin geleceğine bakıyoruz.”
OpenAI’nin önceki lider modeli olan GPT-4, hem görsellerin hem de metnin bir kombinasyonuyla eğitilmişti ve görsellerden metin çıkarmak ve hatta bu görsellerin içeriğini tanımlamak gibi görevleri gerçekleştirmek için görselleri ve metni analiz edebiliyordu. Ancak GPT-4o bu karışıma konuşmayı da ekliyor.
Bu somut olarak neyi mümkün kılıyor? Çeşitli şeyler.
GPT-4o, ChatGPT deneyimini büyük ölçüde geliştirir; ChatGPT, OpenAI’nin viral yapay zeka destekli sohbet robotudur. ChatGPT uzun süredir, metinden konuşmaya modeli kullanarak ChatGPT’den metni yazıya döken bir ses modu sunuyor. Ancak GPT-4o bunu daha da güçlendirerek kullanıcıların ChatGPT ile daha çok bir asistan gibi etkileşime girmesine olanak tanıyor.
Örneğin, kullanıcılar GPT-4o tarafından desteklenen ChatGPT’ye bir soru sorabilir ve yanıt verirken ChatGPT’yi kesebilir. OpenAI, modelin “gerçek zamanlı” yanıt verme yeteneği sağladığını ve hatta kullanıcının sesindeki duyguyu yakalayıp “farklı duygusal tarzlarda” ses üretebildiğini söylüyor.
GPT-4o, ChatGPT’nin görüş yeteneklerini de geliştirir. Bir fotoğraf veya bir masaüstü ekranı verildiğinde, ChatGPT artık “Bu yazılım kodunda neler oluyor” gibi “Bu kişi hangi marka gömlek giyiyor?” gibi ilgili soruları hızlı bir şekilde yanıtlayabiliyor.
Diğer yandan OpenAI, ChatGPT’nin masaüstü sürümünü ve yenilenmiş bir kullanıcı arayüzünü yayınlıyor.
“Biliyoruz ki bu modeller [are getting] giderek daha karmaşık hale geliyor, ancak etkileşim deneyiminin aslında daha doğal, kolay olmasını ve sizin için kullanıcı arayüzüne hiç odaklanmamanızı, sadece işbirliğine odaklanmanızı istiyoruz. [GPTs]”dedi Murti.
Kaynak: https://techcrunch.com/2024/05/13/openais-newest-model-is-gpt-4o/