Google, Gemini’nin tarihsel görüntü çeşitliliği sorununu birkaç hafta içinde çözeceğinden umutlu

DeepMind’ın kurucusu Demis Hassabis’e göre Google, çok modlu üretken yapay zeka aracı Gemini’nin insanları tasvir etme yeteneğini yakında “duraklatabileceğinden” umutlu. Bugün, insan görüntülerine yönelik istemlere yanıt verme yeteneğinin “önümüzdeki birkaç hafta” içinde tekrar çevrimiçi olması gerektiğini söyledi.

Google, kullanıcıların aracın ABD’nin kurucu babalarını yalnızca beyaz adamlardan ziyade bir çeşitlilik grubu veya insanlar olarak tasvir etmek gibi tarihsel olarak uyumsuz görüntüler ürettiğini belirtmesinin ardından geçen hafta Gemini özelliğini askıya aldı.

Hassabis, bugün Barselona’daki Mobil Dünya Kongresi’nde sahnede yapılan bir röportaj sırasında ürün snafu’su hakkındaki soruları yanıtladı.

Moderatör Wired’dan Steven Levy’den görüntü oluşturma özelliğinde neyin yanlış gittiğini açıklaması istenen Hassabis, ayrıntılı bir teknik açıklama yapmaktan kaçındı. Bunun yerine, sorunun Google’ın, kullanıcıların temelde “evrensel tasvir” olarak tanımladığı şeyin peşinde olduğu durumları tespit edememesinden kaynaklandığını öne sürdü. Örneğin, “gelişmiş yapay zeka ile gelen nüanslara” işaret ettiğini de belirtti.

“Bu hepimizin uğraştığı bir alan. Yani, örneğin, bana hastanede köpeğini gezdiren bir kişinin veya bir hemşirenin resmini vermenizi isteyen bir bilgi istemi koyarsanız, öyle değil mi, bu durumlarda, açıkça bir tür ‘evrensel tasvir’ istiyorsunuz. Özellikle Google olarak 200’den fazla ülkeye, yani dünya çapındaki her ülkeye hizmet verdiğimizi düşünürsek, kullanıcıların nereden geldiğini, geçmişlerinin ne olacağını veya hangi bağlamda olduklarını bilmiyorsunuz. orada çok çeşitli evrensel olasılıklar yelpazesini göstermek istiyorsunuz.

Hassabis, sorunun Gemini’nin görüntü çıktılarında çeşitliliği teşvik etmek için “iyi niyetli bir özelliğe” indirgendiğini ve bunun “hepsi boyunca çok açık bir şekilde” uygulandığını söyledi.

Tarihsel kişilerle ilgili içerik isteyen istemlerin “elbette” “geri verdiğiniz çok daha dar bir dağılımla” sonuçlanması gerektiğini ekledi ve Gemini’nin gelecekte insanlara yönelik istemlerle nasıl başa çıkabileceğini ima etti.

“Elbette tarihsel doğruluğu önemsiyoruz. Bu yüzden sorunu düzeltirken bu özelliği de çevrimdışına aldık ve biliyorsunuz, çok kısa bir süre sonra onu tekrar çevrimiçi hale getirmeyi umuyoruz. Önümüzdeki birkaç hafta, önümüzdeki birkaç hafta.”

Üretken yapay zeka araçlarının, propaganda yaymak isteyen otoriter rejimler gibi kötü aktörler tarafından kötüye kullanılmasının nasıl önleneceğine ilişkin bir soruya yanıt veren Hassabis’in basit bir cevabı yoktu. Sorunun “çok karmaşık” olduğunu öne sürdü; muhtemelen tüm toplumun harekete geçmesini ve sınırların belirlenmesi ve uygulanmasına yönelik tepki verilmesini gerektiriyor.

“Sadece teknoloji şirketleriyle değil, sivil toplum ve hükümetlerle de yapılması gereken gerçekten önemli araştırma ve tartışmalar var. Bu, herkesi etkileyen sosyal teknik bir sorudur ve herkesin bu konuyu tartışmaya dahil etmesi gerekir. Bu sistemlerin hangi değerlere sahip olmasını istiyoruz? Neyi temsil edeceklerdi? Kötü aktörlerin aynı teknolojilere erişmesini ve bahsettiğiniz şey, onların bu sistemlerin yaratıcıları tarafından amaçlanmayan zararlı amaçlara yönelik olarak yeniden kullanılmasını nasıl önlersiniz?

Google’ın da sunduğu açık kaynaklı genel amaçlı yapay zeka modellerinin zorluğuna değinerek şunları ekledi: “Müşteriler, tamamen kontrol edebilecekleri açık kaynak sistemleri kullanmak istiyor… Ancak sonra soru şu: İnsanların alt akışta kullandıklarının, ‘ Giderek güçlendikçe bu sistemler zararlı olmayacak mı?

“Sanırım bugün bu bir sorun değil çünkü sistemler hala nispeten yeni oluşuyor. Ancak üç, dört ya da beş yıl ileri sararsanız ve planlama yetenekleri olan, dünya çapında hareket edebilen, sorunları ve hedefleri çözebilen yeni nesil sistemlerden bahsetmeye başlarsanız, bence toplumun bu konular hakkında gerçekten ciddi bir şekilde düşünmesi gerektiğini düşünüyorum. bu çoğalırsa ne olur ve bireylerden haydut devletlere kadar kötü aktörler de bunlardan faydalanabilir.”

Röportaj sırasında Hassabis’e yapay zeka cihazları ve üretken yapay zekanın burada yeni gelişmeler yaratmaya devam etmesi nedeniyle mobil pazarın nereye gidebileceği hakkındaki düşünceleri de soruldu. Önceki yapay zeka asistan nesillerinin “dikkat çekici” şeylerinden ziyade, insanların günlük yaşamlarında faydalı olan ve insanların kendi üzerlerine koymayı seçtikleri mobil donanımı yeniden şekillendirebilecek bir “yeni nesil akıllı asistanlar” dalgası öngördü.

“Doğru cihaz tipinin ne olduğuna dair soruların bile olacağını düşünüyorum” dedi. “Beş yıldan fazla bir süre sonra telefon gerçekten mükemmel bir form faktörüne sahip olacak mı? Yapay zeka sisteminin içinde bulunduğunuz bağlamın bir kısmını görebilmesi ve böylece günlük yaşamınızda daha da yardımcı olabilmesi için belki gözlüklere veya başka şeylere ihtiyacımız var. Bu yüzden icat edilecek her türlü harika şey olduğunu düşünüyorum.

Kaynak: https://techcrunch.com/2024/02/26/google-hopeful-of-fix-for-geminis-historical-image-diversity-issue-within-weeks/