Sektör lideri yapay zeka kapsamına ilişkin en son güncellemeler ve özel içerik için günlük ve haftalık bültenlerimize katılın. Daha fazla bilgi edin
Google bazen üretken yapay zeka yarışında Meta, OpenAI, Anthropic ve Mistral gibi rakiplerine yetişmeye çalıştığını düşünüyor ama artık öyle değil.
Bugün şirket diğerlerinin çoğunu geride bıraktı Gemini Live’ın duyurusuGemini mobil uygulaması aracılığıyla AI modeli Gemini için yeni bir ses modu olan bu mod, kullanıcıların modelle sade, konuşma diliyle konuşmasına ve hatta modeli keserek yapay zekanın kendi insani sesi ve temposuyla yanıt vermesini sağlıyor. Veya Google’ın X’teki bir gönderide belirttiği gibi: “Artık serbestçe akan bir görüşme yapabilir ve hatta normal bir telefon görüşmesinde olduğu gibi konuyu kesebilir veya değiştirebilirsiniz.”
Eğer bu size tanıdık geliyorsa, bunun nedeni OpenAI Mayıs ayında ChatGPT için kendi “Gelişmiş Ses Modu”nun tanıtımını yaptı açıkça filmdeki konuşan yapay zeka işletim sistemiyle karşılaştırıldı Osadece özelliği geciktirmek ve başla geçen ayın sonlarında yalnızca alfa katılımcılarına seçici olarak sunuldu.
Gemini Live artık Android cihazlar için Google Gemini uygulamasında İngilizce olarak mevcuttur. Gemini Gelişmiş aboneliği (Aylık 19,99 ABD Doları), iOS sürümü ve önümüzdeki haftalarda daha fazla dil desteği ile birlikte.
Başka bir deyişle: Her ne kadar OpenAI benzer bir özelliği ilk olarak göstermiş olsa da, Google bu özelliği çok daha geniş bir potansiyel kitleye daha erişilebilir hale getirmeye hazırlanıyor (daha fazlası) 3 milyardan fazla aktif kullanıcı Android’de ve 2,2 milyar iOS cihazı) ChatGPT’nin Gelişmiş Ses Modundan çok daha erken.
Yine de OpenAI’nin ChatGPT Gelişmiş Ses Modu’nu geciktirmesinin bir nedeni, kendi dahili “kırmızı ekip çalışması” veya özellikle ses modunun bazen tuhaf, endişe verici ve hatta potansiyel olarak tehlikeli davranışlarda bulunduğunu gösteren kontrollü rakip güvenlik testlerinden kaynaklanıyor olabilir: kullanıcının kendi sesini taklit etme rızası olmadan — dolandırıcılık veya kötü amaçlı amaçlar için kullanılabilir.
Google bu tür teknolojilerin yol açabileceği olası zararları nasıl ele alıyor? Henüz tam olarak bilmiyoruz, ancak VentureBeat sormak için şirkete ulaştı ve geri bildirim aldığımızda güncelleme yapacak.
Gemini Live ne işe yarar?
Google, Gemini Live’ı, beyin fırtınası yapmak, önemli konuşmalara hazırlanmak veya sadece “çeşitli konular” hakkında gelişigüzel sohbet etmek için iyi olan, serbest akışlı, doğal bir sohbet sunan bir ürün olarak tanıtıyor. Gemini Live, gerçek zamanlı olarak yanıt verecek ve uyum sağlayacak şekilde tasarlanmıştır.
Ek olarak, bu özellik eller serbest olarak çalışabiliyor ve kullanıcıların, cihazları kilitliyken veya arka planda başka uygulamalar çalıştırırken bile etkileşimlerine devam etmelerine olanak tanıyor.
Buna ek olarak Google, Gemini AI modelinin artık Android kullanıcı deneyimine tamamen entegre olduğunu ve cihaza özel olarak daha fazla bağlama duyarlı yardım sağladığını duyurdu.
Kullanıcılar, güç düğmesine uzun basarak veya “Hey Google” diyerek Gemini’ye erişebilir. Bu entegrasyon, Gemini’nin ekrandaki içerikle etkileşimde bulunmasına olanak tanır; örneğin bir YouTube videosu hakkında ayrıntılar sağlamak veya bir seyahat vlog’undan doğrudan Google Haritalar’a eklemek üzere bir restoran listesi oluşturmak gibi.
Bir blog yazısında, Sissy HsiaoGemini Experiences ve Google Asistan Başkan Yardımcısı ve Genel Müdürü, yapay zekanın evriminin kişisel asistanın gerçekten yardımcı olmasının ne anlama geldiğinin yeniden tasarlanmasına yol açtığını vurguladı. Bu yeni güncellemelerle Gemini daha sezgisel ve konuşmaya dayalı bir deneyim sunmaya hazırlanıyor ve bu da onu karmaşık görevler için güvenilir bir yardımcı haline getiriyor.
Kaynak: https://venturebeat.com/ai/googles-ai-surprise-gemini-live-speaks-like-a-human-taking-on-chatgpt-advanced-voice-mode/