Endüstri lideri AI kapsamındaki en son güncellemeler ve özel içerik için günlük ve haftalık bültenlerimize katılın. Daha fazla bilgi edin
Google başlatıldı İkizler 2.5 flaşişletmelere ve geliştiricilere AI’larının ne kadar “düşünce” olduğu konusunda benzeri görülmemiş bir kontrol sağlayan AI serisine büyük bir yükseltme. Bugün önizlemede yayınlanan yeni model Google çalışmak için Ve Tepe noktasıgiderek daha kalabalık AI pazarında rekabetçi fiyatlandırmayı sürdürürken gelişmiş akıl yürütme yetenekleri sağlamak için stratejik bir çabayı temsil eder.
Model, Google’ın dediği şeyi tanıtıyor:düşünme bütçesi” – Geliştiricilerin bir yanıt üretmeden önce karmaşık sorunlar yoluyla akıl yürütmeye ne kadar hesaplama gücünün tahsis edilmesi gerektiğini belirlemelerini sağlayan bir mekanizma. Bu yaklaşım, bugünün AI pazarında temel bir gerginliği ele almayı amaçlamaktadır: daha sofistike akıl yürütme tipik olarak daha yüksek gecikme ve fiyatlandırma pahasına gelir.
Google DeepMind’deki İkizler Modelleri ürün direktörü Tulsee Doshi, “Bir dizi geliştirici kullanım vakası için maliyet ve gecikme konusunu biliyoruz ve bu nedenle geliştiricilere modelin ihtiyaçlarına bağlı olarak yaptığı düşüncenin miktarını uyarlama esnekliği sunmak istiyoruz” dedi.
Bu esneklik, teknoloji, maliyet öngörülebilirliğinin gerekli olduğu iş uygulamalarına giderek daha fazla yerleştikçe Google’ın yapay zeka dağıtımına pragmatik yaklaşımını ortaya koymaktadır. Düşünme yeteneğinin açılmasına veya kapatılmasına izin vererek Google, “ilk tamamen hibrit akıl yürütme modeli” dediği şeyi yarattı.
Yalnızca ihtiyacınız olan beyin gücü için ödeme: Google’ın yeni AI fiyatlandırma modeli içinde
Yeni fiyatlandırma yapısı, günümüz AI sistemlerinde akıl yürütme maliyetini vurgulamaktadır. Kullanırken İkizler 2.5 flaşgeliştiriciler girdi için milyon jeton başına 0,15 $ ödüyorlar. Çıktı maliyetleri, akıl yürütme ayarlarına göre önemli ölçüde farklılık gösterir: Milyon jeton başına 0,60 $, düşünme kapalı, akıl yürütme etkinken milyon jeton başına 3,50 dolara atlayarak.
Akıllı çıktılar için bu yaklaşık altı katlı fiyat farkı, modelin bir yanıt vermeden önce birden fazla potansiyel yolu ve düşünceyi değerlendirdiği “düşünme” sürecinin hesaplama yoğunluğunu yansıtır.
“Müşteriler, modelin ürettiği herhangi bir düşünce ve çıktı jetonu için ödeme yaparlar,” dedi Doshi VentureBeat’e. “AI Studio UX’te bu düşünceleri bir yanıttan önce görebilirsiniz. API’da şu anda düşüncelere erişim sağlamayız, ancak bir geliştirici kaç jetonun üretildiğini görebilir.”
Düşünme bütçesi, sabit bir tahsis yerine maksimum sınır olarak çalışan 0 ila 24.576 jeton arasında ayarlanabilir. Google’a göre, model, bu bütçenin ne kadarının görevin karmaşıklığına göre kullanılacağını akıllıca belirler ve ayrıntılı akıl yürütme gerekmediğinde kaynakları korur.
İkizler 2.5 Flash Nasıl Yıkar: Önde gelen AI modellerine karşı kıyaslama sonuçları
Google Talepleri İkizler 2.5 flaş Alternatiflerden daha küçük bir model boyutunu korurken temel kriterlerde rekabetçi performans gösterir. Açık İnsanlığın Son Sınavıakıl yürütme ve bilgiyi değerlendirmek için tasarlanmış titiz bir test, 2.5 flaş%12.1 puan aldı ve antropiklerden daha iyi performans gösterdi Claude 3.7 sonnet (%8.9) ve Deepseek R1 (%8.6), Openai’nin yakın zamanda piyasaya sürülmesinin yetersiz kalmasına rağmen O4-mini (%14.3).
Model ayrıca teknik kriterlerde güçlü sonuçlar verdi. Gpqa elmas (%78.3) ve Aime Matematik Sınavları (2025 testlerinde% 78.0 ve 2024 testlerinde% 88,0).
Doshi, “Şirketler 2.5 flaş seçmeli çünkü maliyeti ve hızı için en iyi değeri sağlıyor” dedi. “Özellikle matematik, çok modlu akıl yürütme, uzun bağlam ve diğer bazı önemli metriklerdeki rakiplere göre güçlü.”
Endüstri analistleri, bu kriterlerin Google’ın bir fiyatlandırma avantajını korurken, AI bütçelerini izleyen kurumsal müşterilerle rezonansa girebilecek bir strateji olan rakiplerle performans boşluğunu daralttığını gösterdiğini belirtiyor.
Smart vs. Speedy: Yapay zekanızın ne zaman derinlemesine düşünmesi gerekiyor?
Ayarlanabilir akıl yürütmenin tanıtımı, işletmelerin AI’yı nasıl kullanabileceği konusunda önemli bir evrimi temsil etmektedir. Geleneksel modellerle, kullanıcılar modelin iç akıl yürütme sürecinde çok az görünürlüğe sahiptir.
Google’ın yaklaşımı, geliştiricilerin farklı senaryolar için optimize etmelerini sağlar. Dil çevirisi veya temel bilgi alımı gibi basit sorgular için, maksimum maliyet verimliliği için düşünme devre dışı bırakılabilir. Matematiksel problem çözme veya nüanslı analiz gibi çok adımlı akıl yürütme gerektiren karmaşık görevler için düşünme fonksiyonu etkinleştirilebilir ve ince ayarlanabilir.
Önemli bir yenilik, modelin sorguya dayanarak ne kadar gerekçenin uygun olduğunu belirleme yeteneğidir. Google bunu örneklerle gösteriyor: “Kanada kaç illeri var?” Gibi basit bir soru. Minimal akıl yürütme gerektirirken, ışın stresi hesaplamaları hakkında karmaşık bir mühendislik sorusu otomatik olarak daha derin düşünme süreçlerini içerecektir.
Doshi, “Düşünme yeteneklerini ana hat İkiz modellerimize entegre etmek, tahtadaki iyileştirmelerle birlikte daha yüksek kaliteli cevaplara yol açtı” dedi. “Bu gelişmeler akademik kriterlerde doğrudur – olgusallığı ölçen SimpleQA dahil.”
Google’ın AI Haftası: Ücretsiz Öğrenci Erişim ve Video Üretimi 2.5 Flash Lansman’a katılın
Serbest bırakılması İkizler 2.5 flaş AI alanında Google’ın agresif hamleleri sırasında geliyor. Pazartesi günü şirket sunuldu 2 görüyorum İkizler Gelişmiş Abonelerine video oluşturma özellikleri, kullanıcıların metin istemlerinden sekiz saniyelik video klip oluşturmalarını sağlar. Bugün, 2.5 Flash duyuru ile birlikte Google, Tüm ABD üniversite öğrencileri, 2026 baharına kadar Gemini Advanced’e ücretsiz erişim alacak – Analistler tarafından gelecekteki bilgi çalışanları arasında sadakat inşa etme çabası olarak yorumlanan bir hareket.
Bu duyurular, Google’ın Openai’nin chatgpt’in egemen olduğu bir pazarda rekabet etmek için çok yönlü stratejisini yansıtıyor ve bu da Haftalık 800 milyon kullanıcı Gemini’nin tahmini ile karşılaştırıldığında Aylık 250-275 milyon kullanıcıüçüncü taraf analizlerine göre.
Maliyet verimliliği ve performans özelleştirmeye açık bir şekilde odaklanarak 2.5 Flash modeli, özellikle gelişmiş özelliklere erişirken AI dağıtım maliyetlerini dikkatlice yönetmesi gereken kurumsal müşterilere hitap etmek üzere tasarlanmıştır.
Doshi, “Geliştiricilerden Gemini Flash 2.5 ile ne inşa ettikleri ve düşünme bütçelerini nasıl kullandıkları konusunda geri bildirim almaya başlamaktan büyük heyecan duyuyoruz” dedi.
Önizlemenin Ötesinde: Gemini 2.5 flaş olgunlaştıkça işletmeler bekleyebilir
Bu sürüm önizlemede olsa da, Google genel kullanılabilirlik için bir zaman çizelgesi belirtmemesine rağmen, model geliştiricilerin oluşturmaya başlaması için zaten mevcuttur. Şirket, bu önizleme aşamasında geliştirici geri bildirimlerine dayalı dinamik düşünme yeteneklerini geliştirmeye devam edeceğini belirtiyor.
Kurumsal AI benimseyenler için bu sürüm, yapay zeka dağıtımına daha nüanslı yaklaşımları deneme fırsatını temsil eder ve potansiyel olarak rutin uygulamalarda maliyetleri korurken yüksek bahis görevlerine daha fazla hesaplama kaynakları tahsis eder.
Model, tüketiciler için de mevcuttur. İkizler UygulamasıModel açılır menüsünde “2.5 flaş (deneysel)” olarak göründüğü yerlerde, önceki 2.0 düşünme (deneysel) seçeneğinin yerini alıyor. Bu tüketiciye dönük dağıtım, Google’ın akıl yürütme mimarisi hakkında daha geniş geri bildirim toplamak için uygulama ekosistemini kullandığını gösteriyor.
Yapay zeka, iş iş akışlarına giderek daha fazla gömülü hale geldikçe, Google’ın özelleştirilebilir akıl yürütme yaklaşımı, maliyet optimizasyonu ve performans ayarlamasının ham yetenekler kadar önemli hale geldiği olgunlaşan bir pazarı yansıtıyor – üretken AI teknolojilerinin ticarileştirilmesinde yeni bir aşamaya işaret ediyor.
Kaynak: https://venturebeat.com/ai/googles-gemini-2-5-flash-introduces-thinking-budgets-that-cut-ai-costs-by-600-when-turned-down/