Büyük teknoloji firmalarının çoğu artık bu amaç için amiral gemisi modellerinin eğlenceli boyutlu versiyonlarıyla övünüyor: OpenAI hem GPT-4o hem de GPT-4o mini sunuyor; Google DeepMind’da Gemini Ultra ve Gemini Nano var; ve Anthropic’in Claude 3’ü üç çeşitle geliyor: büyük boy Opus, orta boy Sonnet ve minik Haiku. Microsoft, Phi adı verilen bir dizi küçük dil modeline öncülük ediyor.
Giderek artan sayıda küçük şirket de küçük modeller sunuyor. Yapay zeka startupı Writer, bazı durumlarda yalnızca 20’nci parametreye (eğitim sırasında hesaplanan ve bir modelin nasıl davranacağını belirleyen değerler) sahip olmasına rağmen, en son dil modelinin birçok temel ölçümde en büyük üst düzey modellerin performansıyla eşleştiğini iddia ediyor. .
Tamamını keşfedin 2025 Çığır Açan 10 Teknoloji listesi.
Daha küçük modeller daha verimlidir ve eğitilmelerini ve çalıştırılmalarını daha hızlı hale getirir. Bu, daha uygun fiyatlı bir rampa isteyen herkes için iyi bir haber. Ayrıca iklim için de iyi olabilir: Daha küçük modeller, dev kuzenlerinin ihtiyaç duyduğu bilgisayar gücünün çok küçük bir kısmıyla çalıştığından, daha az enerji harcarlar.
Bu küçük modeller aynı zamanda iyi seyahat eder: Buluta istek göndermeye gerek kalmadan doğrudan cebimizde çalışabilirler. Küçük, bir sonraki büyük şeydir.
Kaynak: https://www.technologyreview.com/2025/01/03/1108800/small-language-models-ai-breakthrough-technologies-2025/
Web sitemizde ziyaretçilerimize daha iyi hizmet sağlayabilmek adına bazı çerezler kullanıyoruz. Web sitemizi kullanmaya devam ederseniz çerezleri kabul etmiş sayılırsınız.
Gizlilik Politikası