Amazon’un bulut bilişim işletmesi AWS, şirketlerin özel üretken yapay zeka modellerini barındırdığı ve ince ayar yaptığı ilk adres olmak istiyor.
AWS bugün, AWS’nin kurumsal odaklı üretken yapay zeka hizmetleri paketi Bedrock’ta yer alan ve kuruluşların şirket içi üretken yapay zeka modellerini tam olarak yönetilen API’ler olarak içe aktarmasına ve bunlara erişmesine olanak tanıyan yeni bir özellik olan Özel Model İçe Aktarımı’nın (önizlemede) lansmanını duyurdu. .
Şirketlerin tescilli modelleri, içe aktarıldıktan sonra Bedrock’un kütüphanesindeki diğer üretken yapay zeka modelleriyle aynı altyapıdan yararlanır (örn. Meta’nın Llama 3’ü, Anthropic’in Claude 3’ü), bilgilerini genişletmeye, bunlara ince ayar yapmaya ve önyargılarını hafifletmek için güvenlik önlemleri uygulamaya yönelik araçlar dahil .
AWS’nin üretken yapay zekadan sorumlu başkan yardımcısı Vasi Philomin, bir röportajda TechCrunch’a şunları söyledi: “Bedrock dışında diğer araçları kullanarak ince ayar yapan veya kendi modellerini oluşturan AWS müşterileri oldu.” “Bu Özel Model İçe Aktarma özelliği, kendi özel modellerini Bedrock’a getirmelerine ve bunları halihazırda Bedrock’ta bulunan tüm diğer modellerin hemen yanında görmelerine ve bunları halihazırda Bedrock’ta bulunan tüm iş akışlarıyla kullanmalarına olanak tanıyor. .”
Özel modelleri içe aktarma
Intel’in yapay zeka odaklı alt kuruluşu Cnvrg’nin yakın zamanda yaptığı bir ankete göre işletmelerin çoğunluğu, kendi modellerini oluşturarak ve bunları uygulamalarına göre geliştirerek üretken yapay zekaya yaklaşıyor. Ankete göre aynı şirketler, bulut bilgi işlem altyapısı da dahil olmak üzere altyapıyı dağıtım önündeki en büyük engel olarak gördüklerini söylüyor.
Özel Model İçe Aktarma ile AWS, bulut rakiplerine ayak uydururken ihtiyacı hızla karşılamayı hedefliyor. (Amazon CEO’su Andy Jassy, hissedarlara yazdığı son yıllık mektubunda bunun habercisiydi.)
Google’ın Bedrock benzeri Vertex AI, bir süredir müşterilerin üretken AI modellerini yüklemesine, bunları uyarlamasına ve API’ler aracılığıyla sunmasına olanak tanıyor. Databricks de, yakın zamanda piyasaya sürülen kendi DBRX’i de dahil olmak üzere, özel modelleri barındırmak ve ayarlamak için uzun süredir araç setleri sağlıyor.
Özel Model İçe Aktarmayı farklı kılan şeyin ne olduğu sorulduğunda Philomin, bunun ve buna bağlı olarak Bedrock’un rakiplerinden daha geniş kapsamlı ve derinlikli model özelleştirme seçenekleri sunduğunu ileri sürdü ve bugün “onbinlerce” müşterinin Bedrock’u kullandığını ekledi.
Philomin, “Birincisi, Bedrock müşterilere hizmet modelleriyle başa çıkmaları için çeşitli yollar sunuyor” dedi. “İkincisi, bu modeller etrafında bir sürü iş akışımız var – ve şimdi müşterilerin kutusu Halihazırda mevcut olan tüm diğer modellerin hemen yanında durun. Çoğu insanın bu konuda hoşuna giden en önemli şey, aynı iş akışlarını kullanarak birden fazla farklı model üzerinde denemeler yapabilme ve daha sonra bunları aslında aynı yerden üretime alabilme yeteneğidir.”
Peki, bahsedilen model özelleştirme seçenekleri nelerdir?
Philomin, Bedrock kullanıcılarının nefret söylemi, şiddet ve özel kişisel veya kurumsal bilgiler gibi şeyler için model çıktılarını filtrelemek veya en azından filtrelemeye çalışmak için eşikleri yapılandırmasına olanak tanıyan Guardrails’e işaret ediyor. (Generatif yapay zeka modelleri, hassas bilgilerin sızdırılması da dahil olmak üzere sorunlu yollardan kontrolden çıkmalarıyla ünlüdür; AWS’ler de istisna değildi.) Ayrıca müşterilerin bir veya daha fazla modelin ne kadar iyi olduğunu test etmek için kullanabileceği bir Temel Taş aracı olan Model Değerlendirme’yi de vurguladı. Belirli bir dizi kritere göre performans sergileyin.
Hem Korkuluklar hem de Model Değerlendirmesi, birkaç ay süren bir önizlemenin ardından artık genel kullanıma sunuldu.
Özel Model İçe Aktarma’nın şu anda yalnızca üç model mimarisini (Hugging Face’in Flan-T5, Meta’nın Llama ve Mistral modelleri) desteklediğini ve Microsoft’un Azure’daki AI geliştirme araçları da dahil olmak üzere Vertex AI ve diğer Bedrock’a rakip hizmetlerin, az çok karşılaştırılabilir güvenlik ve değerlendirme özellikleri sunar (bkz. Azure AI İçerik Güvenliği, Vertex’te model değerlendirmesi vb.).
Ne dır-dir Ancak Bedrock’a özgü olan, AWS’nin Titan üretken yapay zeka modelleri ailesidir. Ve – Özel Model İçe Aktarımı’nın piyasaya sürülmesiyle aynı zamana denk gelen – bu cephede birkaç dikkate değer gelişme var.
Yükseltilmiş Titan modelleri
AWS’nin metinden resme modeli olan Titan Image Generator, geçtiğimiz Kasım ayında önizleme olarak piyasaya sürüldükten sonra artık genel kullanıma sunuldu. Daha önce olduğu gibi, Titan Image Generator, metin açıklaması verilen yeni görüntüler oluşturabilir veya mevcut görüntüleri özelleştirebilir; örneğin, görüntüdeki nesneleri korurken görüntü arka planını değiştirebilir.
Philomin, önizleme sürümüyle karşılaştırıldığında, GA’daki Titan Image Generator’ın ayrıntılara girmeden daha fazla “yaratıcılığa sahip görüntüler oluşturabildiğini” söyledi. (Bunun ne anlama geldiğine dair tahmininiz benimki kadar iyidir.)
Philomin’e Titan Image Generator’ın nasıl eğitildiğine dair paylaşabileceği daha fazla ayrıntı olup olmadığını sordum.
Modelin geçtiğimiz Kasım ayındaki ilk çıkışında AWS, Titan Image Generator’ın eğitiminde tam olarak hangi verileri kullandığı konusunda belirsizdi. Çok az satıcı bu tür bilgileri kolayca açıklar; Antrenman verilerini rekabet avantajı olarak görüyorlar ve bu nedenle onu ve onunla ilgili bilgileri sandıklarına yakın tutuyorlar.
Eğitim verilerinin ayrıntıları aynı zamanda fikri mülkiyetle ilgili davaların da potansiyel bir kaynağıdır; bu da pek çok şeyin ortaya çıkmasını engelleyen başka bir engeldir. Mahkemelerde görülen bazı davalar, satıcıların adil kullanım savunmalarını reddederek, metinden resme araçlarının, sanatçıların açık izni olmadan sanatçıların stillerini kopyaladığını ve kullanıcıların, sanatçıların herhangi bir ödeme almadığı, sanatçıların orijinallerine benzeyen yeni çalışmalar üretmesine izin verdiğini ileri sürüyor. .
Philomin bana yalnızca AWS’nin birinci taraf ve lisanslı verilerin bir kombinasyonunu kullandığını söyledi.
“Tescilli veri kaynaklarının bir kombinasyonuna sahibiz, ancak aynı zamanda birçok veriyi de lisanslıyoruz” dedi. “Aslında telif hakkı sahiplerine verilerini kullanabilmek için lisans ücreti ödüyoruz ve bunların birçoğuyla sözleşmelerimiz var.”
Kasım ayına göre daha ayrıntılı. Ancak Philomin’in cevabının herkesi, özellikle de üretken yapay zeka modeli eğitimi söz konusu olduğunda daha fazla şeffaflığı savunan içerik yaratıcılarını ve yapay zeka etik uzmanlarını tatmin etmeyeceğini hissediyorum.
AWS, şeffaflık yerine, Titan Image Generator gibi bir Titan modelinin potansiyel olarak telif hakkıyla korunan bir eğitim örneğini yeniden ortaya çıkarması (yani kopyasının bir kopyasını çıkarması) durumunda müşterileri kapsayan bir tazminat politikası sunmaya devam edeceğini söylüyor. (Microsoft ve Google dahil birçok rakip, kendi görüntü oluşturma modellerini kapsayan benzer politikalar sunuyor.)
AWS, başka bir acil etik tehdidi (deepfake) ele almak için Titan Image Generator ile oluşturulan görüntülerin, önizleme sırasında olduğu gibi, “kurcalamaya dayanıklı” görünmez bir filigranla geleceğini söylüyor. Philomin, GA sürümünde filigranın sıkıştırmaya ve diğer görüntü düzenlemelerine ve manipülasyonlarına karşı daha dayanıklı hale getirildiğini söylüyor.
Daha az tartışmalı bir alana geçerek Philomin’e, teknolojiye duyulan heyecan (ve yatırım) göz önüne alındığında, Google, OpenAI ve diğerleri gibi AWS’nin video oluşturmayı araştırıp keşfetmediğini sordum. Philomin bunu söylemedi AWS değildi… ama bundan daha fazlasını ima etmedi.
Philomin, “Açıkçası sürekli olarak müşterilerin hangi yeni yeteneklere sahip olmak istediğini görmeye çalışıyoruz ve müşterilerle yaptığımız görüşmelerde video oluşturma konusu kesinlikle gündeme geliyor” dedi. “Sizden bizi takip etmenizi rica edeceğim.”
Titan ile ilgili son bir haberde AWS, Titan Embeddings modelinin ikinci nesli olan Titan Text Embeddings V2’yi piyasaya sürdü. Titan Text Embeddings V2, arama ve kişiselleştirme uygulamalarını güçlendirmek için metni, yerleştirme adı verilen sayısal gösterimlere dönüştürür. İlk nesil Embeddings modeli de aynısını yaptı; ancak AWS, Titan Text Embeddings V2’nin genel olarak daha verimli, uygun maliyetli ve doğru olduğunu iddia ediyor.
“Embeddings V2 modelinin yaptığı şey, genel depolama alanını azaltmaktır [necessary to use the model] Philomin, doğruluğun %97’sini korurken dört kata kadar artırdığını ve “karşılaştırılabilir diğer modellerden daha iyi performans gösterdiğini” iddia etti.
Gerçek dünyadaki testlerin bunu doğrulayıp desteklemeyeceğini göreceğiz.
Kaynak: https://techcrunch.com/2024/04/23/amazon-wants-to-host-companies-custom-generative-ai-models/