‘Açık kaynaklı yapay zeka’ ne anlama geliyor?

Açık kaynak ve özel mülk yazılım arasındaki mücadele iyi anlaşılmıştır. Ancak onlarca yıldır yazılım çevrelerine nüfuz eden gerilimler, sıcak takipteki tartışmalarla birlikte gelişen yapay zeka alanına da karıştı.

New York Times yakın zamanda Meta CEO’su Mark Zuckerberg hakkında coşkulu bir değerlendirme yayınladı ve onun “açık kaynaklı yapay zeka”yı benimsemesinin onu Silikon Vadisi’nde nasıl bir kez daha popüler hale getirdiğine dikkat çekti. Ancak sorun, Meta’nın Llama markalı büyük dil modellerinin gerçekte açık kaynak olmamasıdır.

Yoksa onlar mı?

Çoğu tahmine göre değiller. Ancak “açık kaynaklı yapay zeka” kavramının önümüzdeki yıllarda nasıl daha fazla tartışmaya yol açacağının altını çiziyor. Bu, konferanslar, çalıştaylar, paneller ve web seminerlerini kapsayan küresel bir çabayla iki yıldan fazla bir süredir sorun üzerinde çalışan yönetici direktör Stefano Maffulli (yukarıdaki resimde) liderliğindeki Açık Kaynak Girişiminin (OSI) ele almaya çalıştığı bir şeydir. , raporlar ve daha fazlası.

Yapay zeka yazılım kodu değil

Resim Kredisi: Westend61 Getty aracılığıyla

OSI, çeyrek yüzyıldan fazla bir süredir Açık Kaynak Tanımı’nın (OSD) koruyucusu olmuştur ve “açık kaynak” teriminin yazılıma nasıl uygulanabileceğini veya uygulanması gerektiğini ortaya koymuştur. Bu tanımı karşılayan bir lisans meşru olarak “açık kaynak” olarak kabul edilebilir, ancak aşırı derecede müsamahakâr olandan pek müsamahakar olmayana kadar değişen bir lisans yelpazesini tanır.

Ancak eski lisanslama ve adlandırma kurallarını yazılımdan yapay zekaya aktarmak sorunludur. Açık kaynak müjdecisi ve VC firması OSS Capital’in kurucusu Joseph Jacks, “açık kaynak yapay zeka diye bir şeyin olmadığını” söyleyecek kadar ileri gidiyor ve “açık kaynağın açıkça yazılım kaynak kodu için icat edildiğini” belirtiyor.

Buna karşılık, yapay zeka dünyasında ağın eğitim süreci sırasında öğrendiği parametreleri veya katsayıları tanımlamak için kullanılan bir terim olan “sinir ağı ağırlıkları” (NNW’ler), yazılımla anlamlı bir şekilde karşılaştırılamaz.

“Nöral net ağırlıklar yazılım kaynak kodu değildir; Jacks, bunlar insanlar tarafından okunamıyor ve hata ayıklanamıyor. “Ayrıca, açık kaynağın temel hakları da NNW’lere uyumlu bir şekilde aktarılmıyor.”

Bu, Jacks ve OSS Capital’den meslektaşı Heather Meeker’in “açık ağırlıklar” kavramı etrafında kendi tür tanımlarını bulmalarına yol açtı.

Dolayısıyla, “açık kaynaklı yapay zeka”nın anlamlı bir tanımına bile ulaşmadan önce, oraya ulaşmaya çalışmanın doğasında var olan bazı gerilimleri zaten görebiliyoruz. Tanımladığımız “şeyin” var olduğu konusunda hemfikir olamazsak, bir tanım üzerinde nasıl anlaşabiliriz?

Maffulli de ne olursa olsun aynı fikirde.

TechCrunch’a “Bu doğru,” dedi. “İlk tartışmalarımızdan biri buna açık kaynaklı yapay zeka adını verip vermeyeceğimizdi ama herkes zaten bu terimi kullanıyordu.”

Bu, bugün “Yapay Zeka” dediğimiz şeyin gerçekten yapay zeka mı yoksa sadece geniş veri yığınları arasındaki kalıpları tespit etmek için öğretilen güçlü sistemler mi olduğu konusunda çok sayıda tartışmanın olduğu daha geniş yapay zeka alanındaki bazı zorlukları yansıtıyor. Ancak karşı çıkanlar çoğunlukla “Yapay Zeka” terminolojisinin burada olduğu ve onunla mücadele etmenin bir anlamı olmadığı gerçeğine teslim olmuş durumda.

Resim Kredisi: Larysa Amosova Getty aracılığıyla

1998 yılında kurulan OSI, savunuculuk, eğitim ve onun temel varoluş nedeni olan Açık Kaynak Tanımı etrafında çok sayıda açık kaynakla ilgili faaliyet üzerinde çalışan, kar amacı gütmeyen, kamu yararına çalışan bir kuruluştur. Bugün kuruluş, finansman için Amazon, Google, Microsoft, Cisco, Intel, Salesforce ve Meta gibi saygın üyelerin sponsorluklarına güveniyor.

Meta’nın OSI’ye katılımı şu anda özellikle dikkate değer çünkü bu konu “açık kaynaklı yapay zeka” kavramıyla ilgili. Meta’nın AI şapkasını açık kaynak çivisine asmasına rağmen, şirketin Llama modellerinin nasıl kullanılabileceği konusunda dikkate değer kısıtlamaları var: Elbette, araştırma ve ticari kullanım durumları için ücretsiz olarak kullanılabilirler, ancak 700’den fazla uygulama geliştiricisi var. milyon aylık kullanıcının Meta’dan tamamen kendi takdirine bağlı olarak vereceği özel bir lisans talep etmesi gerekiyor.

Basitçe söylemek gerekirse, Meta’nın Büyük Teknoloji kardeşleri isterlerse ıslık çalabilirler.

Meta’nın LLM’leri etrafındaki dili bir şekilde şekillendirilebilir. Şirket, Llama 2 modelini açık kaynak olarak adlandırsa da, Nisan ayında Llama 3’ün gelişiyle birlikte terminolojiden biraz uzaklaşarak bunun yerine “açık olarak erişilebilir” ve “açık olarak erişilebilir” gibi ifadeler kullandı. Ancak bazı yerlerde modelden hâlâ “açık kaynak” olarak söz ediliyor.

Maffulli, “Sohbette yer alan herkes, Lama’nın kendisinin açık kaynak olarak kabul edilemeyeceği konusunda tamamen hemfikir” dedi. “Meta’da çalışan ve konuştuğum insanlar bunun biraz zor olduğunu biliyorlar.”

Üstelik bazıları burada bir çıkar çatışması olduğunu iddia edebilir: Açık kaynak markalamasından yararlanma arzusu gösteren bir şirket aynı zamanda “tanım”ın yöneticilerine de finansman sağlıyor mu?

Bu, OSI’nin finansmanını çeşitlendirmeye çalışmasının nedenlerinden biri ve yakın zamanda Açık Kaynak Yapay Zeka Tanımına ulaşmak için çok paydaşlı küresel girişimin finansmanına yardımcı olan Sloan Vakfı’ndan bir hibe aldı. TechCrunch, bu hibenin yaklaşık 250.000 ABD doları tutarında olduğunu açıklayabilir ve Maffulli, bunun kurumsal finansmana olan bağımlılığı etrafındaki bakış açısını değiştirebileceğinden umutlu.

Maffulli, “Sloan bağışının daha da netleştirdiği şeylerden biri de bu: Meta’nın parasına her an elveda diyebiliriz” dedi. “Bunu Sloan Grant’ten önce de yapabilirdik çünkü başkalarından bağış alacağımızı biliyorum. Ve Meta bunu çok iyi biliyor. Bunların hiçbirine müdahale etmiyorlar [process]Microsoft, GitHub, Amazon veya Google da öyle; kesinlikle müdahale edemeyeceklerini biliyorlar çünkü organizasyonun yapısı buna izin vermiyor.”

Açık kaynak yapay zekanın çalışma tanımı

Resim Kredisi: Aleksey Morozov / Getty Images

Mevcut Açık Kaynak Yapay Zeka Tanımı taslağı 0.0.8 sürümünde yer almakta olup üç temel bölümden oluşmaktadır: belgenin kapsamını belirleyen “giriş”; Açık Kaynak Yapay Zeka Tanımının kendisi; ve açık kaynak uyumlu bir yapay zeka sistemi için gereken bileşenlerin üzerinden geçen bir kontrol listesi.

Mevcut taslağa göre, Açık Kaynak Yapay Zeka sistemi, sistemi herhangi bir amaç için izin almadan kullanma özgürlüğü vermelidir; başkalarının sistemin nasıl çalıştığını incelemesine ve bileşenlerini incelemesine izin vermek; ve herhangi bir amaçla sistemi değiştirmek ve paylaşmak.

Ancak en büyük zorluklardan biri verilerle ilgiliydi; yani, şirket eğitim veri setini başkalarının incelemesine sunmadıysa bir yapay zeka sistemi “açık kaynak” olarak sınıflandırılabilir mi? Maffulli’ye göre verilerin nereden geldiğini ve geliştiricinin verileri nasıl etiketlediğini, tekilleştirdiğini ve filtrelediğini bilmek daha önemli. Ayrıca, veri kümesini çeşitli kaynaklardan bir araya getirmek için kullanılan koda erişime sahip olmak.

Maffulli, “Bu bilgiyi bilmek, geri kalanı olmadan sade bir veri kümesine sahip olmaktan çok daha iyidir” dedi.

Veri setinin tamamına erişim güzel olsa da (OSI bunu “isteğe bağlı” bir bileşen haline getiriyor), Maffulli bunun birçok durumda mümkün veya pratik olmadığını söylüyor. Bunun nedeni, veri kümesinde geliştiricinin yeniden dağıtma iznine sahip olmadığı gizli veya telif hakkıyla korunan bilgilerin bulunması olabilir. Dahası, birleşik öğrenme, diferansiyel gizlilik ve homomorfik şifreleme gibi teknikler kullanılarak, verinin aslında sistemle paylaşılmadığı makine öğrenimi modellerini eğitmeye yönelik teknikler vardır.

Bu da “açık kaynak yazılım” ile “açık kaynak yapay zeka” arasındaki temel farkları mükemmel bir şekilde vurguluyor: Amaçlar benzer olabilir, ancak benzerleri karşılaştırılabilir değildir ve OSI’nin kendi raporunda yakalamaya çalıştığı şey de bu eşitsizliktir. tanım.

Yazılımda, kaynak kodu ve ikili kod aynı yapının iki görünümüdür: Aynı programı farklı biçimlerde yansıtırlar. Ancak veri kümelerinin eğitimi ve ardından eğitilen modeller farklı şeylerdir: Aynı veri kümesini alabilirsiniz ve aynı modeli tutarlı bir şekilde yeniden oluşturmanız her zaman mümkün olmayacaktır.

Maffulli, “Eğitim sırasında meydana gelen çeşitli istatistiksel ve rastgele mantıklar vardır, bu da onu yazılımla aynı şekilde tekrarlanabilir hale getiremeyeceği anlamına gelir” diye ekledi.

Bu nedenle, açık kaynaklı bir yapay zeka sisteminin, net talimatlarla çoğaltılması kolay olmalıdır. Yakın zamanda yayınlanan “Model Açıklık Çerçevesi: Yapay Zekada Yeniden Üretilebilirlik, Şeffaflık ve Kullanılabilirlik için Tamlık ve Açıklığın Teşvik Edilmesi” adlı akademik makaleye dayanan Açık Kaynak Yapay Zeka Tanımının kontrol listesi yönü burada devreye giriyor.

Bu makale, makine öğrenimi modellerini “tamlık ve açıklıklarına göre” derecelendiren bir sınıflandırma sistemi olan Model Açıklık Çerçevesini (MOF) önermektedir. MOF, eğitim metodolojileri ve model parametreleriyle ilgili ayrıntılar da dahil olmak üzere, AI modeli geliştirmenin belirli bileşenlerinin “uygun açık lisanslar altında dahil edilmesini ve yayınlanmasını” talep ediyor.

Stabil durum

Stefano Maffulli, Addis Ababa’daki Digital Public Goods Alliance (DPGA) üyeleri zirvesinde sunum yapıyor.
Resim Kredisi: OSI

OSI, tanımın resmi lansmanını, tıpkı bir şirketin prime time öncesinde kapsamlı test ve hata ayıklama sürecinden geçmiş bir uygulamaya yapacağı gibi, “kararlı sürüm” olarak adlandırıyor. OSI bunu kasıtlı olarak “son sürüm” olarak adlandırmıyor çünkü bazı kısımları muhtemelen gelişecek.

Maffulli, “Bu tanımın Açık Kaynak Tanımı gibi 26 yıl sürmesini gerçekten bekleyemeyiz” dedi. “Tanımın üst kısmının ‘Yapay zeka sistemi nedir?’ gibi bir kısmını beklemiyorum. – çok fazla değişmek. Peki kontrol listesinde bahsettiğimiz parçalar, bu bileşen listeleri teknolojiye mi bağlı? Yarın teknolojinin neye benzeyeceğini kim bilebilir?

İstikrarlı Açık Kaynak Yapay Zeka Tanımının, Ekim ayının sonunda yapılacak Her Şey Açık konferansında Kurul tarafından onaylanması bekleniyor; OSI, aradan geçen aylarda, daha fazla “çeşitli girdi” arayarak beş kıtayı kapsayan küresel bir tanıtım gezisine çıkıyor. ileriye dönük olarak “açık kaynaklı yapay zeka”nın nasıl tanımlanacağına dair. Ancak herhangi bir son değişikliğin, burada ve oradaki “küçük ayarlamalardan” biraz daha fazlası olması muhtemeldir.

Maffulli, “Bu son adım” dedi. “Tanımın tam versiyonuna ulaştık; ihtiyacımız olan tüm unsurlara sahibiz. Artık bir kontrol listemiz var ve bu listede herhangi bir sürpriz olup olmadığını kontrol ediyoruz; Dahil edilmesi veya hariç tutulması gereken hiçbir sistem yok.”

Kaynak: https://techcrunch.com/2024/06/22/what-does-open-source-ai-mean-anyway/