Vana, kullanıcıların yapay zekayı eğitmek için Reddit verilerini kiralamasına izin vermeyi planlıyor

üretken olarak Yapay zeka patlaması, veriler yeni petroldür. Peki neden kendinizinkini satamıyorsunuz?

Büyük teknoloji firmalarından yeni kurulan şirketlere kadar yapay zeka üreticileri, daha yetenekli (ve yasal olarak daha savunulabilir) yapay zeka destekli ürünler yetiştirmenin peşinde, e-kitapları, görselleri, videoları, sesleri ve daha fazlasını veri komisyoncularından lisanslıyor. Shutterstock, model eğitimi için milyonlarca görsel sağlamak amacıyla Meta, Google, Amazon ve Apple ile anlaşmalar yaparken, OpenAI de modellerini haber arşivleri üzerinde eğitmek için çeşitli haber kuruluşlarıyla anlaşmalar imzaladı.

Çoğu durumda, bu verinin bireysel yaratıcıları ve sahipleri, paranın bir kuruşunun bile el değiştirdiğini görmediler. Vana adında bir startup bunu değiştirmek istiyor.

MIT Medya Laboratuvarı’nda gelişen pazarlar için teknoloji oluşturmaya odaklanan bir sınıfta tanışan Anna Kazlauskas ve Art Abal, 2021’de Vana’yı kurdular. Kazlauskas, Vana’dan önce MIT’de bilgisayar bilimi ve ekonomi eğitimi aldı ve sonunda bir fintech kurmak üzere ayrıldı. otomasyon başlangıcı, Iambiq, Y Combinator’dan. Eğitim ve öğretimi kurumsal bir avukat olan Abal, veri açıklama şirketi Appen’de etki kaynağına başkanlık etmeden önce Boston merkezli bir danışmanlık firması olan The Cadmus Group’ta ortak olarak çalışıyordu.

Vana ile Kazlauskas ve Abal, kullanıcıların sohbetler, konuşma kayıtları ve fotoğraflar da dahil olmak üzere verilerini daha sonra üretken yapay zeka modeli eğitimi için kullanılabilecek veri kümelerinde “bir araya getirmelerine” olanak tanıyan bir platform oluşturmaya başladı. Ayrıca bu veriler üzerinde genel modellere ince ayar yaparak daha kişiselleştirilmiş deneyimler (örneğin, sağlıklı yaşam hedeflerinize dayalı günlük motive edici sesli posta veya stil tercihlerinizi anlayan sanat üreten bir uygulama) oluşturmak istiyorlar.

Kazlauskas, TechCrunch’a “Vana’nın altyapısı aslında kullanıcıya ait bir veri hazinesi yaratıyor” dedi. “Bunu, kullanıcıların kişisel verilerini gözetimsiz bir şekilde toplamasına olanak tanıyarak yapıyor… Vana, kullanıcıların yapay zeka modellerine sahip olmalarına ve verilerini yapay zeka uygulamalarında kullanmalarına olanak tanıyor.”

Vana, platformunu ve API’sini geliştiricilere şu şekilde sunuyor:

Vana API, uygulamanızı kişiselleştirmenize olanak sağlamak için kullanıcının platformlar arası kişisel verilerini birbirine bağlar. Uygulamanız, kullanıcının kişiselleştirilmiş yapay zeka modeline veya temel verilerine anında erişim sağlayarak, katılımı basitleştirir ve bilgi işlem maliyeti endişelerini ortadan kaldırır… Kullanıcıların kişisel verilerini Instagram, Facebook ve Google gibi duvarlarla çevrili bahçelerden uygulamanıza getirebilmesi gerektiğini düşünüyoruz. Bir kullanıcının tüketici yapay zeka uygulamanızla ilk etkileşime girdiği andan itibaren muhteşem kişiselleştirilmiş deneyim yaratabilirsiniz.

Vana’da hesap oluşturmak oldukça basittir. E-postanızı onayladıktan sonra dijital bir avatara veri ekleyebilir (selfie’ler, kendinizin açıklaması ve ses kayıtları gibi) ve Vana’nın platformu ve veri kümeleri kullanılarak oluşturulan uygulamaları keşfedebilirsiniz. Uygulama seçimi, ChatGPT tarzı sohbet robotlarından ve etkileşimli hikaye kitaplarından Hinge profil oluşturucuya kadar uzanır.

Şimdi, veri gizliliği farkındalığının ve fidye yazılımı saldırılarının arttığı bu çağda, neden birisi kişisel bilgilerini girişim destekli bir girişim şöyle dursun, anonim bir girişime gönüllü olarak verir mi diye sorabilirsiniz. (Vana bugüne kadar Paradigm, Polychain Capital ve diğer destekçilerden 20 milyon dolar topladı.) Kâr odaklı herhangi bir şirketin, eline geçen para kazandırabilir verileri kötüye kullanmayacağına veya yanlış kullanmayacağına gerçekten güvenilebilir mi?

Bu soruya yanıt olarak Kazlauskas, Vana’nın asıl amacının kullanıcıların “verileri üzerindeki kontrolü geri almaları” olduğunu vurguladı ve Vana kullanıcılarının, Vana’nın sunucularında depolamak ve verilerinin nasıl yönetileceğini kontrol etmek yerine verilerini kendileri barındırma seçeneğine sahip olduğunu belirtti. veriler uygulamalar ve geliştiricilerle paylaşılır. Ayrıca, Vana’nın kullanıcılardan aylık abonelik (3,99 dolardan başlayan) talep ederek ve geliştiricilerden (örneğin yapay zeka modeli eğitimi için veri setlerini aktarmak için) bir “veri işlemi” ücreti alarak para kazanması nedeniyle şirketin kullanıcıları istismar etme konusunda caydırıcı olduğunu savundu. yanlarında getirdikleri kişisel veri hazineleri.

Kazlauskas, “Hepsi verileriyle katkıda bulunan, sahip olunan ve yönetilen kullanıcılar modelleri oluşturmak ve kullanıcıların verilerini ve modellerini herhangi bir uygulamaya yanlarında getirmelerine olanak sağlamak istiyoruz” dedi.

Şimdi, bu arada Eskimiş üretken yapay zeka modeli eğitimi için kullanıcıların verilerini şirketlere satmıyor (veya öyle olduğunu iddia ediyor), Reddit gönderilerinden başlayarak kullanıcıların isterlerse bunu kendilerinin yapmalarına izin vermek istiyor.

Bu ay Vana, birden fazla kullanıcının Reddit verilerini (karma ve gönderi geçmişleri dahil) bir araya toplayan ve bu birleşik verilerin nasıl kullanılacağına birlikte karar vermelerine olanak tanıyan bir program olan Reddit Veri DAO’sunu (Dijital Özerk Organizasyon) başlattı. Bir Reddit hesabıyla katıldıktan, verileri için Reddit’e talepte bulunduktan ve bu verileri DAO’ya yükledikten sonra kullanıcılar, birleştirilmiş verilerin ortak kâr için üretken yapay zeka şirketlerine lisanslanması gibi kararlarda DAO’nun diğer üyeleriyle birlikte oy kullanma hakkını elde eder. .

Rakamları inceledik ve r/datadao artık tarihteki en büyük veri DAO’su oldu: Aşama 1, 21.000 tam veri yüklemesiyle 141.000 reddit kullanıcısını ağırladı.

— r/datadao (@rdatadao) 11 Nisan 2024

Bu, Reddit’in platformundaki verileri ticarileştirmeye yönelik son hamlelerine bir tür yanıt.

Reddit daha önce üretken yapay zeka eğitimi amacıyla gönderilere ve topluluklara erişimi kapatmıyordu. Ancak geçen yılın sonlarında halka arz öncesinde rotayı tersine çevirdi. Politika değişikliğinden bu yana Reddit, aralarında Google’ın da bulunduğu şirketlerden 203 milyon doların üzerinde lisans ücreti aldı.

“Geniş fikir [with the DAO is] Kazlauskas, kullanıcı verilerini istiflemeyi ve para kazanmayı amaçlayan büyük platformlardan kurtarmak için “dedi. “Bu bir ilk ve insanların yapay zeka modellerini eğitmek için verilerini kullanıcıya ait veri kümelerinde bir araya getirmelerine yardımcı olma çabamızın bir parçası.”

Vana ile herhangi bir resmi sıfatla çalışmayan Reddit’in DAO’dan memnun olmaması şaşırtıcı değil.

Reddit, Vana’nın DAO hakkındaki tartışmalara ayrılmış alt dizini yasakladı. Ve bir Reddit sözcüsü, Vana’yı, GDPR ve Kaliforniya Tüketici Gizliliği Yasası gibi veri gizliliği düzenlemelerine uyacak şekilde tasarlanan veri dışa aktarma sistemini “istismar etmekle” suçladı.

Sözcü TechCrunch’a şöyle konuştu: “Veri düzenlemelerimiz, kamuya açık bilgiler dahil olmak üzere bu tür varlıklara korkuluklar koymamıza olanak tanıyor.” “Reddit, kamuya açık olmayan kişisel verileri ticari kuruluşlarla paylaşmaz ve Redditçiler, verilerinin bizden dışa aktarılmasını talep ettiğinde, yürürlükteki yasalara uygun olarak, kamuya açık olmayan kişisel verileri bizden geri alırlar. Reddit ve denetlenen kuruluşlar arasında açık şartlar ve sorumluluklar içeren doğrudan ortaklıklar vardır ve bu ortaklıklar ve anlaşmalar, insanların verilerinin kötüye kullanılmasını ve kötüye kullanılmasını önler.

Peki Reddit’in endişelenmek için gerçek bir nedeni var mı?

Kazlauskas, DAO’nun Reddit’in verileri için müşterilerden talep edebileceği tutarı etkileyecek noktaya kadar büyüyeceğini öngörüyor. Bunun gerçekleşeceğini varsayarsak, bu çok uzak bir ihtimal; DAO’nun 141.000’den biraz fazla üyesi var; bu, Reddit’in 73 milyonluk güçlü kullanıcı tabanının çok küçük bir kısmı. Ve bu üyelerden bazıları botlar veya kopya hesaplar olabilir.

Bir de DAO’nun veri alıcılarından alabileceği ödemelerin adil bir şekilde nasıl dağıtılacağı meselesi var.

Şu anda DAO, Reddit karmalarına karşılık gelen kullanıcılara “jetonlar” (kripto para birimi) veriyor. Ancak karma, veri setine yapılan kaliteli katkıların en iyi ölçüsü olmayabilir; özellikle de karma kazanma fırsatlarının daha az olduğu daha küçük Reddit topluluklarında.

Kazlauskas, DAO üyelerinin platformlar arası ve demografik verilerini paylaşmayı seçebilecekleri fikrini ortaya atıyor, bu da DAO’yu potansiyel olarak daha değerli hale getiriyor ve kaydolmaları teşvik ediyor. Ancak bu aynı zamanda kullanıcıların hassas verilerinin sorumlu bir şekilde ele alınması konusunda Vana’ya daha fazla güvenmelerini de gerektirecektir.

Şahsen Vana’nın DAO’sunun kritik kütleye ulaştığını düşünmüyorum. Yolda duran barikatlar çok fazla. Ancak bunun, üretken yapay zeka modellerini eğitmek için giderek daha fazla kullanılan veriler üzerinde kontrol sağlamaya yönelik tabandan gelen son girişim olmayacağını düşünüyorum.

Spawning gibi start-up’lar, içerik oluşturucuların, verilerinin eğitim için nasıl kullanılacağını yönlendiren kurallar koymalarına izin vermenin yolları üzerinde çalışırken, Getty Images, Shutterstock ve Adobe gibi sağlayıcılar da tazminat planları denemeye devam ediyor. Ama henüz kimse şifreyi kıramadı. Hatta yapabilir mi olmak çatlamış mı? Üretken yapay zeka endüstrisinin acımasız doğası göz önüne alındığında, bu kesinlikle zor bir iş. Ancak belki birileri bir yol bulacaktır ya da politika yapıcılar bunu zorlayacaktır.

Kaynak: https://techcrunch.com/2024/04/13/vana-plans-to-let-users-rent-out-their-reddit-data-to-train-ai/

Yorum yap

Vana, kullanıcıların yapay zekayı eğitmek için Reddit verilerini kiralamasına izin vermeyi planlıyor

İlgili haberler: