Reddit, verilerini lisanslayarak şu ana kadar 203 milyon dolar kazandığını açıkladı

Reddit’in borsada listelenmeye doğru ilerleyen beklentileri, OpenAI gibi yapay zeka tedarikçileriyle ilişkilerle beklenenden çok daha fazla ilgili.

Reddit, bugün ABD Menkul Kıymetler ve Borsa Komisyonu’na sunduğu halka arz izahnamesinde, bir milyardan fazla gönderisi ve 16 milyardan fazla gönderisinde yapay zeka modellerini eğiten şirketlerle yapılan veri lisanslama anlaşmalarından ne kadar kazanacağını ve kazandığını düşündüğünü defalarca vurguladı. yorumlar.

İzahnamede, “Ocak 2024’te, toplam sözleşme değeri 203,0 milyon dolar olan ve süreleri iki ila üç yıl arasında değişen belirli veri lisanslama düzenlemelerine girdik” deniyor. “31 Aralık 2024’te sona eren yıl ve sonrasında en az 66,4 milyon dolarlık gelirin muhasebeleştirilmesini bekliyoruz.”

Şu ana kadar hangi yapay zeka sağlayıcılarının Reddit’ten veri lisansı aldığı ise bir muamma. Bu haftanın başlarında Bloomberg ve Reuters, “büyük bir isimsiz yapay zeka şirketinin” – muhtemelen Google’ın – yıllık bazda yaklaşık 60 milyon dolar değerinde bir lisans anlaşması imzaladığını bildirdi. Ancak OpenAI de şaşırtıcı bir müşteri olmazdı, özellikle de OpenAI CEO’su Sam Altman’ın Reddit’te %8,7 hisseye sahip olduğu (onu üçüncü büyük hissedar yapıyor) ve bir zamanlar şirketin yönetim kurulu üyesi olduğu göz önüne alındığında.

Reddit verileri neden değerli? Reddit’in açıkladığı gibi, yapay zeka modelleri örneklerden el sanatları makalelerine, kodlara, e-postalara, makalelere ve daha fazlasına kadar “öğreniyor” ve OpenAI gibi satıcılar eğitim setlerine eklemek için bu örneklerin milyonlarca ila milyarlarcasını web’den sıyırıyor. Bazı örnekler kamu malıdır. Diğerleri ise – Reddit içeriği söz konusu olduğunda – alıntı veya belirli tazminat biçimleri gerektiren kısıtlayıcı lisanslara tabi değildir.

Reddit daha önce AI eğitimi amacıyla verilerine erişimi engellemiyordu. Ancak geçen yıl, CEO Steve Huffman’ın sözleriyle, verilerinin böyle olmaması gerektiğini savunarak rotayı tersine çevirdi.[given] dünyanın en büyük şirketlerinden bazılarına ücretsiz olarak.”

“[Our] veri API’leri spor, filmler, haberler, moda ve en son trendler gibi gelişen ve dinamik konulara gerçek zamanlı erişim sağlayabiliyor,” diye devam ediyor izahname. “Reddit’in devasa konuşma veri ve bilgi birikiminin, büyük dil modellerinin eğitiminde ve geliştirilmesinde rol oynamaya devam edeceğine inanıyoruz. İçeriğimiz her geçen gün yenilenip büyüdükçe modellerin bu yeni fikirleri yansıtmak ve Reddit verilerini kullanarak eğitimlerini güncellemek isteyeceğini düşünüyoruz.”

Hazır medya kitaplıklarından haber yayıncılarına kadar içerik üreticileri, OpenAI’nin ChatGPT’si ve Google’ın Gemini’si gibi sohbet robotlarının trafiği sekteye uğratmakla tehdit etmesi nedeniyle yapay zeka satıcılarıyla veri lisanslama anlaşmalarına giderek daha fazla yöneliyor. The Atlantic’in yeni bir modeli, Google gibi bir arama motorunun yapay zekayı aramaya entegre etmesi halinde, kullanıcının sorgusunu web sitesine tıklamaya gerek kalmadan %75 oranında yanıtlayacağını buldu.

Satıcılar da, modellerini izinsiz veya ödemesiz veriler üzerinde eğitmek için hiçbir yasal gerekçeye sahip olmadıklarını iddia eden çok sayıda davayla karşı karşıya kaldıklarından, lisans anlaşmaları yapmaya teşvik edildi. Son zamanlarda New York Times, OpenAI’yi, onun çalışmalarını kullanarak etkin bir şekilde haber yayıncısı rakipleri oluşturmakla ve işine zarar vermekle suçladı.

OpenAI’nin, resim galerisi Shutterstock’un yanı sıra Politico ve Business Insider’ın sahibi Axel Springer gibi yayıncılarla da anlaşmaları var. Ancak lisansların oldukça küçük olduğu bildiriliyor; yıllık 5 milyon doları buluyor.

Kaynak: https://techcrunch.com/2024/02/22/reddit-says-its-made-203m-so-far-licensing-its-data/