Google, geliştiricilerin üretken yapay zeka modelleri tarafından yazılan metinlere filigran eklemesine ve metni tespit etmesine olanak tanıyan SynthID Text teknolojisini genel kullanıma sunuyor.
SynthID Metni, AI platformu Hugging Face’ten ve Google’ın güncellenmiş Responsible GenAI Araç Kitinden indirilebilir.
Şirket, X’teki bir gönderide “SynthID Metin filigranlama aracımızı açık kaynak olarak kullanıyoruz” diye yazdı. “Geliştiricilere ve işletmelere ücretsiz olarak sunulan bu araç, yapay zeka tarafından oluşturulan içerikleri tanımlamalarına yardımcı olacak.”
Peki SynthID Text tam olarak nasıl çalışıyor?
“En sevdiğiniz meyve hangisi?” gibi bir soru verildiğinde, metin üreten modeller hangi “belirtecin” büyük olasılıkla diğerini (her seferinde bir simge) takip edeceğini tahmin eder. Tek bir karakter veya kelime olabilen belirteçler, üretken bir modelin bilgiyi işlemek için kullandığı yapı taşlarıdır. Bir model, her olası tokena, çıktı metnine dahil edilme şansının yüzdesi olan bir puan atar. Google, SynthID Text’in “belirteçlerin oluşturulma olasılığını modüle ederek” bu belirteç dağıtımına ek bilgi eklediğini söylüyor.
Şirket bir blog yazısında şöyle yazdı: “Her iki modelin kelime seçimlerine ilişkin puanların son modeli, düzeltilmiş olasılık puanlarıyla birleştiğinde filigran olarak kabul edilir.” “Bu puan modeli, filigranlı ve filigransız metinler için beklenen puan modeliyle karşılaştırılarak SynthID’nin metni bir yapay zeka aracı tarafından mı oluşturulduğunu yoksa başka kaynaklardan mı geldiğini tespit etmesine yardımcı oluyor.”
Google, bu bahardan bu yana Gemini modelleriyle entegre edilen SynthID Text’in metin oluşturmanın kalitesinden, doğruluğundan veya hızından ödün vermediğini ve kırpılmış, başka kelimelerle ifade edilmiş veya değiştirilmiş metinlerde bile çalıştığını iddia ediyor.
Ancak şirket, filigranlama yaklaşımının sınırlamaları olduğunu da kabul ediyor.
Örneğin, SynthID Metni kısa metinlerde, yeniden yazılmış veya başka bir dilden çevrilmiş metinlerde veya gerçek sorulara verilen yanıtlarda iyi performans göstermez. Şirket, “Gerçeklere dayalı istemlere verilen yanıtlarda, gerçek doğruluğu etkilemeden token dağıtımını ayarlamak için daha az fırsat var” diye açıklıyor. “Buna ‘Fransa’nın başkenti neresidir?’ gibi yönlendirmeler veya ‘William Wordsworth şiiri oku’ gibi çok az değişiklik beklenen veya hiç değişiklik beklenmeyen sorgular dahildir.”
Yapay zeka metin filigranı teknolojisi üzerinde çalışan tek şirket Google değil. OpenAI yıllardır filigranlama yöntemlerini araştırdı ancak teknik ve ticari nedenlerden dolayı bunların yayınlanmasını erteledi.
Metin için filigranlama teknikleri, geniş çapta benimsenirse, daha genel bir sesle yazılan makaleleri ve makaleleri hatalı bir şekilde işaretleyen, hatalı – ancak giderek daha popüler hale gelen – “Yapay Zeka dedektörleri”nin gidişatını değiştirmeye yardımcı olabilir. Ancak soru şu ki, bunlar geniş çapta benimsenecek mi ve bir kuruluşun önerdiği standart veya teknoloji diğerlerine üstün gelecek mi?
Yakında geliştiricilerin elini zorlayacak yasal mekanizmalar ortaya çıkabilir. Çin hükümeti, yapay zeka tarafından oluşturulan içeriğe zorunlu filigran eklemeyi uygulamaya koydu ve Kaliforniya eyaleti de aynısını yapmayı planlıyor.
Durumun aciliyeti var. Avrupa Birliği Emniyet Teşkilatı tarafından hazırlanan bir rapora göre, 2026 yılına kadar çevrimiçi içeriğin %90’ı sentetik olarak oluşturulabilir ve bu da dezenformasyon, propaganda, dolandırıcılık ve aldatma konusunda kolluk kuvvetlerinin yeni zorluklarına yol açabilir. AWS araştırmasına göre, yapay zeka çevirmenlerinin yaygın kullanımı sayesinde, zaten web’deki tüm cümlelerin neredeyse %60’ı yapay zeka tarafından oluşturulmuş olabilir.
Kaynak: https://techcrunch.com/2024/10/23/google-releases-tech-to-watermark-ai-generated-text/