Bu tabandan gelen çaba, yapay zekanın sesini nasıl daha çeşitli hale getirebilir?

Ryakitimbo, Tanzanya, Kenya ve Demokratik Kongo Cumhuriyeti’ndeki Kiswahili’de ses verileri topladı. Bana sosyoekonomik açıdan çeşitli Kiswahili konuşmacılarından ses toplamak istediğini ve kırsal bölgelerde yaşayan, her zaman okuma yazma bilmeyen ve hatta cihazlara erişimi olmayan genç ve yaşlı kadınlara ulaştığını söyledi.

Bu tür veri toplama zordur. Yapay zeka ses verilerini toplamanın önemi, özellikle de teknolojilere aşina olmayan birçok kişiye soyut gelebilir. Ryakitimbo ve gönüllüler, kadınlara, adet hijyeniyle ilgili sunumlar gibi, kendilerini güvende hissettikleri ortamlarda yaklaşacak ve örneğin, teknolojinin adetle ilgili bilgilerin yayılmasına nasıl yardımcı olabileceğini açıklayacaklardı. Ekip, okuma bilmeyen kadınlara kayıt için tekrarlayacakları cümleleri okudu.

Common Voice projesi, dillerin kimliğin gerçekten önemli bir parçasını oluşturduğu inancıyla destekleniyor. Lewis-Jong, “Bunun sadece dille ilgili olmadığını, kültür ve mirasın aktarılması ve insanların özel kültürel bağlamına değer verilmesiyle ilgili olduğunu düşünüyoruz” diyor. “Çevirilmeyen her türlü deyim ve kültürel slogan var” diye ekliyor.

Carnegie Mellon Üniversitesi’nde ses veri kümeleri üzerinde çalışan bir araştırmacı olan Willie Agnew, Common Voice’un İngilizce’nin hakim olmadığı tek ses veri kümesi olduğunu söylüyor. Agnew, “Bunu ne kadar iyi yaptıklarından ve aslında oldukça çeşitli olan bu veri setini ne kadar iyi oluşturduklarından çok etkilendim” diyor. “Baktığımız neredeyse tüm diğer projelerden çok daha ileridelermiş gibi görünüyor.”

Common Voice platformunda diğer Fince konuşanların kayıtlarını doğrulamak için biraz zaman harcadım. Sesleri çalışma odamda yankılanınca şaşırtıcı bir şekilde duygulandığımı hissettim. Hepimiz aynı amaç etrafında toplanmıştık: Yapay zeka verilerini daha kapsayıcı hale getirmek ve kültürümüzün ve dilimizin yeni nesil yapay zeka araçlarında doğru şekilde temsil edildiğinden emin olmak.

Ancak sesime bağış yaparsam ne olacağı konusunda bazı büyük sorularım vardı. Bir kez veri setine girdiğinde, daha sonra nasıl kullanılabileceği konusunda hiçbir kontrolüm olmayacaktı. Teknoloji sektörü tam olarak bilinmiyor insanlara gereken krediyi vermek, ve veriler herkesin kullanımına açıktır.

Ryakitimbo, “Yerel topluluklara fayda sağlamasını istediğimiz kadar, Big Tech’in de aynı verileri kullanıp daha sonra ticari ürün olarak ortaya çıkacak bir şey oluşturma olasılığı var” diyor. Her ne kadar Mozilla Common Voice’u kimin indirdiğini paylaşmasa da Lewis-Jong bana Meta ve Nvidia’nın bunu kullandıklarını söylediklerini söyledi.

Carnegie Mellon Üniversitesi’nde denetim araştırması yapan ekibin bir parçası olan araştırmacı Harry H. Jiang, zorluklarla elde edilen ve nadir bulunan bu dil verilerine açık erişimin tüm azınlık gruplarının istediği bir şey olmadığını söylüyor. Örneğin, Yerli gruplar endişelerini artırdı.

Kaynak: https://www.technologyreview.com/2024/11/15/1106935/how-this-grassroots-effort-could-make-ai-voices-more-diverse/