Bu, Capital One tarafından sunulan bir VB Lab Insights makalesidir.
AI dönüştürücü potansiyel sunar, ancak değerinin kilidini açmak güçlü veri yönetimi gerektirir. AI, veri ve yapay zeka arasında bir volan etkisi yaratarak yinelemeli olarak geliştirilebilen sağlam bir veri temelini oluşturur. Bu volan, şirketlerin müşterileri ve işletme için etkinin kilidini açan daha özelleştirilmiş, gerçek zamanlı çözümler oluşturmalarını sağlar.
Günümüz dünyasında verileri yönetmek karmaşıklığı yoktur. Veri hacmi hızlanıyor, araştırmalar olduğunu gösteriyor Sadece son beş yılda iki katına çıktı. Sonuç olarak, İşletmeler için mevcut verilerin% 68’i kullanılmamış. Bu verilerde, MIT’in etrafında olduğunu belirterek çok çeşitli yapılar ve formatlar var. Verilerin% 80-90’ı yapılandırılmamış – Kullanmaya koymada karmaşıklığı körüklemek. Ve son olarak, verilerin kullanıcılara dağıtılması gereken hızı hızlanıyor. Bazı kullanım durumları, 10’un altındaki veri kullanılabilirliğini veya başka bir deyişle, göz açıp kapayıncaya kadar on kat daha hızlı gerektirir.
Günümüzün veri ekosistemleri büyük, çeşitli ve hızlıdır – ve AI devrimi, şirketlerin verileri nasıl yönetip kullandıklarına ilişkin riskleri daha da artırıyor.
Harika veriler için temeller
Veri yaşam döngüsü karmaşık ve affetmez, genellikle birçok adım, birçok şerbetçiotu ve birçok aracı içerir. Bu, veri yönetimini artırmak için farklı veriler ve çeşitli olgunluk ve enstrümantasyon seviyeleri ile çalışma yollarına yol açabilir.
Kullanıcıları inovasyon için güvenilir verilerle güçlendirmek için önce harika verileri yönetmenin temellerini çözmemiz gerekir: self servis, otomasyon ve ölçek.
- Self servis, kullanıcıları işlerini minimum sürtünme ile yapmaları için güçlendirmek anlamına gelir. Kesintisiz veri keşfi, veri üretim kolaylığı ve veri erişimini demokratikleştiren araçlar gibi alanları kapsar.
- Otomasyon, tüm temel veri yönetimi özelliklerinin, kullanıcıların verilerle çalışmasını sağlayan araçlara ve deneyimlere gömülmesini sağlar.
- Veri ekosistemlerinin ölçeklenmesi gerekir – özellikle AI döneminde. Diğer hususların yanı sıra, işletmelerin, verilerin nasıl yönetileceğine (ve bu tür anlaşmalar için icra mekanizmalarının) temel yükümlülüklerini belirleyen belirli teknolojilerin, esneklik yeteneklerinin ve hizmet düzeyi anlaşmalarının ölçeklenebilirliğini dikkate almaları gerekir.
Bu ilkeler, harika veriler üretmek ve tüketmek için temel oluşturur.
Harika veri üretmek
Veri üreticileri, hızlı ve verimli tüketimi sağlayarak veri bir araya getirmek ve düzenlemekten sorumludur. İyi tasarlanmış, self servis bir portalı, üreticilerin depolama, erişim kontrolleri, onaylar, sürüm ve iş katalogları gibi ekosistemdeki sistemlerle sorunsuz bir şekilde etkileşime girmesine izin vererek burada önemli bir rol oynayabilir. Amaç, bu sistemlerin karmaşıklığını azaltan, verileri doğru formatta, doğru zamanda ve doğru yerde hale getiren birleşik bir kontrol düzlemi oluşturmaktır.
Yönetişimi ölçeklendirmek ve uygulamak için, işletmeler merkezi bir platform ve federasyonlu bir model arasında seçim yapabilir – hatta melez bir yaklaşım benimseyebilir. Merkezi bir platform veri yayıncılığı ve yönetişim kurallarını basitleştirirken, federasyonlu bir model, yerel olarak yönetişimi ve altyapıyı yönetmek için amaca yönelik SDK’ları kullanarak esneklik sunar. Anahtar, otomasyon ve ölçeklenebilirliği sağlayan tutarlı mekanizmalar uygulamak, işletmenin AI inovasyonunu körükleyen yüksek kaliteli veriler üretmesini sağlamaktır.
Harika veriler tüketmek
Veri bilimcileri ve veri mühendisleri gibi veri tüketicileri, hızlı deney ve geliştirme için güvenilir, yüksek kaliteli verilere kolay erişim gerektirir. Depolama stratejisinin basitleştirilmesi temel bir adımdır. Hesapı veri gölü içinde merkezileştirerek ve tek bir depolama katmanı kullanarak, işletmeler hesaplama motorlarının tek bir depolama katmanından veri tüketmesini sağlayarak veri yayılmasını en aza indirebilir ve karmaşıklığı azaltabilir.
İşletmeler ayrıca çeşitli kullanım durumlarını ele almak için bir bölge stratejisi benimsemelidir. Örneğin, bir ham bölge, yapılandırılmamış veriler gibi genişletilmiş veri ve dosya türlerini destekleyebilirken, küratörlü bir bölge daha katı şema ve kalite gereksinimlerini uygular. Bu kurulum, yönetişim ve veri kalitesini korurken esnekliğe izin verir. Tüketiciler bu bölgeleri deney için kişisel alanlar oluşturma veya ekip projeleri için işbirlikçi bölgeler gibi aktiviteler için kullanabilirler.
Otomatik hizmetler, veri erişimini, yaşam döngüsü yönetimi ve uyumluluğunu sağlayarak kullanıcıları güven ve hız ile yenilik yapmalarını sağlar.
Basitlikle liderlik edin
Etkili AI stratejileri sağlam, iyi tasarlanmış veri ekosistemlerine dayanmaktadır. Verileri nasıl ürettiğinizi ve tükettiğinizi basitleştirerek ve söz konusu verilerin kalitesini artırarak, işletmeler kullanıcıları yeni performans sürüş alanlarında güvenle yenilik yapmalarını sağlayabilir.
Bir temel olarak, işletmelerin güvenilirliği ve erişilebilirliği artıran ekosistemlere ve süreçlere öncelik vermesi çok önemlidir. Yukarıda özetlenen ilkeleri uygulayarak, AI’da hızlı deneylere güç verecek ve sonuçta uzun vadeli iş değeri sunacak olan ölçeklenebilir ve uygulanabilir veri yönetimini yapabilirler.
Marty Andolino VP, Capital One’da Yazılım Mühendisliği
Kajal Wood, Capital One’da Yazılım Mühendisliği Kıdemli Direktörüdür
VB Lab Insights içeriği, Yayın için ödeme yapan veya VentureBeat ile iş ilişkisi olan bir şirketle işbirliği içinde oluşturulur ve her zaman açıkça işaretlenir. Daha fazla bilgi için iletişime geçin
Kaynak: https://venturebeat.com/ai/essential-principles-to-produce-and-consume-data-for-ai-acceleration/