Büyük veri ve yapay zekâ, günlük hayatımızda sık duyduğumuz kavramlar haline geldi. Bu teknolojiler, endüstride yaygın kullanılan ve kompleks problemleri çözebilen güçlü araçlardır. Kompleks problemlerden kastım, insanoğlunun kolaylıkla çözemeyeceği veya çok vaktini alacak problemlerdir. Videodan sahne anlamlandırma veya gigabaytlarca veri üzerinden korelasyonlar yakalayıp anlam çıkarma gibi problemler örnek olarak verilebilir. Büyük veri, endüstrideki problemlerin çözümünde fayda sağladığı gibi dünyamızın sorunlarını çözerek sosyal fayda üretmede de çok iyi işler başarıyor.
‘Dünyayı daha iyi bir yer haline getirmek’ idealine sahip olan veri bilimciler; büyük veriyi kullanarak, sağlık teknolojileri, eğitim eşitsizliği, göç, iklim değişikliği gibi sosyal noktalara dokunan projeler geliştiriyorlar. Yapılmış ve yapılmakta olan projelere göz atarak konuyu biraz daha netleştirelim.
Özellikle medikal alanda yapay zekâ ve derin öğrenme modellerinin kullanımı giderek yaygınlaşıyor ve bu alanda çalışan çok fazla girişim var. Örneğin; röntgen veya MR görüntülerinden, hastanın kanser olup olmadığı konusunda karar destek mekanizması olarak işlev gören modeller üretiliyor. Burada yapay zekâ modeli oluşturulma sürecine basitçe değinmek istiyorum. Çoğu yapay zekâ ve büyük veri uygulamasında, asıl büyük iş yüküne sahip kısımlar: veri toplama ve veri işleme. Veriyi topladıktan ve bir ön işleme tabii tutup veri temizlendikten sonra veri etiketleme işlemi yapılması gerekiyor. Kanserli dokuyu içeren medikal görüntüler ‘kanserli doku’, içermeyen medikal görüntüler ise ‘normal doku’ olarak sınıflandırılması gerek. Bu sınıflandırma işini doktorlar görüntüleri inceleyerek elle yapabilirler veya geçmiş verilerden kanser olduğu bilinen hastaların MR görüntüleri ‘kanserli doku’ olarak etiketlenebilir. Etiketleme işleminden sonra yapay zekâ modelini ve algoritmasını oluşturup etiketli veriyi modele veriyoruz ve modeli eğitiyoruz. Modelin doğru eğitilmiş olduğunu farz edersek; eğitilen model, yeni gelen görüntüleri çok küçük bir hata payıyla ‘kanserli doku’ veya ‘normal doku’ olarak sınıflandıracaktır. Doktorlar, MR görüntülerini yorumlarken geliştirilen modelin çıktısını da göz önünde bulundurup daha başarılı kararlar alabilir.
Kenya ve Uganda bölgelerinde gerçekleştirilen bir projede ise, veri bilimciler para yardımlarının daha adil dağıtılması için uydu verisine dayalı bir sistem geliştirmişler. Projede, uydu görüntüleri kullanılarak köylerin yoksulluk düzeyi tespiti yapılıyor. İndikatör olarak köylerdeki evlerin çatı tipini kullanmışlar. Bölgede iki farklı çatı tipi var: Metal ve sazlık. Geliştirdikleri algoritma yardımıyla, her köyün ev kalitesini ve yoğunluğunu uydu görüntülerinden tespit ediyorlar. Bu verileri bölgesel olarak analiz edip sıcaklık haritası çıkarıyorlar. Elde edilen sonuçlar, para yardımlarının dağıtılması sürecin de destek mekanizması olarak yardımcı oluyor.
Bir diğer proje de New York ve Seattle’da trafik çözümlenmesi ile ilgili. Trafik kazaları yüzünden her sene binlerce insan yaralanıyor veya hayatını kaybediyor. Yolların daha güvenli hale gelmesini hedefleyen DataKind ekibi, ilk olarak şehirlerin ulaşım departmanlarından trafik veri setlerini almışlar. Bu veri seti; kazaların en sık hangi noktalarda gerçekleştiği, saatlere göre trafik yoğunluğu dağılımı, cadde karakteristikleri, demografik yapı gibi bilgileri içeriyor. Ekip bu veri setini kullanarak inovatif bir istatistiksel model üretmiş. Bu sayede şehrin, caddelerin, şoförlerin, bisiklet sürücülerinin ve yayaların trafik davranışlarını anlamlandırmak konusunda büyük ilerleme kaydetmişler. Ürettikleri model yardımıyla; şehir yönetimi, kazaların sık yaşandığı noktalarda önlem alma, trafik yoğunluğuna göre alternatif rota üretme imkanlarına sahip oluyor.
Günler ilerledikçe problemlerimiz de artmaya devam ediyor. Bu yüzden bir an önce verinin büyük potansiyelinin farkına varmalı ve veri toplama sürecine önem vermeliyiz. Her türlü dijital bilgiyi, yeni çıktılar üretebilecek potansiyel bir veri kaynağı olarak düşünmeliyiz. Sadece ne tür bir film izlemek istediğimizi önermesi için değil, görmeyi istediğimiz dünyayı yaratırken karar mekanizması olması için veriyi kullanmalıyız.
Yapay zekayı ve veriyi kullanarak nasıl sosyal etki üretebilirim diyorsanız, birkaç tavsiye sunabilirim. Veri bilimi projeleri yapanların sıklıkla kullandığı ‘kaggle.com’ isminde bir web sitesi var. Burada halihazır da kullanılabilecek çok fazla veri seti bulunmakta. Sitede çeşitli eğitim videoları da mevcut. Aynı zamanda burada ödüllü yarışmalar da düzenleniyor. Ayrıca bazı üniversitelerin ve organizasyonların, toplumsal fayda odaklı projeleri içeren yaz kampları oluyor. Bahsettiğim konularla alakalı linkleri yazının sonunda bulabilirsiniz.
Linkler ve referanslar: