Veri Bilimi Nedir ?

Veri bilimi, algoritma geliştirme, teknoloji ve veri çıkarımı gibi çok dsiplinli alanları kullanarak bu dsiplinler araciligi ile verideki istenen bilgiyi ortaya cikaran bir bilim dalıdır. Veri biliminde bilgisayar bilimleri ve istatistik en çok ihtiyaç duyulan başlıca alanlardır, ayrıca veri biliminde makine öğrenmesi, kümeleme analizleri (Örneği İncele) ve veri görselleşetirme en çok yapılan işlerden bazılarıdır. Veri bilimcileri, analitik düşünme, makine öğrenimi, veri madenciliği ve istatistiksel becerilerin yanı sıra algoritma ve kodlama deneyimlerinin bir kombinasyonuna sahip olmalıdır.

Peki veri bilimciler, veriden bilgiyi nasıl çıkarırlar. Öncelikle veriyi araştırmakla başlanır, elinizde bir veri bir de problem mevcuttur ve siz bu problem bu veri doğrultusunda çözmeniz gerekmektedir. Bu nedenle verideki yapıyı ve parametreleri analiz edip anlamakla işe başlanır. Sonrasında veriyi çözümlemek için farklı analizler kullanırlar, mesela zaman serisi analizleri ,semantic analizler, çıkarımsal modellemeler gibi, ve bu modeler yapısal ve yapısal olmayan veri setleri için farklılaşır. Amaç elbette eldeki veri ile ortaya koyulan problem çözmektir. Günümüzde veri biliminin popular alanlarından biri de büyük veridir. Büyük veri konusunu sayfamızda ayrı bir başlıkta görebilirsiniz ancak yeri gelmişken veri bilimciler büyük miktarda veriyi yönetmek ve yorumlamakla birlikte, dijital bilginin iş değerini göstermeye yardımcı olan veri görselleştirme modelleri oluştıurma konusunda da görevlendirilmiştir. Son olarak very biliminin diğer popular başlıkları, makine öğrenmesi, dern öğrenme, doğal dil işleme, hakkında özet bilgiyi diğer sayfalarımızda bulabilirsiniz.

Somutlaştırma adına yukardaki açıkladıklarımızı şu örneklerle pekiştirelim,

Bir market işletiyorsunuz ve müşterilerinizin gereksinimlerini, müşterinin geçmiş verilerinden, mesela satın alma geçmişi, yaş, iş ve gelir gibi mevcut verilerden anlayabilmeniz nasıl olurdu? Şüphesiz bu verilerin hepsinden bişeyler yapabilirsiniz, ama şimdi çok miktarda veri ve çeşitlilikle, modelleri daha etkin bir şekilde eğitebilir ve ürünü daha hassas bir şekilde müşterilerinize tavsiye edebilirsiniz. Hatta aynı şirket sadece müşterilerini değil çalışanlarını da analiz edebilir, mesela iyi çalışanlarının işten çıkmasını tahminleyip buna göre önelemini alabilir, şirketler açısından veri bilimi adına çok fazla örnek mevcuttur.

Veri Biliminin karar vermede rolünü anlamak için farklı bir senaryoyu ele alalım. Davalarınızın tahminlenmesi size mutlu etmez miydi? Kümeleme analizleri ile ya da yapay sinir ağları yardımıyla, ve tabiki döküman sınıflandırma algoritmalarını da kullanarak bunu rahatlıkla başarabiliriz, hatta kodexbilisim olarak bunu başardık.

Veri Analizinin tahmin analitiğinde nasıl kullanılabileceğini görelim. Hava durumu tahminlerini örnek olarak alalım. Modeller oluşturmak için gemiler, uçaklar, radarlar, uydulardan veriler toplanabilir ve analiz edilebilir. Bu modeller sadece hava durumunu değil, aynı zamanda herhangi bir doğal felaketin meydana gelmesini tahmin etmede yardımcı olacaktır. Önceden uygun önlemleri almanıza ve birçok değerli hayatı kurtarmanıza yardımcı olacaktır.

Veri analizi ile ilgiliyseniz ve bu ilginizi arttırmak icin olmazsa olmaz istatistik, (makine öğrenmesini de duyarsınız ancak bu istatsistik biliminin bazı konularının paketlenmesi ile oluşturulmuştur), programlama dilleri (R ve Python öncelikle) veri biliminin olmazsa olmazlarıdır, sonrasında gelecek problemlere göre daha farklı konuları da öğrenmeniz gerekcektir.