Giriş

Dün hep beraber Veri Bilimi ve Veri Bilimcisi konularına bakmıştık. Bugünkü yazımızın odağında ise veri biliminin çekirdeğinde yer alan veri analitiği olacak.

Bu işlemin geçmişte nasıl yapıldığına, günümüzdeki dönüşümüne ve gelecekteki olası haline değiniyor olacağız.

Veri Analizinin Tarihi

Geçmiş - Veri Analizi

Veri analizi, geçmişte özellikle kimya ve ekonomi alanında çalışan bilim insanlarının ve istatistikçilerin uyguladığı bir teknikti. Bu dönemlerde bir hipotezi test etmek için atılan adımlar şöyle listelenebilir:

  • Deney tasarımı yapılır
  • Deney yapılır ve veri toplanır
  • Veri analiz edilerek hipotezimizi destekleyip desteklemediğine bakılır.

Bu noktada şunu unutmamak gerekiyor, bu dönemler internetin ve internet üzerinden yapılan veri toplama amacı güden çalışmaların akademik olarak çok yaygın olmadığı dönemler. Yani deney tasarımını yaptıktan sonra bu deneyi yapmak ve veri toplamak için ciddi zaman ve paralar harcanıyordu.

Sözgelimi bir sosyal bilim çalışması için anket yapılması ihtiyacı doğduğunda bunu surveymonkey veya google forms gibi araçlar yerine ya kendiniz gidip yapıyordunuz, ya da üniversiteniz sizi fonladıysa, anketörler tutuyor, bu insanlara yaptırıyordunuz. Veya yapılandırılmış mülakat yapacaksanız, bunu Skype veya Facebook üzerinden kaydedilebilir bir biçimde video konferans ile değil, elde diktafon - veya başka ses kaydedici alet - ile gidip mülakatı kaydedip sonra transkribe ederdiniz.

Bu dönemin sonlarına doğru SPSS gibi araçlara veriyi girip, analizini yapıp, çok ilkel biçimde görselleştirme yapmak mümkün hale geldi. Bu analizler ise, tabiatı gereği, bilimsel makaleler haricinde bir yerlerde nadiren ortaya çıkan nitelikte oldular.

Günümüz - Veri Analitiği

Kabul etmek gerekirse Veri Analitiği dediğimiz şey Veri Analizi’nin biraz daha alengirli hali. Bu operasyonun ad değiştirmesindeki en büyük etken ise iş dünyasının ilgisi aslında.

Bu analizin, iş dünyasında yaygınlaşmasının itici gücü olarak excel‘i söylemek çok akıl dışı olmaz. Hala büyüklü küçüklü bir çok firmanın veri işlerini yapan bu program ile iş dünyası kendi verilerini hızlı bir biçimde işleme, görselleştirme ve özetleme imkanı buldu. Bu yazılımın yaygınlaşmasında, hem bilgisayar hem de yazılım fiyatlarının azalması ve kolayca edinilebilir hale gelmesini de gözden kaçırmamak gerekir.

En basitinden doksanların başında çıkan dergilere bakarsanız, bilgisayar fiyatlarının dönem ekonomisi düşünüldüğünde bile dudak uçuklatan miktarlarda olduğunu görür ve bilgisayarcı olarak iş yapan firmaların çok çok az olduğunu fark edersiniz. Ki dönem dos dönemidir, yani aldınız bilgisayarı ne yapacağınız çok meçhuldür. Bu dönemlerde bilgisayar kullananlar genelde şirketlerdir ve kullanıcılarına bilgisayar tahsis ederken üzerinde kendi yazdırdıkları bir yazılım ile vermektedirler. Yine hatırlatayım, bu dönemde c#, java, python, ruby gibi yüksek seviye programlama dilleri yoktur ve program yazmak öyle teknoloji akademisinden altı ayda çıkıp yapılan bir şey değildir.

Dönemin devamında gelen, bilgisayar devrimi ise arkasında Windows 95-98 ile görselleşen bir bilgisayar kullanımını taşımaktadır. Dahası bu görsel hale gelen işletim sisteminin üzerinde beraber çalışacağı, ofis yazılımları başta olmak üzere birçok yazılımı içeren bir uygulama ekosistemi de bulunmaktadır.

Gelecek olası bir itiraza hemen yanıt vereyim; doğrudur bu dönem öncesinde Windows 3.1 veya Amiga’nın Workbench gibi uygulamaları ile görsel bilgisayar yönetimi mümkün olsa da döneme hakim olan girdi aracı hala klavyedir; insanlar mouse görünce tuhaf tuhaf bakmaktadırlar. Dahası, bu sistemler üzerinde uygulama yüklemek ve çalıştırmak mümkün değil ile çok zor arasında bir yerdedir. Program yüklemesi zaten Amiga zamanında ancak harddiski olan şanslı kullanıcıların yapabildiği bir şeydir, uygulama çalıştırmak ise - uygulamaların dos üzerinde çalışacak şekilde yazılmasından ötürü - genelde windows’tan çıkıp, bahsigeçen uygulamanın “klasörüne” gidip uygulamanın exe dosyasının çalıştırılması şeklinde cereyan etmektedir. Oyun oynayacaksanız falan zaten ses kartının giriş çıkış portlarını ayarladığınız sersetup.exe ile bir hoşlaşmanız gerekmektedir.

Neyse, nostalji yapmayı kesip konuya geri dönelim, Windows ile beraber hem daha iyi, hem de daha ucuz araçlara kavuştuğumuzu söylemek yalan olmaz. Bunun üzerine gelen bir internet devrimi ile durum geri dönülemez bir halde değişmiştir. Artık gerek veri toplanımı, gerek işlenimi, gerekse sunumu bir önceki dönemle kıyasla hem kolaylaşmış hem de ucuzlamıştır.

Tarihler günümüze geldiğinde ise veri analizi konusunda hazır kütüphaneler ve/veya diller çıktığını, görselleştirme konusunda gerek statik, gerekse plot.ly gibi interaktif grafiklerin üretilebildiğini görüyoruz.

Günümüzde dashboard veya infografik olarak ortaya çıkacak grafiksel sunu araçlarının iyileşmesinde temel olarak bu sonuçları tüketecek insanların bilim dışarısından insanlar olmalarının kritik olduğunu düşünüyorum bu arada.

Kısacası günümüzde verinin toplanması, analiz edilmesi ve iletişmesi:

  • Kolay
  • Ucuz
  • Hızlı

hale gelmiştir.

Gelecek: Veri-güdümlü Karar Verici Mekanizmalar

Bu gelişim çizgisine ve trendlere baktığımızda bizi önemli iş kararlarının içgüdü veya his yerine veri-güdümlü karar verici mekanizmalar ile verildiği bir çağın beklediğini söylemek hatalı olmaz.

Bu dönemin gelmesindeki en büyük faktör, verinin demokratikleşmesi ve ihtiyacımız olan verilere çok kolayca ulaşabilmemiz sanıyorum ki. En basitinden resmi ve bilimsel veri setlerinin erişime açılması ile daha önceden erişemediğimiz ve sektör ile alakalı veriler ile bağıntı kurabilmemiz mümkün hale gelmekte.

Tüm bunları bir yere koyarsak günümüzden başlayan bu geleceğin veri temelli bir gelecek olduğunu görmek için kişisel hayatımıza bakmamızın yeterli olduğunu düşünüyorum. Kullandığımız cep telefonları, gps verisinden yüksekliğe kadar giden sensörlere sahipler; giderek yaygınlaşan fitbit veya mi band gibi adımsayarlı nabız ölçerli araçlar ile hayatımızın bayağı bir kısmının sayısal bir biçimde ifade edilebileceğini söyleyebilirim. Bu verilerin kolayca işlenerek tahminde bulunulabilecek hale gelmesi de çok abuk bir çıkarım olmaz.

Ki nitekim veri analizi ve bağlamında veri bilimi ile değişen alanlara örnek vermeye başladığımızda ilk sırada saydığım bu araçları kullanarak sizin sağlık durumunuzu bilerek size fiyat veren sigorta şirketlerinin olması şaşırtıcı olmayacak. İkinci sırada ise kanitatif analistler ve hft (high frequency trading - yüksek frekanslı işlemler) kullanarak işi neredeyse bir bilgisayar bilimine dökmüş olan hisse senedi alım satımı gelecek.

Sonuç

Yazımızın sonuna geldiğimizde buraya kadar yazdıklarımızı bir özetlemek isterim. Başta Veri Analizi adı altında bu aktivitenin geçmişine göz gezdirdik ve bu dönemde:

Verinin toplanması, analiz edilmesi ve iletişmesinin zor, pahalı ve yavaş

olduğunu gördük.

Devamında gelen ve bu aktiviteyi Veri Analitiği haline dönüştüğünü gördüğümüz günümüzde ise:

Veri toplanması, analiz edilmesi ve iletişmesinin kolay, ucuz ve hızlı

olduğuna değindik.

Geleceğine baktığımızda ise bu aktivitenin Veri-güdümlü Karar Verici Mekanizmalar haline gelerek Veri-güdümlü şirketler ‘e, yani bilgiyi bir kaynak olarak kullanan ve bu bilgiyi işleyerek karar verme süreçlerini destekleyen şirketler, dönüşeceklerinden bahsedip çeşitli örnekler verdik.

Yarın ise Internet of Things kavramına eğileceğiz. Okuduğunuz için teşekkürler!