Yeni Bir Merak: Data Science

Uzun yıllar boyunca yazılım yaptıktan sonra son iki yılda Yazılım Testi’ne yönelmiştim. Hatta bununla ilgili çeşitli sertifikalar da alarak deneyim eksikliğini bir nebze de olsa kapatma yoluna da gittim. Mevcut işyerimde hem iş analizi hem de yazılım testi yapıyorum. Bu sebeple de kendimi bu alanlarda geliştirmeye çalışıyorum. Bir yandan da yazılımdan tamamen kopamadığım için hobi olarak Android uygulama geliştirmeye devam ediyorum. Gerçi henüz son SDK ya pek bakabilmişliğim yok ama olsun. 🙂 Fakat son zamanlarda eşimin de katkılarıyla farklı bi alan ilgimi çeker oldu. Bu neymiş diye bakarken ilk izlenimimin ‘çok zevkli bi şeye benziyo’ oluşu üzerine data science ile ilgili biraz daha araştırma yaptım ve ileride profesyonel olarak yapmasam bile hobi seviyesinde öğrenmenin güzel olacağına karar verdim.

Her ne kadar yaparak öğrenmenin en faydalı yol olduğunu düşünsem de yapmadan önce de bir şeyler biliyor olmanın gerekliliğine inanıyorum. Dolayısıyla neler öğrenmem gerektiğiyle ilgili kısa bir araştırma yaptığımda aslında pek de az bir şey olmadığını fark ettim. R, Python, NumPy, Pandas, SciPy vs derken sonu gelmiyor. Neyse ki internette bu alanla ilgili bol miktarda kaynak bulunmakta.

Data Analysis & Science için R ve Python en popüler diller. Biraz yazılımdan gelmenin de etkisiyle sanırım Python ile devam etmeyi tercih ettim. Python, başlarda ‘bu değişkeni nerde tanımladık ki’ dedirtmesine rağmen öğrenmesi gayet kolay bir dil. Deyim yerindeyse bi süre sonra eliniz alışıyor diğer dillere göre çok aykırı duran özelliklerine. Kullanılmakta olan belli başlı kütüphaneler mevcut ve bir çok işlem için de bunlar yeterli oluyor. Ben de şu an kendimi bu noktada görüyorum.

Öğrenme süreciyle ilgili olarak karşıma çıkan bazı tutorial sitelerinden bahsetmek istiyorum. Coursera vb klasik tarzdaki sitelerin haricinde ilk olarak karşıma Dataquest çıktı. Sitede neredeyse tüm sayfalar ikiye bölünüyor ve sol tarafta konu anlatımı ve alıştırmalar yer alırken sağ tarafında ise bu alıştırmaları yaparken kodunuzu yazıp deneyebileceğiniz bir IPython penceresi bulunmakta. Ayrıca tutoriallarda ilerledikçe ‘deneyim puanı’ kazanıyosunuz -ki benim en çok bu hoşuma gitti-. Fakat tüm bunların yanında bir şey sürekli eksik kalıyordu. Bi süre çalıştıktan sonra sürekli okuyor olmanın verdiği bir yılgınlık oluyordu. Başka neler var diye baktığımda Datacamp ile karşılaştım. Dataquestte var olan tüm özelliklerin yanında konu anlatım yerine 3-5 dakikalık kısa videoların yer aldığını gördüm. Bu konu anlatım videolarının ardından da o konuyla ilgili alıştırmalar geliyor. Arada konunun anlaşılıp anlaşılmadığına yönelik sorular da yer alıyor. Böylelikle her konu için farklı bir yere gidip durmaktansa tek bir kaynaktan temel araçları öğrenmenin faydalı olacağını düşünerek bu siteden devam etmeye karar verdim.

Dataquest ile Datacamp’ı içerik olarak karşılaştıracak olursak; Dataquest Python ağırlıklı Datacamp ise R şeklinde tek bir cümle söylenebilir. Fakat Datacamp gördüğüm kadarıyla Python içeriklerini artırıyor. (Ayrıca sürekli devam eden bir kampanya mı bilmiyorum fakat Pluralsight’ta yer alan Python eğitimlerine de 6 ay ücretsiz erişim hakkı veriyor) Şu an Python seçili olduğunda takip edilebilecek üç farklı kariyer yolu bulunmakta. Ben de bunlardan ‘Python Programmer’ olanı ile başladım ve halen devam ediyorum. Ardından ‘Data Science with Python’ ve ‘Data Analyst with Python’ ile devam etmeyi planlıyorum.

Sonuç olarak, bu işin sonunda en azından bir kaç hobi projesi yapabilir durumda olmak gibi ulaşılabilir bir hedefim var. Verilerle oynayıp ortaya anlamlı bir sonuç, görsel bir sunum çıkartabilmenin getireceği hazzın bu uğraşlara değeceğini düşünüyorum. Umarım yanılmıyorumdur. 🙂