Sevgili dostlarım , bugün büyük veri’nin önemini anlamayan şirketlerin çok yakın bir zaman içerisinde bulundukları konumları kaybedeceklerini düşünüyorum. Bir çok yazımda belirtiğim gibi büyük veri illaki şu kadar TB bu kadar PB demek değil. Sizin ulaşabileceğiniz toplayabileceğiniz verileri daha doğru analiz …
Merhaba Arkadaşlar, Geçtiğimiz aylarda karşımıza çıkan yeni hadoop 3.1 ve Hortownorks 3.0 data platformunu bir kaç projede kullandıktan sonra kendime göre öenmli özellikleri sizlerle paylaşmak istedim. Öncelikle Platformun ana odak noktaları Faster-Smarter ve Hybrid. Bunların dışındaki odaklarımız ise her zaman …
Data Lake , Tek store da structure , semi-structure veya raw dataların tutulması ve raporlama , analitik , görselleştirme gibi çeşitli görevler için kullanmasıdır. Aslında Data Lake bir bir teknoloji önermez, yalnızca gereksinimler. Data Lakes genellikle Hadoop’la ele alınabilir ama aslında …
Arkadaşlar Merhaba Bugün size Big data Teknolojileri üzerinde Processing tarafındaki çok önemli bir teknolojiden bahsedeceğim. Daha önceki yazılarımda Hive ve Spark tan bu alanda bahsetmiştim. Hive Analytics tarafında , Pig ETL tarafında , Spark Real Time Analytics , Machine Learning …
Merhaba arkadaşlar. Hadoop platformu içerisinde çıktığı ilk günden bu yana en önemli servislerden biri Hive dersek yanılmamış oluruz. Hive bugune kadar bir çok şirkette modern Datawarehouse yapılanmasında inanılmaz avantajlar sundu. Kimi zaman performans sorunları ile eleştiriler olsada Hive ‘ın tune …
Sevgili Dostlarım Big Data üzerinde bütün Cloud servis sağlıyacalarının sahane çözümleri ile karşı karşıyayız. Bu yazımda Amazon AWS nin bir takım önemli ürünlerinden bahsedeceğim. Bu yazımda AWS servislerinin hepsini ele almam mümkün değil onlar hakkında da yakında açıklamalar yapmaya çalışacağım. …
Gerek Data Science eğitimlerinde , Yapay zeka çalışmalarında hatta klasik database yönetiminde python dili son derece önemli. Hazır sağladığı paketleri kullanım ve öğrenim kolaylıkları ile beraber en iyi diller arasında sürekli yükselişte. Python dili ile ilgili birbirine benzeyen ama dikkat …
Data Scientist Kimdir? Bir kaç farklı tanımı var ama en beğendiğim bir iki tanımlamayı buraya yazmak istedim. What is Data science? ‘Building software products (aka data products) whose core functionality relies on applying statistical or Machine learning methods to data.’ …
Data Scientist olmak için neler yapmalı? Arkadaşlar bildiğiniz gibi data scientist çağımızın en önemli IT işlerinin başında geliyor. Çoğumuz bu konularda bir dönüşümün içine giriyoruz. Bu dönüşüm ve gelişim süreçini başarı ile atlatmak ve fark yaratmak için yapılması gerekenleri kendime …
Merhaba arkadaşlar Öncelikle verileri hangi amaçla kullanacağımıza karar verelim. İki temel kullanım yöntemini inceleyelim. 1-Analitik kullanım Amaç geleceğe doğru yapacağımız seçimler ise batched olarak gelen veriler , son derece büyük veriler üzerinden yapılan hesaplamaları analitik olarak değerlendirebiliriz. 2-Operasyonel kullanım Amaç …