Bu program YILDIZ TEKNİK ÜNİVERSİTESİ ve OPENHUB ortaklığıyla düzenlenmektedir.
Veri Mühendisliği Eğitim Programı
Veri Mühendisliği Eğitim Programı
Bilgi İste

Lütfen bir kurs tarihi seçin

Tüm sorularınız için : 0 212 259 57 58 veya info@openhub.com.tr

Program Detayları

Bu programın amacı, kurumsal verinin alt yapısını (veri tabanı, veri depoları ve veri hatları da dahil olmak üzere) analizlerde kullanılmak için gereken teknik becerileri kazandırmaktadır.

 

 

Veri Mühendisliği Eğitim Programı Konu Başlıkları

Bölüm 1: Veri Mühendisliğine Giriş
  • Veri mühendisliği nedir?
  • Veri mühendisinin görevleri
  • Veri mühendisliği sorunları
  • Veri mühendisinin araçları
  • Veritabanı türleri
  • İşleme görevleri
  • Planlama araçları
  • Bulut sağlayıcıları
  • Bulut bilişim ve bulut bilişimde büyük oyuncular
  • Bulut hizmetleri
Bölüm 2: Veri Mühendisliği Araçları
  • Veritabanları
  • SQL ve NoSQL
  • Veritabanı şeması
  • Yıldız şema diyagramı
  • Paralel hesaplama nedir
  • DataFrame kullanma
  • Paralel hesaplama çerçeveleri
  • Kıvılcım, Hadoop ve Kovan
  • Bir PySpark grubu
  • PySpark dosyalarını çalıştırma
  • İş akışı planlama çerçeveleri
Bölüm 3: Numpy Kütüphanesi ile Hesaplama
  • NumPy Dizilerine İlk Bakış
  • NumPy Dizisindeki Elemanları İndeksleme
  • NumPy Dizileri
  • Türleri Anlamak
  • Yeniden Şekillendirme
  • Yaygın Olarak Kullanılan Dizi Metrikleri
  • Yaygın Olarak Kullanılan Toplama İşlevleri
  • Dizileri Sıralama
  • Dizi Aritmetik İşlemleri
  • Dizi Dilimleme
  • 2-D Dizi Dilimleme
  • Doğrusal Cebir Fonksiyonları
Bölüm 4: Pandas ile Veri

 

  • Pandas Nedir?
  • Seri ve Serideki Değerlere ve Dizinlere Erişim
  • Endeks Oluşturmak
  • DataFrame Nesnesi
  • DataFrame'in Değer Önerisi
  • DataFrame Oluşturma
  • DataFrame Metriklerini Alma
  • DataFrame Sütunlarına, Satırlarına ve Hücrelerine Erişim
  • DataFrame ve Seri Nesnelerini Ekleme / Birleştirme
  • DataFrame Ekleme / Birleştirme Örneği
  • Serileri ve Veri Çerçevelerini Yeniden İndeksleme
  • DataFrame Sütunlarının Açıklayıcı İstatistiklerini Alma
  • DataFrame'lerin Açıklayıcı İstatistiklerini Alma
  • Bir Fonksiyonun Uygulanması
  • Veri Çerçevelerini Sıralama
  • CSV Dosyalarından Okuma
  • Sistem Panosuna Yazma
  • CSV Dosyasına Yazmak
  • Veri Toplama ve Gruplama
  • Örnek Veri Kümesi
  • Özet Tablolar
  • Çapraz tablolama
Bölüm 5: Python'da Veri Görselleştirme
  • Veri goruntuleme
  • Python'da Veri Görselleştirme
  • Matplotlib
  • Matplotlib.pyplot.plot () İşlevi
  • Matplotlib.pyplot.bar () İşlevi
  • Matplotlib.pyplot.pie () İşlevi
  • Alt noktalar
  • Matplotlib.gridspec.GridSpec Nesnesini Kullanma
  • Matplotlib.pyplot.subplot () İşlevi
  • Rakamlar
  • Şekilleri Dosyaya Kaydetme
  • Histogramlar
  • İki Değişkenli Dağılımların Grafiklendirilmesi
Bölüm 6: Veri Madenciliği

 

  •  Veri Madenciliği nedir?
  •  Apriori algoritması
  •  Sık örüntü ağaçları
  •  Sınıflandırma ve Tahmin
  •  Bayes Sınıflandırma
  •  Ağaç tabanlı sınıflandırma
  •  Destek Vektör Makineleri
  •  Doğruluk ve Hata ölçüleri
  •  Kümeleme
  •  Önemli Kümeleme Yöntemleri
  •  Veri Madenciliği uygulamaları
Bölüm 7: Makine Öğrenmesi
  • Makine öğrenmesine giriş
  • Basit kavram öğrenmesi
  • Karar verme ağaçları öğrenmesi
  • Neron ağları
  • Bayes öğrenmesi
  • Naive-Bayes Sınıflandırıcısı
  • En-yakın n-komşu algoritması
  • Karar-destek vektörleri
  • Regresyon
  • Genetik algoritmalar
  • Kapsama algoritması, Birince-Derece Kural Öğrenmesi
Bölüm 8: Apache Spark'a Giriş

 

  • Apache Spark nedir
  • Spark Platformu
  • Spark ve Hadoop'un MapReduce (MR) Karşılaştırması
  • Spark Tarafından Desteklenen Diller
  • Spark'ı Küme Üzerinde Çalıştırma
  • Spark Uygulama Mimarisi
  • Spark Uygulamaları
  • Spark-submit Alet Yapılandırması
  • Veri Depolama Sistemleri ile Arayüzler
  • Veri Kümeleri ve Veri Çerçeveleri
  • Spark SQL, DataFrames ve Catalyst Optimizer
  • Spark Makine Öğrenimi Kitaplığı
Bölüm 9: Apache Airflow Web Kullanıcı Arayüzü
  • Web Kullanıcı Arayüzü - Açılış (DAG'ler) Sayfası
  • Web Kullanıcı Arayüzü - DAG Grafik Görünümü
  • Durum Göstergelerini Çalıştır
  • Duraklat Düğmesi (Tetik Mandalı)
  • DAG Tetikleme / İş Kontrol Sırası
  • Görev için Kontrol Paneli
Genel Bilgi

Bu programın amacı, kurumsal verinin alt yapısını (veri tabanı, veri depoları ve veri hatları da dahil olmak üzere) analizlerde kullanılmak için gereken teknik becerileri kazandırmaktadır.

 

 

Veri Mühendisliği Eğitim Programı Konu Başlıkları

Bölüm 1: Veri Mühendisliğine Giriş
  • Veri mühendisliği nedir?
  • Veri mühendisinin görevleri
  • Veri mühendisliği sorunları
  • Veri mühendisinin araçları
  • Veritabanı türleri
  • İşleme görevleri
  • Planlama araçları
  • Bulut sağlayıcıları
  • Bulut bilişim ve bulut bilişimde büyük oyuncular
  • Bulut hizmetleri
Bölüm 2: Veri Mühendisliği Araçları
  • Veritabanları
  • SQL ve NoSQL
  • Veritabanı şeması
  • Yıldız şema diyagramı
  • Paralel hesaplama nedir
  • DataFrame kullanma
  • Paralel hesaplama çerçeveleri
  • Kıvılcım, Hadoop ve Kovan
  • Bir PySpark grubu
  • PySpark dosyalarını çalıştırma
  • İş akışı planlama çerçeveleri
Bölüm 3: Numpy Kütüphanesi ile Hesaplama
  • NumPy Dizilerine İlk Bakış
  • NumPy Dizisindeki Elemanları İndeksleme
  • NumPy Dizileri
  • Türleri Anlamak
  • Yeniden Şekillendirme
  • Yaygın Olarak Kullanılan Dizi Metrikleri
  • Yaygın Olarak Kullanılan Toplama İşlevleri
  • Dizileri Sıralama
  • Dizi Aritmetik İşlemleri
  • Dizi Dilimleme
  • 2-D Dizi Dilimleme
  • Doğrusal Cebir Fonksiyonları
Bölüm 4: Pandas ile Veri

 

  • Pandas Nedir?
  • Seri ve Serideki Değerlere ve Dizinlere Erişim
  • Endeks Oluşturmak
  • DataFrame Nesnesi
  • DataFrame'in Değer Önerisi
  • DataFrame Oluşturma
  • DataFrame Metriklerini Alma
  • DataFrame Sütunlarına, Satırlarına ve Hücrelerine Erişim
  • DataFrame ve Seri Nesnelerini Ekleme / Birleştirme
  • DataFrame Ekleme / Birleştirme Örneği
  • Serileri ve Veri Çerçevelerini Yeniden İndeksleme
  • DataFrame Sütunlarının Açıklayıcı İstatistiklerini Alma
  • DataFrame'lerin Açıklayıcı İstatistiklerini Alma
  • Bir Fonksiyonun Uygulanması
  • Veri Çerçevelerini Sıralama
  • CSV Dosyalarından Okuma
  • Sistem Panosuna Yazma
  • CSV Dosyasına Yazmak
  • Veri Toplama ve Gruplama
  • Örnek Veri Kümesi
  • Özet Tablolar
  • Çapraz tablolama
Bölüm 5: Python'da Veri Görselleştirme
  • Veri goruntuleme
  • Python'da Veri Görselleştirme
  • Matplotlib
  • Matplotlib.pyplot.plot () İşlevi
  • Matplotlib.pyplot.bar () İşlevi
  • Matplotlib.pyplot.pie () İşlevi
  • Alt noktalar
  • Matplotlib.gridspec.GridSpec Nesnesini Kullanma
  • Matplotlib.pyplot.subplot () İşlevi
  • Rakamlar
  • Şekilleri Dosyaya Kaydetme
  • Histogramlar
  • İki Değişkenli Dağılımların Grafiklendirilmesi
Bölüm 6: Veri Madenciliği

 

  •  Veri Madenciliği nedir?
  •  Apriori algoritması
  •  Sık örüntü ağaçları
  •  Sınıflandırma ve Tahmin
  •  Bayes Sınıflandırma
  •  Ağaç tabanlı sınıflandırma
  •  Destek Vektör Makineleri
  •  Doğruluk ve Hata ölçüleri
  •  Kümeleme
  •  Önemli Kümeleme Yöntemleri
  •  Veri Madenciliği uygulamaları
Bölüm 7: Makine Öğrenmesi
  • Makine öğrenmesine giriş
  • Basit kavram öğrenmesi
  • Karar verme ağaçları öğrenmesi
  • Neron ağları
  • Bayes öğrenmesi
  • Naive-Bayes Sınıflandırıcısı
  • En-yakın n-komşu algoritması
  • Karar-destek vektörleri
  • Regresyon
  • Genetik algoritmalar
  • Kapsama algoritması, Birince-Derece Kural Öğrenmesi
Bölüm 8: Apache Spark'a Giriş

 

  • Apache Spark nedir
  • Spark Platformu
  • Spark ve Hadoop'un MapReduce (MR) Karşılaştırması
  • Spark Tarafından Desteklenen Diller
  • Spark'ı Küme Üzerinde Çalıştırma
  • Spark Uygulama Mimarisi
  • Spark Uygulamaları
  • Spark-submit Alet Yapılandırması
  • Veri Depolama Sistemleri ile Arayüzler
  • Veri Kümeleri ve Veri Çerçeveleri
  • Spark SQL, DataFrames ve Catalyst Optimizer
  • Spark Makine Öğrenimi Kitaplığı
Bölüm 9: Apache Airflow Web Kullanıcı Arayüzü
  • Web Kullanıcı Arayüzü - Açılış (DAG'ler) Sayfası
  • Web Kullanıcı Arayüzü - DAG Grafik Görünümü
  • Durum Göstergelerini Çalıştır
  • Duraklat Düğmesi (Tetik Mandalı)
  • DAG Tetikleme / İş Kontrol Sırası
  • Görev için Kontrol Paneli

Eğitim Yaklaşımı

Veri Mühendisliği Sertifika Programı Neyi Amaçlar?

Belirsizliğin yoğun olduğu ortamda veri odaklı karar almak için sistematik bilgi birikimi ve veri güvenliğine duyulan ihtiyaç artmaktadır. Verinin ETL (extract, transfer,load) sürecinde, programlama dili ve veri ambarı çözümleri ile sistematik bir yapıya oluşturulması için gereken teknik becerilerin geliştirilmesi hedeflenmiştir.

Neler Öğreneceksiniz

Program sonunda;

  • Veri yığınlarını anlamlandırarak karar mekanizmalarını güçlendireceksiniz.
  • Rekabet stratejilerini belirleyecek anlamlı bilgilere ulaşacaksınız.
  • İş zekası modellerini tanıyarak en verimli iş modelini belirleyeceksiniz.
  • Üretim süreçlerinin optimizasyonuna ilişkin detaylı bilgileri öğreneceksiniz.

Sınav / Sertifika

  • Eğitim sonunda yapılan sınavda başarılı olan katılımcılar “Uzmanlık Sertifikası” almaya hak kazanacaktır.
  • Sınavda başarı gösteremeyen katılımcılar “Katılım Sertifikası” almaktadır. 
  • Programda %70 devam zorunluluğu bulunmaktadır.