Derin Öğrenmeye Giriş: Yapay Sinir Ağlarının Arkasındaki Matematik
Yapay sinir ağları, temelde yüksek boyutlu matris çarpımları ve türev tabanlı optimizasyonlardan oluşan matematiksel yapılardır. Gelişmiş yapay zeka modellerinin nasıl öğrendiğini anlamak için lineer cebir ve kalkülüs kurallarını bilmek gerekir. Bu yazıda, geriye yayılımın (backpropagation) matematiksel türetimini inceleyeceğiz.
İleri Besleme (Forward Propagation) ve Aktivasyon
Girdiler (X), ağırlıklar (W) ile çarpılıp sapma (bias) değeri eklendikten sonra doğrusal olmayan (non-linear) bir aktivasyon fonksiyonundan (ReLU, Sigmoid vb.) geçirilir. Bu doğrusal olmama durumu, ağın karmaşık, doğrusal olmayan ilişkileri öğrenmesini sağlar:
[z = W cdot X + b]
[a = sigma(z)]
Hata Azaltma ve Geriye Yayılım (Backpropagation)
Modelin tahmin hatası (Loss), gradyan inişi (gradient descent) yöntemi ve zincir kuralı (chain rule) kullanılarak ağdaki tüm ağırlıklara göre türetilir. Her geriye yayılım adımında, ağırlıklar hata yönünün tersine doğru güncellenerek modelin doğruluk oranı artırılır.