Yapay Zeka (YZ) Temelleri: Makine Öğrenimi Algoritmaları

Yapay Zeka (YZ) Temelleri: Makine Öğrenimi Algoritmaları, bir bilgisayar sisteminin verileri analiz ederek bu verilerden öğrenmesini, kalıpları tanımasını ve minimum insan müdahalesi ile kararlar vermesini sağlayan matematiksel modellemeler bütünüdür. Geleneksel programlamanın aksine, makine öğrenimi algoritmaları belirli bir görevi yerine getirmek için adım adım talimatlara ihtiyaç duymaz; bunun yerine veriyi kullanarak kendi mantığını geliştirir. Bu teknoloji, bugün kullandığımız sesli asistanlardan otonom araçlara, tıbbi teşhislerden finansal tahminlere kadar modern dünyanın dijital altyapısını oluşturmaktadır.
- Makine öğreniminin temel çalışma prensiplerini kavrayacaksınız.
- Denetimli, denetimsiz ve takviyeli öğrenme arasındaki farkları öğreneceksiniz.
- En yaygın kullanılan temel algoritmaların mantığını anlayacaksınız.
- Bir yapay zeka modelinin eğitim aşamalarını adım adım göreceksiniz.
- Gerçek dünya uygulamalarında hangi algoritmanın neden seçildiğini analiz edebileceksiniz.
- Veri Her Şeydir: Algoritmalar, ne kadar kaliteli ve çok veriyle beslenirse o kadar doğru sonuçlar verir.
- Algoritma Seçimi: Her problem için tek bir “en iyi” algoritma yoktur; veri setine göre seçim yapılır.
- Eğitim ve Test: Modeller önce öğrenir (eğitim), sonra başarısı ölçülür (test).
- Sürekli Gelişim: Makine öğrenimi dinamik bir süreçtir, yeni verilerle model güncellenmelidir.
Makine Öğrenimi Dünyasına Giriş
Makine öğrenimi, yapay zekanın bir alt dalı olarak kabul edilir ve temel amacı bilgisayarlara “öğrenme” yetisi kazandırmaktır. Klasik yazılım yöntemlerinde bir yazılımcı, sisteme “Eğer A olursa B yap” şeklinde kurallar yazar. Ancak makine öğreniminde sisteme binlerce “A” ve “B” örneği verilir; sistem bu ikisi arasındaki ilişkiyi kendisi keşfeder. Bu durum, karmaşık problemlerin çözümünde insan zekasını taklit eden bir yaklaşım sunar.
Makine öğrenimi algoritmaları, büyük veri yığınları içerisindeki gizli yapıları ortaya çıkarmak için istatistiksel yöntemleri kullanır. Örneğin, binlerce kedi ve köpek fotoğrafını inceleyen bir algoritma, kulak yapısı, burun şekli veya tüy dokusu gibi özellikleri analiz ederek yeni bir fotoğraf gördüğünde onun ne olduğunu yüksek doğrulukla tahmin edebilir. Bu süreç, temelde verinin matematiksel bir fonksiyona dönüştürülmesidir.
Temel Öğrenme Yöntemleri ve Kategoriler
Makine öğrenimi algoritmaları, öğrenme biçimlerine göre üç ana kategoriye ayrılır. Her kategorinin kendine has bir çalışma mantığı ve kullanım alanı bulunmaktadır. Bu yöntemleri anlamak, hangi problemin hangi algoritma ile çözüleceğini belirlemek açısından kritiktir.
1. Denetimli Öğrenme (Supervised Learning)
Denetimli öğrenme, modelin “etiketli” bir veri seti üzerinden eğitildiği yöntemdir. Burada sisteme hem giriş verileri hem de bu verilerin doğru sonuçları (etiketleri) verilir. Bir öğretmenin öğrenciye soruları ve cevaplarını göstererek öğretmesine benzer. Algoritma, girdiler ile çıktılar arasındaki ilişkiyi kurar ve daha önce hiç görmediği bir veri geldiğinde doğru etiketi tahmin etmeye çalışır.
2. Denetimsiz Öğrenme (Unsupervised Learning)
Bu yöntemde veriler etiketlenmemiştir. Algoritmaya sonuçlar söylenmez; sistemden verilerdeki gizli yapıları, benzerlikleri veya farklılıkları kendi başına bulması istenir. Genellikle veri keşfi ve müşteri segmentasyonu gibi alanlarda tercih edilir. Algoritma, verileri özelliklerine göre gruplandırarak (kümeleme) anlamlı çıktılar üretir.
3. Takviyeli Öğrenme (Reinforcement Learning)
Takviyeli öğrenme, bir ajanın (programın) bir ortam içerisinde deneme-yanılma yoluyla öğrenmesidir. Ajan, doğru bir hamle yaptığında ödüllendirilir, yanlış bir hamle yaptığında ise cezalandırılır. Zamanla toplam ödülü maksimize edecek stratejiyi geliştirir. Satranç oynayan yapay zekalar veya otonom robotların yürüme öğrenmesi bu kategoriye girer.
| Özellik | Denetimli Öğrenme | Denetimsiz Öğrenme | Takviyeli Öğrenme |
|---|---|---|---|
| Veri Tipi | Etiketli Veri | Etiketsiz Veri | Etkileşimli Veri |
| Hedef | Sonuç Tahmini | Yapı Keşfi | Strateji Geliştirme |
| Örnek | Spam Filtreleme | Müşteri Gruplama | Oyun Botları |
En Popüler Makine Öğrenimi Algoritmaları
Algoritmalar, makine öğrenimi modellerinin motorlarıdır. Veriyi işleyip bilgiye dönüştüren bu matematiksel yapılar, problemin türüne göre farklılık gösterir. İşte her öğrencinin bilmesi gereken temel algoritmalar:
Lineer Regresyon (Linear Regression)
Sayısal bir değeri tahmin etmek için kullanılan en temel denetimli öğrenme algoritmasıdır. Örneğin, bir evin metrekaresi, oda sayısı ve konumu gibi özelliklere bakarak fiyatını tahmin etmek için kullanılır. Veriler arasındaki ilişkiyi doğrusal bir çizgi ile ifade etmeye çalışır. Matematiksel olarak y = ax + b formülüne dayanır.
Lojistik Regresyon (Logistic Regression)
İsminde regresyon geçse de aslında bir sınıflandırma algoritmasıdır. Bir verinin belirli bir kategoriye ait olup olmadığını (Evet/Hayır, 0/1) tahmin eder. Örneğin, bir banka işleminin dolandırıcılık olup olmadığını veya bir hastanın belirli bir hastalığa sahip olup olmadığını belirlemek için kullanılır. Sonuçları 0 ile 1 arasında bir olasılık değeri olarak döndürür.
Karar Ağaçları (Decision Trees)
Veriyi belirli sorular sorarak dallara ayıran bir yapıdır. Akış şemasına benzer şekilde çalışır. Her düğüm bir özelliği temsil eder, dallar karar kurallarını gösterir ve yapraklar ise sonucu belirtir. Hem sınıflandırma hem de regresyon problemlerinde kullanılabilir. İnsan mantığına en yakın algoritmalardan biridir.
Bir çocuğun dışarıda oyun oynayıp oynamayacağına karar veren basit bir model düşünelim:
1. Hava güneşli mi? (Evet ise devam et, Hayır ise oynama)
2. Sıcaklık çok mu yüksek? (Evet ise oynama, Hayır ise oyna).
Bu basit mantık dizisi, karmaşık verilerde binlerce dala ayrılarak devasa karar mekanizmaları oluşturur.
K-En Yakın Komşu (K-Nearest Neighbors – KNN)
Bu algoritma, “Bana arkadaşını söyle, sana kim olduğunu söyleyeyim” mantığıyla çalışır. Yeni bir veri geldiğinde, bu verinin mevcut veri setindeki en yakın komşularına bakılır. Eğer komşuların çoğunluğu “A” grubundaysa, yeni veri de “A” grubuna dahil edilir. Mesafe hesaplamaları için genellikle Öklid mesafesi kullanılır.
Rastgele Orman (Random Forest)
Tek bir karar ağacı yerine, yüzlerce farklı karar ağacının bir araya gelerek oluşturduğu bir topluluktur. Her ağaç kendi sonucunu üretir ve en çok oy alan sonuç nihai karar olarak kabul edilir. Bu yöntem, modelin hata payını düşürür ve daha güvenilir tahminler yapılmasını sağlar.
from sklearn.linear_model import LinearRegression
import numpy as np
# Veri setini hazırla (Örn: Ev m2 ve Fiyat)
X = np.array([[50], [80], [100], [150]]) # Metrekare
y = np.array([200, 350, 450, 650]) # Fiyat
# Modeli oluştur ve eğit
model = LinearRegression()
model.fit(X, y)
# Yeni bir ev için fiyat tahmini yap
tahmin = model.predict([[120]])
print(f"120 m2 evin tahmini fiyatı: {tahmin[0]}")
Veri Hazırlama ve Model Eğitimi Süreci
Bir makine öğrenimi projesinde algoritma seçimi kadar önemli olan bir diğer adım da verinin hazırlanmasıdır. Ham veri genellikle gürültülüdür ve doğrudan kullanıma uygun değildir. Başarılı bir model oluşturmak için şu adımlar izlenir:
Gerçek Dünya Uygulamaları
Makine öğrenimi algoritmaları hayatımızın her köşesinde sessizce çalışmaktadır. E-posta kutunuza düşen bir mesajın “Gelen Kutusu”na mı yoksa “Spam” klasörüne mi gideceğine Lojistik Regresyon gibi sınıflandırma algoritmaları karar verir. Netflix veya YouTube’da karşınıza çıkan “Sizin için önerilenler” listesi, geçmiş izleme alışkanlıklarınızı analiz eden denetimsiz öğrenme ve işbirlikçi filtreleme yöntemlerinin bir ürünüdür.
Sağlık sektöründe, binlerce röntgen görüntüsünü inceleyen derin öğrenme algoritmaları, doktorların gözden kaçırabileceği tümörleri tespit edebilmektedir. Finans dünyasında ise borsa hareketlerini tahmin etmek veya kredi başvurularının risk analizini yapmak için gelişmiş regresyon ve topluluk (ensemble) algoritmaları kullanılmaktadır. Bu teknolojiler, insan kapasitesini aşan veri yığınlarını saniyeler içinde işleyerek verimliliği artırır.
Öğrendiklerinizi Pekiştirin
Yapay zeka ve makine öğrenimi alanında uzmanlaşmak için sadece teorik bilgi yeterli değildir. Kendi veri setlerinizi oluşturmalı, farklı algoritmaları denemeli ve modellerin neden hata yaptığını analiz etmelisiniz. Python dili ve Scikit-learn kütüphanesi, bu yolculuğa başlamak için en popüler ve kullanıcı dostu araçlardır. Unutmayın, en karmaşık yapay zeka sistemleri bile temel matematiksel kuralların ve mantıklı veri işleme adımlarının birleşimiyle inşa edilir.
- Denetimli öğrenme ile denetimsiz öğrenme arasındaki en temel fark nedir?
- Bir evin satış fiyatını tahmin etmek istiyorsanız hangi tür algoritmayı kullanmalısınız?
- Aşırı öğrenme (Overfitting) problemi bir modelin gelecekteki performansını nasıl etkiler?
- Karar ağaçları algoritmasının en büyük avantajı sizce nedir?
- K-En Yakın Komşu algoritmasında “mesafe” kavramı neden önemlidir?
- Makine öğrenimi, verilerden kurallar çıkaran bir yapay zeka alt dalıdır.
- Temel yöntemler: Denetimli, Denetimsiz ve Takviyeli öğrenmedir.
- Regresyon sayısal tahminler için, Sınıflandırma ise kategorize etme için kullanılır.
- Modelin başarısı için verinin temizlenmesi ve doğru bölünmesi hayati önem taşır.
- Algoritmalar gerçek hayatta öneri sistemlerinden sağlık teşhislerine kadar geniş bir yelpazede kullanılır.



