Yapay Zeka (YZ) Temelleri: Makine Öğrenimi Algoritmaları

Deniz2 saat önce

5 dakika okuma süresi

Makine öğrenimi algoritmalarını ve yapay zeka teknolojisinin temellerini temsil eden, bilgisayar ekranında akan dijital veri ağları ve kod satırlarının soyut görseli.

Yapay Zeka (YZ) Temelleri: Makine Öğrenimi Algoritmaları, bir bilgisayar sisteminin verileri analiz ederek bu verilerden öğrenmesini, kalıpları tanımasını ve minimum insan müdahalesi ile kararlar vermesini sağlayan matematiksel modellemeler bütünüdür. Geleneksel programlamanın aksine, makine öğrenimi algoritmaları belirli bir görevi yerine getirmek için adım adım talimatlara ihtiyaç duymaz; bunun yerine veriyi kullanarak kendi mantığını geliştirir. Bu teknoloji, bugün kullandığımız sesli asistanlardan otonom araçlara, tıbbi teşhislerden finansal tahminlere kadar modern dünyanın dijital altyapısını oluşturmaktadır.

🎯 Bu Derste Öğrenecekleriniz

Makine öğreniminin temel çalışma prensiplerini kavrayacaksınız.
Denetimli, denetimsiz ve takviyeli öğrenme arasındaki farkları öğreneceksiniz.
En yaygın kullanılan temel algoritmaların mantığını anlayacaksınız.
Bir yapay zeka modelinin eğitim aşamalarını adım adım göreceksiniz.
Gerçek dünya uygulamalarında hangi algoritmanın neden seçildiğini analiz edebileceksiniz.

📌 Bu Konuda Bilmeniz Gerekenler

Veri Her Şeydir: Algoritmalar, ne kadar kaliteli ve çok veriyle beslenirse o kadar doğru sonuçlar verir.
Algoritma Seçimi: Her problem için tek bir “en iyi” algoritma yoktur; veri setine göre seçim yapılır.
Eğitim ve Test: Modeller önce öğrenir (eğitim), sonra başarısı ölçülür (test).
Sürekli Gelişim: Makine öğrenimi dinamik bir süreçtir, yeni verilerle model güncellenmelidir.

İçerik göster

Makine Öğrenimi Dünyasına Giriş

Makine öğrenimi, yapay zekanın bir alt dalı olarak kabul edilir ve temel amacı bilgisayarlara “öğrenme” yetisi kazandırmaktır. Klasik yazılım yöntemlerinde bir yazılımcı, sisteme “Eğer A olursa B yap” şeklinde kurallar yazar. Ancak makine öğreniminde sisteme binlerce “A” ve “B” örneği verilir; sistem bu ikisi arasındaki ilişkiyi kendisi keşfeder. Bu durum, karmaşık problemlerin çözümünde insan zekasını taklit eden bir yaklaşım sunar.

Makine öğrenimi algoritmaları, büyük veri yığınları içerisindeki gizli yapıları ortaya çıkarmak için istatistiksel yöntemleri kullanır. Örneğin, binlerce kedi ve köpek fotoğrafını inceleyen bir algoritma, kulak yapısı, burun şekli veya tüy dokusu gibi özellikleri analiz ederek yeni bir fotoğraf gördüğünde onun ne olduğunu yüksek doğrulukla tahmin edebilir. Bu süreç, temelde verinin matematiksel bir fonksiyona dönüştürülmesidir.

ℹ️ Bilgi: Makine öğrenimi kavramı ilk kez 1959 yılında Arthur Samuel tarafından ortaya atılmıştır. Samuel, bu alanı “bilgisayarlara açıkça programlanmadan öğrenme yeteneği kazandıran çalışma alanı” olarak tanımlamıştır.

Temel Öğrenme Yöntemleri ve Kategoriler

Makine öğrenimi algoritmaları, öğrenme biçimlerine göre üç ana kategoriye ayrılır. Her kategorinin kendine has bir çalışma mantığı ve kullanım alanı bulunmaktadır. Bu yöntemleri anlamak, hangi problemin hangi algoritma ile çözüleceğini belirlemek açısından kritiktir.

1. Denetimli Öğrenme (Supervised Learning)

Denetimli öğrenme, modelin “etiketli” bir veri seti üzerinden eğitildiği yöntemdir. Burada sisteme hem giriş verileri hem de bu verilerin doğru sonuçları (etiketleri) verilir. Bir öğretmenin öğrenciye soruları ve cevaplarını göstererek öğretmesine benzer. Algoritma, girdiler ile çıktılar arasındaki ilişkiyi kurar ve daha önce hiç görmediği bir veri geldiğinde doğru etiketi tahmin etmeye çalışır.

2. Denetimsiz Öğrenme (Unsupervised Learning)

Bu yöntemde veriler etiketlenmemiştir. Algoritmaya sonuçlar söylenmez; sistemden verilerdeki gizli yapıları, benzerlikleri veya farklılıkları kendi başına bulması istenir. Genellikle veri keşfi ve müşteri segmentasyonu gibi alanlarda tercih edilir. Algoritma, verileri özelliklerine göre gruplandırarak (kümeleme) anlamlı çıktılar üretir.

3. Takviyeli Öğrenme (Reinforcement Learning)

Takviyeli öğrenme, bir ajanın (programın) bir ortam içerisinde deneme-yanılma yoluyla öğrenmesidir. Ajan, doğru bir hamle yaptığında ödüllendirilir, yanlış bir hamle yaptığında ise cezalandırılır. Zamanla toplam ödülü maksimize edecek stratejiyi geliştirir. Satranç oynayan yapay zekalar veya otonom robotların yürüme öğrenmesi bu kategoriye girer.

Özellik	Denetimli Öğrenme	Denetimsiz Öğrenme	Takviyeli Öğrenme
Veri Tipi	Etiketli Veri	Etiketsiz Veri	Etkileşimli Veri
Hedef	Sonuç Tahmini	Yapı Keşfi	Strateji Geliştirme
Örnek	Spam Filtreleme	Müşteri Gruplama	Oyun Botları

En Popüler Makine Öğrenimi Algoritmaları

Algoritmalar, makine öğrenimi modellerinin motorlarıdır. Veriyi işleyip bilgiye dönüştüren bu matematiksel yapılar, problemin türüne göre farklılık gösterir. İşte her öğrencinin bilmesi gereken temel algoritmalar:

Lineer Regresyon (Linear Regression)

Sayısal bir değeri tahmin etmek için kullanılan en temel denetimli öğrenme algoritmasıdır. Örneğin, bir evin metrekaresi, oda sayısı ve konumu gibi özelliklere bakarak fiyatını tahmin etmek için kullanılır. Veriler arasındaki ilişkiyi doğrusal bir çizgi ile ifade etmeye çalışır. Matematiksel olarak y = ax + b formülüne dayanır.

Lojistik Regresyon (Logistic Regression)

İsminde regresyon geçse de aslında bir sınıflandırma algoritmasıdır. Bir verinin belirli bir kategoriye ait olup olmadığını (Evet/Hayır, 0/1) tahmin eder. Örneğin, bir banka işleminin dolandırıcılık olup olmadığını veya bir hastanın belirli bir hastalığa sahip olup olmadığını belirlemek için kullanılır. Sonuçları 0 ile 1 arasında bir olasılık değeri olarak döndürür.

Karar Ağaçları (Decision Trees)

Veriyi belirli sorular sorarak dallara ayıran bir yapıdır. Akış şemasına benzer şekilde çalışır. Her düğüm bir özelliği temsil eder, dallar karar kurallarını gösterir ve yapraklar ise sonucu belirtir. Hem sınıflandırma hem de regresyon problemlerinde kullanılabilir. İnsan mantığına en yakın algoritmalardan biridir.

📖 Örnek: Karar Ağacı ile Oyun Kararı

Bir çocuğun dışarıda oyun oynayıp oynamayacağına karar veren basit bir model düşünelim:
1. Hava güneşli mi? (Evet ise devam et, Hayır ise oynama)
2. Sıcaklık çok mu yüksek? (Evet ise oynama, Hayır ise oyna).
Bu basit mantık dizisi, karmaşık verilerde binlerce dala ayrılarak devasa karar mekanizmaları oluşturur.

K-En Yakın Komşu (K-Nearest Neighbors – KNN)

Bu algoritma, “Bana arkadaşını söyle, sana kim olduğunu söyleyeyim” mantığıyla çalışır. Yeni bir veri geldiğinde, bu verinin mevcut veri setindeki en yakın komşularına bakılır. Eğer komşuların çoğunluğu “A” grubundaysa, yeni veri de “A” grubuna dahil edilir. Mesafe hesaplamaları için genellikle Öklid mesafesi kullanılır.

Rastgele Orman (Random Forest)

Tek bir karar ağacı yerine, yüzlerce farklı karar ağacının bir araya gelerek oluşturduğu bir topluluktur. Her ağaç kendi sonucunu üretir ve en çok oy alan sonuç nihai karar olarak kabul edilir. Bu yöntem, modelin hata payını düşürür ve daha güvenilir tahminler yapılmasını sağlar.

Python ile Basit Lineer Regresyon Örneği

from sklearn.linear_model import LinearRegression
import numpy as np

# Veri setini hazırla (Örn: Ev m2 ve Fiyat)
X = np.array([[50], [80], [100], [150]]) # Metrekare
y = np.array([200, 350, 450, 650])      # Fiyat

# Modeli oluştur ve eğit
model = LinearRegression()
model.fit(X, y)

# Yeni bir ev için fiyat tahmini yap
tahmin = model.predict([[120]])
print(f"120 m2 evin tahmini fiyatı: {tahmin[0]}")

Veri Hazırlama ve Model Eğitimi Süreci

Bir makine öğrenimi projesinde algoritma seçimi kadar önemli olan bir diğer adım da verinin hazırlanmasıdır. Ham veri genellikle gürültülüdür ve doğrudan kullanıma uygun değildir. Başarılı bir model oluşturmak için şu adımlar izlenir:

Veri Toplama: Problemi çözecek yeterli miktarda veri bir araya getirilir.

Veri Temizleme: Eksik değerler tamamlanır, hatalı veya aykırı veriler ayıklanır.

Özellik Seçimi: Tahmin üzerinde en etkili olan değişkenler belirlenir.

Veriyi Bölme: Veri seti genellikle %80 eğitim ve %20 test olarak ikiye ayrılır.

Eğitim ve Değerlendirme: Algoritma eğitim verisiyle öğrenir, test verisiyle başarısı ölçülür.

⚠️ Dikkat: Aşırı Öğrenme (Overfitting), bir modelin eğitim verilerini ezberlemesi ancak yeni verilerde başarısız olması durumudur. Modelin genel kuralları öğrenmesi, veriyi ezberlememesi gerekir.

💡 İpucu: Bir modelin başarısını ölçerken sadece doğruluğa (accuracy) bakmak bazen yanıltıcı olabilir. Özellikle dengesiz veri setlerinde “Hassasiyet” (Precision) ve “Duyarlılık” (Recall) metriklerini de kontrol etmelisiniz.

Gerçek Dünya Uygulamaları

Makine öğrenimi algoritmaları hayatımızın her köşesinde sessizce çalışmaktadır. E-posta kutunuza düşen bir mesajın “Gelen Kutusu”na mı yoksa “Spam” klasörüne mi gideceğine Lojistik Regresyon gibi sınıflandırma algoritmaları karar verir. Netflix veya YouTube’da karşınıza çıkan “Sizin için önerilenler” listesi, geçmiş izleme alışkanlıklarınızı analiz eden denetimsiz öğrenme ve işbirlikçi filtreleme yöntemlerinin bir ürünüdür.

Sağlık sektöründe, binlerce röntgen görüntüsünü inceleyen derin öğrenme algoritmaları, doktorların gözden kaçırabileceği tümörleri tespit edebilmektedir. Finans dünyasında ise borsa hareketlerini tahmin etmek veya kredi başvurularının risk analizini yapmak için gelişmiş regresyon ve topluluk (ensemble) algoritmaları kullanılmaktadır. Bu teknolojiler, insan kapasitesini aşan veri yığınlarını saniyeler içinde işleyerek verimliliği artırır.

Öğrendiklerinizi Pekiştirin

Yapay zeka ve makine öğrenimi alanında uzmanlaşmak için sadece teorik bilgi yeterli değildir. Kendi veri setlerinizi oluşturmalı, farklı algoritmaları denemeli ve modellerin neden hata yaptığını analiz etmelisiniz. Python dili ve Scikit-learn kütüphanesi, bu yolculuğa başlamak için en popüler ve kullanıcı dostu araçlardır. Unutmayın, en karmaşık yapay zeka sistemleri bile temel matematiksel kuralların ve mantıklı veri işleme adımlarının birleşimiyle inşa edilir.

✏️ Kendinizi Test Edin

Denetimli öğrenme ile denetimsiz öğrenme arasındaki en temel fark nedir?
Bir evin satış fiyatını tahmin etmek istiyorsanız hangi tür algoritmayı kullanmalısınız?
Aşırı öğrenme (Overfitting) problemi bir modelin gelecekteki performansını nasıl etkiler?
Karar ağaçları algoritmasının en büyük avantajı sizce nedir?
K-En Yakın Komşu algoritmasında “mesafe” kavramı neden önemlidir?

📝 Konu Özeti

Makine öğrenimi, verilerden kurallar çıkaran bir yapay zeka alt dalıdır.
Temel yöntemler: Denetimli, Denetimsiz ve Takviyeli öğrenmedir.
Regresyon sayısal tahminler için, Sınıflandırma ise kategorize etme için kullanılır.
Modelin başarısı için verinin temizlenmesi ve doğru bölünmesi hayati önem taşır.
Algoritmalar gerçek hayatta öneri sistemlerinden sağlık teşhislerine kadar geniş bir yelpazede kullanılır.

Etiketler