Makine Öğrenimi - Başlangıç

Makine öğrenimi, bilgisayarların araştırma verileri ve istatistik bilgilerinden öğrenmesini sağlar.

Makine öğrenimi, yapay zeka (AI) yönüne giden adımlardan biridir.

Makine öğrenimi, verileri analiz edebilen ve sonuçları öngörebilen bir programdır.

Nereden başlayalım?

Bu rehberde, matematik geri dönerek istatistik araştıracağız ve veri kümesine göre önemli değerleri nasıl hesaplayacağımızı öğreneceğiz.

Ayrıca, ihtiyacımız olan yanıtları elde etmek için çeşitli Python modüllerini nasıl kullanacağımızı öğreneceğiz.

Ayrıca, öğrendiklerimize dayanarak sonuçları öngörebilen fonksiyonlar yazmayı öğreneceğiz.

Veri kümesi

Bilgisayarlarda, veri kümesi her türlü veri kümelerini ifade eder. Bu, bir dizi veya tam bir veritabanı olabilen herhangi bir içerik olabilir.

Bir dizinin örneği:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

Bir veritabanı örneği:

Araç adı Renk Yaş Hız AutoPass
BMW kırmızı 5 99 E
Volvo siyah 7 86 E
VW gri 8 87 E
VW beyaz 7 88 E
Ford beyaz 2 111 E
VW beyaz 17 86 E
Tesla kırmızı 2 103 E
BMW siyah 9 87 E
Volvo gri 4 94 E
Ford beyaz 11 78 E
Toyota gri 12 77 E
VW beyaz 9 85 E
Toyota mavi 6 86 E

A dizideki değerleri kontrol ederek, ortalama olasılıkla 80 veya 90 olabileceğini tahmin edebiliriz ve en büyük ve en küçük değerleri de belirleyebiliriz, ancak daha neler yapabiliriz?

Veritabanını inceleyerek, en popüler rengin beyaz olduğunu, en eski araç yaşının 17 yıl olduğunu görebiliriz, ancak sadece diğer değerleri kontrol ederek araçların AutoPass olup olmadığını nasıl tahmin edeceğiz?

Bu, makine öğreniminin amacıdır! Verileri analiz etmek ve sonuçları tahmin etmek!

Makine öğreniminde, genellikle çok büyük veri kümeleri kullanılır. Bu dersimizde, makine öğreniminin farklı kavramlarını mümkün olduğunca kolay anlamanızı sağlamaya çalışacağız ve bazı kolay anlaşılır küçük veri kümeleri kullanacağız.

Veri Türleri

Veri analizi yapmak için, işlediğimiz veri türlerini anlamak çok önemlidir.

Veri türlerini üç ana kategoriye ayırabiliriz:

  • Sayısal (Numerical)
  • Kategorik (Categorical)
  • Sıralı (Ordinal)

Sayısal VeriSayılar, iki değer kategorisine ayrılabilir:

Düzensiz Veri (Discrete Data)
- tam sayılara sınırlı sayısal değerler. Örneğin: Geçen araç sayısı.
Sürekli Veri (Continuous Data)
- sonsuz sayıda değere sahip sayısal değer. Örneğin: Bir malın fiyatı veya bir malın boyutu.

Kategorik VeriBirbirlerini ölçemeyen değerlerdir. Örneğin: Renk değerleri veya herhangi bir evet/hayır değeri.

Sıralı VeriKategorik veri benzer, ancak birbirlerini ölçebilir. Örnek: A'nın B'den daha iyi okul notları, benzer şekilde.

Veri kaynağının veri türlerini öğrendiğinizde, veri analizi sırasında hangi teknikleri kullanacağınızı bilebilirsiniz.

Sonraki bölümden itibaren, istatistik ve veri analizi hakkında daha fazla bilgi öğreneceksiniz.