Makine Öğrenimi - Başlangıç
- Önceki Sayfa NumPy ufuncs
- Sonraki Sayfa Ortalama ve Ortalama Modu
Makine öğrenimi, bilgisayarların araştırma verileri ve istatistik bilgilerinden öğrenmesini sağlar.
Makine öğrenimi, yapay zeka (AI) yönüne giden adımlardan biridir.
Makine öğrenimi, verileri analiz edebilen ve sonuçları öngörebilen bir programdır.
Nereden başlayalım?
Bu rehberde, matematik geri dönerek istatistik araştıracağız ve veri kümesine göre önemli değerleri nasıl hesaplayacağımızı öğreneceğiz.
Ayrıca, ihtiyacımız olan yanıtları elde etmek için çeşitli Python modüllerini nasıl kullanacağımızı öğreneceğiz.
Ayrıca, öğrendiklerimize dayanarak sonuçları öngörebilen fonksiyonlar yazmayı öğreneceğiz.
Veri kümesi
Bilgisayarlarda, veri kümesi her türlü veri kümelerini ifade eder. Bu, bir dizi veya tam bir veritabanı olabilen herhangi bir içerik olabilir.
Bir dizinin örneği:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
Bir veritabanı örneği:
Araç adı | Renk | Yaş | Hız | AutoPass |
---|---|---|---|---|
BMW | kırmızı | 5 | 99 | E |
Volvo | siyah | 7 | 86 | E |
VW | gri | 8 | 87 | E |
VW | beyaz | 7 | 88 | E |
Ford | beyaz | 2 | 111 | E |
VW | beyaz | 17 | 86 | E |
Tesla | kırmızı | 2 | 103 | E |
BMW | siyah | 9 | 87 | E |
Volvo | gri | 4 | 94 | E |
Ford | beyaz | 11 | 78 | E |
Toyota | gri | 12 | 77 | E |
VW | beyaz | 9 | 85 | E |
Toyota | mavi | 6 | 86 | E |
A dizideki değerleri kontrol ederek, ortalama olasılıkla 80 veya 90 olabileceğini tahmin edebiliriz ve en büyük ve en küçük değerleri de belirleyebiliriz, ancak daha neler yapabiliriz?
Veritabanını inceleyerek, en popüler rengin beyaz olduğunu, en eski araç yaşının 17 yıl olduğunu görebiliriz, ancak sadece diğer değerleri kontrol ederek araçların AutoPass olup olmadığını nasıl tahmin edeceğiz?
Bu, makine öğreniminin amacıdır! Verileri analiz etmek ve sonuçları tahmin etmek!
Makine öğreniminde, genellikle çok büyük veri kümeleri kullanılır. Bu dersimizde, makine öğreniminin farklı kavramlarını mümkün olduğunca kolay anlamanızı sağlamaya çalışacağız ve bazı kolay anlaşılır küçük veri kümeleri kullanacağız.
Veri Türleri
Veri analizi yapmak için, işlediğimiz veri türlerini anlamak çok önemlidir.
Veri türlerini üç ana kategoriye ayırabiliriz:
- Sayısal (Numerical)
- Kategorik (Categorical)
- Sıralı (Ordinal)
Sayısal VeriSayılar, iki değer kategorisine ayrılabilir:
- Düzensiz Veri (Discrete Data)
- - tam sayılara sınırlı sayısal değerler. Örneğin: Geçen araç sayısı.
- Sürekli Veri (Continuous Data)
- - sonsuz sayıda değere sahip sayısal değer. Örneğin: Bir malın fiyatı veya bir malın boyutu.
Kategorik VeriBirbirlerini ölçemeyen değerlerdir. Örneğin: Renk değerleri veya herhangi bir evet/hayır değeri.
Sıralı VeriKategorik veri benzer, ancak birbirlerini ölçebilir. Örnek: A'nın B'den daha iyi okul notları, benzer şekilde.
Veri kaynağının veri türlerini öğrendiğinizde, veri analizi sırasında hangi teknikleri kullanacağınızı bilebilirsiniz.
Sonraki bölümden itibaren, istatistik ve veri analizi hakkında daha fazla bilgi öğreneceksiniz.
- Önceki Sayfa NumPy ufuncs
- Sonraki Sayfa Ortalama ve Ortalama Modu