Makine Öğrenimi - Dağılım Grafiği
- Önceki Sayfa Normal Veri Dağılımı
- Sonraki Sayfa Doğrusal Geri Bildirim
Dağıtım grafiği (Scatter Plot)
Dağıtım grafiği, veri kümesindeki her değeri bir nokta ile temsil eden bir grafiktir.

Matplotlib modülü, x ekseninin değerleri için bir dizi ve y ekseninin değerleri için bir dizi gerektiren bir dağıtım grafiği çizme yöntemine sahiptir:
x = [5,7,8,7,2,17,2,9,4,11,12,9,6] y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x dizisi her aracın yaşını temsil eder.
y dizisi her aracın hızını temsil eder.
Örnek
Kullanınız scatter()
Dağıtım grafiği çizme yöntemi:
import matplotlib.pyplot as plt x = [5,7,8,7,2,17,2,9,4,11,12,9,6] y = [99,86,87,88,111,86,103,87,94,78,77,85,86] plt.scatter(x, y) plt.show()
Sonuç:

Dağınık Grafiğe Açıklama
X eksenleri araç yaşını, y eksenleri hızları gösterir.
Görselde görebilirsiniz ki, en hızlı iki araç 2 yıl, en yavaş araç 12 yıl kullanılmıştır.
注释:Açıklama:
Arabaların ne kadar yeni olursa, süratlerinin o kadar hızlı olduğu gözlemleniyor, ancak bu bir tesadüf olabilir, çünkü sadece 13 araba kaydettik.
Rastgele Veri Dağılımı
Makine öğreniminde, veri kümeleri binlerce hatta milyonlarca değer içerebilir.
Algoritma test ederken, gerçek verileriniz olmayabilir, rastgele oluşturulan değerleri kullanmanız gerekebilir.
Bir önceki bölümden öğrendiğimiz gibi, NumPy modülü bize yardımcı olabilir!
İlk dizinin ortalaması 5.0, standart sapma 1.0 olarak ayarlanmıştır。
İkinci dizinin ortalaması 10.0, standart sapma 2.0 olarak ayarlanmıştır:
Örnek
1000 noktalık bir dağınık grafik var:
import numpy import matplotlib.pyplot as plt x = numpy.random.normal(5.0, 1.0, 1000) y = numpy.random.normal(10.0, 2.0, 1000) plt.scatter(x, y) plt.show()
Sonuç:

Dağınık Grafiğe Açıklama
X eksenindeki 5 ve y eksenindeki 10 etrafındaki noktaların yoğunlaştığını görebiliyoruz.
Ayrıca, y ekseninde x ekseninden daha büyük bir dağılım görüyoruz.
- Önceki Sayfa Normal Veri Dağılımı
- Sonraki Sayfa Doğrusal Geri Bildirim