Makine Öğrenimi - Dağılım Grafiği

Dağıtım grafiği (Scatter Plot)

Dağıtım grafiği, veri kümesindeki her değeri bir nokta ile temsil eden bir grafiktir.


Matplotlib modülü, x ekseninin değerleri için bir dizi ve y ekseninin değerleri için bir dizi gerektiren bir dağıtım grafiği çizme yöntemine sahiptir:

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

x dizisi her aracın yaşını temsil eder.

y dizisi her aracın hızını temsil eder.

Örnek

Kullanınız scatter() Dağıtım grafiği çizme yöntemi:

import matplotlib.pyplot as plt
x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
plt.scatter(x, y)
plt.show()

Sonuç:


Örnek Çalıştır

Dağınık Grafiğe Açıklama

X eksenleri araç yaşını, y eksenleri hızları gösterir.

Görselde görebilirsiniz ki, en hızlı iki araç 2 yıl, en yavaş araç 12 yıl kullanılmıştır.

注释:Açıklama:

Arabaların ne kadar yeni olursa, süratlerinin o kadar hızlı olduğu gözlemleniyor, ancak bu bir tesadüf olabilir, çünkü sadece 13 araba kaydettik.

Rastgele Veri Dağılımı

Makine öğreniminde, veri kümeleri binlerce hatta milyonlarca değer içerebilir.

Algoritma test ederken, gerçek verileriniz olmayabilir, rastgele oluşturulan değerleri kullanmanız gerekebilir.

Bir önceki bölümden öğrendiğimiz gibi, NumPy modülü bize yardımcı olabilir!

İlk dizinin ortalaması 5.0, standart sapma 1.0 olarak ayarlanmıştır。

İkinci dizinin ortalaması 10.0, standart sapma 2.0 olarak ayarlanmıştır:

Örnek

1000 noktalık bir dağınık grafik var:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)
plt.scatter(x, y)
plt.show()

Sonuç:


Örnek Çalıştır

Dağınık Grafiğe Açıklama

X eksenindeki 5 ve y eksenindeki 10 etrafındaki noktaların yoğunlaştığını görebiliyoruz.

Ayrıca, y ekseninde x ekseninden daha büyük bir dağılım görüyoruz.