Scatter Plot Pembelajaran Mesin

Grafik titik (Scatter Plot)

Grafik titik adalah gambar yang mewakili setiap nilai di set data yang masing-masing diwakili oleh titik.


Modul Matplotlib memiliki cara untuk menggambar grafik titik, yang memerlukan dua array panjang yang sama, satu array untuk nilai orientasi x, dan yang lain untuk nilai orientasi y:

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

Bentuk x mewakili umur setiap kereta mobil.

Bentuk y merepresentasikan kecepatan setiap kereta mobil.

Contoh

Silakan gunakan scatter() Cara menggambar grafik titik:

import matplotlib.pyplot as plt
x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
plt.scatter(x, y)
plt.show()

Hasil:


Jalankan Contoh

Penjelasan Graf Bintang

Orientasi x menunjukkan umur kereta mobil, orientasi y menunjukkan kecepatan.

Dari gambar yang dapat dilihat, kedua kereta mobil paling cepat telah digunakan selama 2 tahun, dan kereta mobil paling lambat telah digunakan selama 12 tahun.

Catatan:Kereta semakin baru, kecepatan pengemudi semakin tinggi, tetapi ini mungkin hanya sebingit saja, sebab kami hanya mendaftarkan 13 kereta.

Distribusi Data Acak

Dalam pengajaran mesin, set data dapat mengandungi ribuan hingga jutaan nilai.

Saat menguji algoritma, mungkin anda tidak punya data nyata, anda mungkin harus menggunakan nilai yang dihasilkan secara acak.

Seperti yang kita belajar di bab sebelumnya, modul NumPy dapat membantu kami!

Kami akan membuat dua array yang diisi dengan bilangan acak dari distribusi data normal 1000.

Rata-rata bagi array pertama diatur kepada 5.0, standar deviasi 1.0.

Rata-rata bagi array kedua diatur kepada 10.0, standar deviasi 2.0:

Contoh

Graf bintang dengan 1000 titik:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)
plt.scatter(x, y)
plt.show()

Hasil:


Jalankan Contoh

Penjelasan Graf Bintang

Kami dapat melihat, titik-titik terkumpul di sekitar nilai 5 di sumbu x dan 10 di sumbu y.

Kami masih dapat melihat, penyebaran di sumbu y adalah lebih besar daripada di sumbu x.