Belajar Mesin - Grafik Scatter
- Halaman Sebelumnya Distribusi Data Normal
- Halaman Berikutnya Regresi Linear
Grafik titik (Scatter Plot)
Grafik titik adalah grafik yang masing-masing nilai dalam set data diwakili oleh titik.

Modul Matplotlib memiliki metode untuk menggambar grafik titik, yang memerlukan dua array panjang yang sama, satu array untuk nilai sumbu x, dan yang lain untuk nilai sumbu y:
x = [5,7,8,7,2,17,2,9,4,11,12,9,6] y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
Array x mewakili umur setiap mobil.
Array y menunjukkan kecepatan setiap mobil.
Contoh
Silakan gunakan scatter()
Metode untuk menggambar grafik titik:
import matplotlib.pyplot as plt x = [5,7,8,7,2,17,2,9,4,11,12,9,6] y = [99,86,87,88,111,86,103,87,94,78,77,85,86] plt.scatter(x, y) plt.show()
Hasil:

Penjelasan Grafik Tertitik
Aksis x menunjukkan umur mobil, aksis y menunjukkan kecepatan.
Dari gambar yang dapat dilihat, kedua mobil tercepat telah digunakan selama 2 tahun, mobil paling lambat telah digunakan selama 12 tahun.
Keterangan:Muncul bahwa mobil semakin baru, kecepatan pengemudi semakin tinggi, tetapi ini mungkin hanya sebetulnya suatu kesempatan, sebab kami hanya mendaftarkan 13 mobil.
Distribusi Data Acak
Dalam pemelajaran mesin, set data dapat berisi ribuan hingga jutaan nilai.
Ketika menguji algoritma, Anda mungkin tidak memiliki data nyata, Anda mungkin harus menggunakan nilai yang dihasilkan secara acak.
Seperti yang kita belajar di bab sebelumnya, modul NumPy dapat membantu kami!
Buat dua array yang diisi dengan bilangan acak dari distribusi data normal 1000.
Mean dari array pertama diatur menjadi 5.0, standar deviasi menjadi 1.0.
Mean dari array kedua diatur menjadi 10.0, standar deviasi menjadi 2.0:
Contoh
Grafik titik 1000 poin:
import numpy import matplotlib.pyplot as plt x = numpy.random.normal(5.0, 1.0, 1000) y = numpy.random.normal(10.0, 2.0, 1000) plt.scatter(x, y) plt.show()
Hasil:

Penjelasan Grafik Tertitik
Kami dapat melihat bahwa titik-titik terkonsentrasi di nilai 5 di sumbu x dan 10 di sumbu y.
Kami dapat melihat bahwa penyebaran di sumbu y adalah lebih besar daripada di sumbu x.
- Halaman Sebelumnya Distribusi Data Normal
- Halaman Berikutnya Regresi Linear