Scatter Plot Pembelajaran Mesin
- Halaman Sebelumnya Distribusi Data Normal
- Halaman Berikutnya Regresi Linear
Grafik titik (Scatter Plot)
Grafik titik adalah gambar yang mewakili setiap nilai di set data yang masing-masing diwakili oleh titik.

Modul Matplotlib memiliki cara untuk menggambar grafik titik, yang memerlukan dua array panjang yang sama, satu array untuk nilai orientasi x, dan yang lain untuk nilai orientasi y:
x = [5,7,8,7,2,17,2,9,4,11,12,9,6] y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
Bentuk x mewakili umur setiap kereta mobil.
Bentuk y merepresentasikan kecepatan setiap kereta mobil.
Contoh
Silakan gunakan scatter()
Cara menggambar grafik titik:
import matplotlib.pyplot as plt x = [5,7,8,7,2,17,2,9,4,11,12,9,6] y = [99,86,87,88,111,86,103,87,94,78,77,85,86] plt.scatter(x, y) plt.show()
Hasil:

Penjelasan Graf Bintang
Orientasi x menunjukkan umur kereta mobil, orientasi y menunjukkan kecepatan.
Dari gambar yang dapat dilihat, kedua kereta mobil paling cepat telah digunakan selama 2 tahun, dan kereta mobil paling lambat telah digunakan selama 12 tahun.
Catatan:Kereta semakin baru, kecepatan pengemudi semakin tinggi, tetapi ini mungkin hanya sebingit saja, sebab kami hanya mendaftarkan 13 kereta.
Distribusi Data Acak
Dalam pengajaran mesin, set data dapat mengandungi ribuan hingga jutaan nilai.
Saat menguji algoritma, mungkin anda tidak punya data nyata, anda mungkin harus menggunakan nilai yang dihasilkan secara acak.
Seperti yang kita belajar di bab sebelumnya, modul NumPy dapat membantu kami!
Kami akan membuat dua array yang diisi dengan bilangan acak dari distribusi data normal 1000.
Rata-rata bagi array pertama diatur kepada 5.0, standar deviasi 1.0.
Rata-rata bagi array kedua diatur kepada 10.0, standar deviasi 2.0:
Contoh
Graf bintang dengan 1000 titik:
import numpy import matplotlib.pyplot as plt x = numpy.random.normal(5.0, 1.0, 1000) y = numpy.random.normal(10.0, 2.0, 1000) plt.scatter(x, y) plt.show()
Hasil:

Penjelasan Graf Bintang
Kami dapat melihat, titik-titik terkumpul di sekitar nilai 5 di sumbu x dan 10 di sumbu y.
Kami masih dapat melihat, penyebaran di sumbu y adalah lebih besar daripada di sumbu x.
- Halaman Sebelumnya Distribusi Data Normal
- Halaman Berikutnya Regresi Linear