Apprentissage automatique - Graphique de dispersion

Scatter Plot

A scatter plot is a graph where each value in the dataset is represented by a point.


Matplotlib has a method to draw scatter plots, which requires two arrays of the same length, one for the x-axis values and the other for the y-axis values:

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

The x array represents the age of each car.

The y array represents the speed of each car.

Exemple

Please use scatter() Method to draw a scatter plot:

import matplotlib.pyplot as plt
x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
plt.scatter(x, y)
plt.show()

Résultat :


Exécution de l'exemple

Explication de la diagramme de dispersion

The x-axis represents the age of the car, and the y-axis represents the speed.

On the diagram, it can be seen that the two fastest cars have been used for 2 years, and the slowest car has been used for 12 years.

Remarque :Les voitures semblent aller plus vite quand elles sont neuves, mais cela pourrait être une coïncidence, car nous n'avons enregistré que 13 voitures.

Distribution de données aléatoires

Dans l'apprentissage automatique, un ensemble de données peut contenir des milliers, voire des millions de valeurs.

Lorsque vous testez des algorithmes, vous pouvez ne pas avoir de données réelles, vous devrez peut-être utiliser des valeurs générées aléatoirement.

Comme nous l'avons appris au chapitre précédent, le module NumPy peut nous aider !

Créons deux séries, toutes deux remplies de 1000 nombres aléatoires provenant de la distribution de données normales.

La moyenne de la première série est réglée sur 5.0, avec une déviation standard de 1.0.

La moyenne de la deuxième série est réglée sur 10.0, avec une déviation standard de 2.0 :

Exemple

Graphique de dispersion de 1000 points :

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)
plt.scatter(x, y)
plt.show()

Résultat :


Exécution de l'exemple

Explication de la diagramme de dispersion

Nous pouvons voir que les points se concentrent autour de la valeur 5 sur l'axe x et 10 sur l'axe y.

Nous pouvons encore voir que la diffusion sur l'axe y est plus grande que sur l'axe x.