Dyskretne wykresy punktowe w uczeniu maszynowym

Wykres punktowy (Scatter Plot)

Wykres punktowy to graf, w którym każda wartość z zestawu danych jest reprezentowana przez punkt.


Moduł Matplotlib ma metodę rysowania wykresu punktowego, która wymaga dwóch wektorów o tej samej długości: jeden do wartości osi x, a drugi do wartości osi y:

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

Wektor x reprezentuje wiek każdego pojazdu.

Wektor y reprezentuje prędkość każdego pojazdu.

Przykład

Proszę użyć scatter() Metoda rysowania wykresu punktowego:

import matplotlib.pyplot as plt
x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
plt.scatter(x, y)
plt.show()

Wynik:


Uruchomienie przykładu

Wyjaśnienie wykresu punktowego

Oś x reprezentuje wiek pojazdu, a oś y prędkość.

Z rysunku można zobaczyć, że dwa najszybsze samochody używano przez 2 lata, a najwolniejszy samochód przez 12 lat.

Uwaga:Wygląda na to, że im nowszy samochód, tym szybsza prędkość jazdy, ale to może być przypadek, bo zarejestrowaliśmy tylko 13 samochodów.

Rozkład danych losowych

W uczeniu maszynowym zestawy danych mogą zawierać tysiące, a nawet miliony wartości.

Podczas testowania algorytmów mogą nie mieć rzeczywistych danych, mogą musieć używać losowo wygenerowanych wartości.

Jak nauczyliśmy się w poprzednim rozdziale, moduł NumPy może nam pomóc!

Stwórzmy dwie tablice, które są wypełnione 1000 losowymi liczbami z rozkładu normalnego.

Średnia pierwszej tablicy ustawiona na 5.0, odchylenie standardowe na 1.0.

Średnia drugiej tablicy ustawiona na 10.0, odchylenie standardowe na 2.0:

Przykład

Wykres punktowy z 1000 punktów:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)
plt.scatter(x, y)
plt.show()

Wynik:


Uruchomienie przykładu

Wyjaśnienie wykresu punktowego

Możemy zauważyć, że punkty skupiają się wokół wartości 5 na osi x i 10 na osi y.

Możemy zauważyć, że rozpraszanie jest większe na osi y niż na osi x.