Dyskretne wykresy punktowe w uczeniu maszynowym
- Poprzednia strona Normalne rozproszenie danych
- Następna strona Liniowa regresja
Wykres punktowy (Scatter Plot)
Wykres punktowy to graf, w którym każda wartość z zestawu danych jest reprezentowana przez punkt.

Moduł Matplotlib ma metodę rysowania wykresu punktowego, która wymaga dwóch wektorów o tej samej długości: jeden do wartości osi x, a drugi do wartości osi y:
x = [5,7,8,7,2,17,2,9,4,11,12,9,6] y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
Wektor x reprezentuje wiek każdego pojazdu.
Wektor y reprezentuje prędkość każdego pojazdu.
Przykład
Proszę użyć scatter()
Metoda rysowania wykresu punktowego:
import matplotlib.pyplot as plt x = [5,7,8,7,2,17,2,9,4,11,12,9,6] y = [99,86,87,88,111,86,103,87,94,78,77,85,86] plt.scatter(x, y) plt.show()
Wynik:

Wyjaśnienie wykresu punktowego
Oś x reprezentuje wiek pojazdu, a oś y prędkość.
Z rysunku można zobaczyć, że dwa najszybsze samochody używano przez 2 lata, a najwolniejszy samochód przez 12 lat.
Uwaga:Wygląda na to, że im nowszy samochód, tym szybsza prędkość jazdy, ale to może być przypadek, bo zarejestrowaliśmy tylko 13 samochodów.
Rozkład danych losowych
W uczeniu maszynowym zestawy danych mogą zawierać tysiące, a nawet miliony wartości.
Podczas testowania algorytmów mogą nie mieć rzeczywistych danych, mogą musieć używać losowo wygenerowanych wartości.
Jak nauczyliśmy się w poprzednim rozdziale, moduł NumPy może nam pomóc!
Stwórzmy dwie tablice, które są wypełnione 1000 losowymi liczbami z rozkładu normalnego.
Średnia pierwszej tablicy ustawiona na 5.0, odchylenie standardowe na 1.0.
Średnia drugiej tablicy ustawiona na 10.0, odchylenie standardowe na 2.0:
Przykład
Wykres punktowy z 1000 punktów:
import numpy import matplotlib.pyplot as plt x = numpy.random.normal(5.0, 1.0, 1000) y = numpy.random.normal(10.0, 2.0, 1000) plt.scatter(x, y) plt.show()
Wynik:

Wyjaśnienie wykresu punktowego
Możemy zauważyć, że punkty skupiają się wokół wartości 5 na osi x i 10 na osi y.
Możemy zauważyć, że rozpraszanie jest większe na osi y niż na osi x.
- Poprzednia strona Normalne rozproszenie danych
- Następna strona Liniowa regresja