Maskinlæring - gennemsnit og median mønstre

Gennemsnit, median og modus

Hvad kan vi lære af en gruppe tal?

I maskinlæring (og matematik) findes der normalt tre værdier, vi er interesserede i:

  • Gennemsnit (Mean) - Gennemsnitsværdi
  • Median (Median) - Midtpunktet, også kendt som medianen
  • Modus (Mode) - Den mest almindelige værdi

For eksempel: Vi har registreret hastighederne for 13 biler:

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

Hvad er gennemsnitsværdi, median eller den mest almindelige hastighedsværdi?

Gennemsnit

Gennemsnittet er gennemsnitsværdien.

For at beregne gennemsnittet, find summen af alle værdier, og del derefter summen med antallet af værdier:

(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77

NumPy module har metoder til dette formål:

Eksempel

Brug NumPy mean() Metoden bestemmer gennemsnitshastighed:

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)

Kør Eksempel

Median

Medianen er miderværdien efter sortering af alle værdier:

77, 78, 85, 86, 86, 86, 87, 87, 88, 94, 99, 103, 111

Det er vigtigt at sortere tallene, før medianen findes.

NumPy module har metoder til dette formål:

Eksempel

Brug NumPy median() Metode til at finde midterværdien:

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

Kør Eksempel

Hvis der er to midter tal, divider summen af disse tal med 2.

, 77, 78, 85, 86, 86, 86, 87, 87, 94, 98, 99, 103
(86 + 87) / 2 = 86.5

Eksempel

Brug NumPy-modulen:

import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

Kør Eksempel

Modus

Modus er det tal, der optræder mest:

99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86 = 86

SciPy-modulen har metoder til dette formål:

Eksempel

Brug SciPy mode() Metode til at finde det tal, der optræder mest:

from scipy import stats
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)

Kør Eksempel

Kapitelopsummering

Gennemsnit, median og mode er ofte brugte teknikker i maskinlæring, så det er vigtigt at forstå koncepterne bag dem.