Średnia i mediana w uczeniu maszynowym

Średnia, mediana i modus

Czego możemy się nauczyć z zestawu liczb?

W uczeniu maszynowym (i matematyce) zazwyczaj istnieją trzy wartości, które nas interesują:

  • Średnia (Mean) - Średnia
  • Mediana (Median) - Środkowa wartość, znana również jako mediana
  • Modus (Mode) - Najczęściej występująca wartość

Na przykład: zarejestrowaliśmy prędkości 13 pojazdów:

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

Co to jest średnia, środkowa lub najczęściej występująca wartość prędkości?

Średnia

Średnia to wartość średnia.

Aby obliczyć średnią, znajdź sumę wszystkich wartości, a następnie podziel przez liczbę wartości:

(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77

Moduł NumPy ma metody do tego celu:

Przykład

Użyj NumPy mean() Metoda określa średnią prędkość:

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)

Uruchomienie przykładu

Mediana

Mediana to wartość środkowa po posortowaniu wszystkich wartości:

77, 78, 85, 86, 86, 86, 87, 87, 88, 94, 99, 103, 111

Przed znalezieniem mediany, sortowanie liczb jest bardzo ważne.

Moduł NumPy ma metody do tego celu:

Przykład

Użyj NumPy median() Metoda znajdowania wartości środkowej:

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

Uruchomienie przykładu

Jeśli w środku są dwa liczby, podziel sumę tych liczb przez 2.

, 77, 78, 85, 86, 86, 86, 87, 87, 94, 98, 99, 103
(86 + 87) / 2 = 86.5

Przykład

Użyj modułu NumPy:

import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

Uruchomienie przykładu

Mode

Mode to wartość występująca najczęściej:

99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86 = 86

Moduł SciPy ma metody do tego celu:

Przykład

Użyj SciPy mode() Metoda wyszukiwania liczby występującej najczęściej:

from scipy import stats
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)

Uruchomienie przykładu

Podsumowanie rozdziału

Średnia, mediana i moda są technikami często używanymi w uczeniu maszynowym, więc zrozumienie ich założeń jest bardzo ważne.