Maskininlärning - medelvärdemönster

Medelvärde, median och modus

Vad kan vi lära oss från en uppsättning siffror?

I maskininlärning (och matematik) finns det vanligtvis tre värden vi är intresserade av:

  • Medelvärde (Mean) - Genomsnittet
  • Median (Median) - Mittenvärdet, också kallat median
  • Modus (Mode) - Vanligaste värdet

Exempel: Vi har registrerat hastigheten för 13 bilar:

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

Vad är genomsnittet, medianen eller den mest vanliga hastighetsvärdet?

Medelvärdet

Medelvärdet är medelvärdet.

För att beräkna medelvärdet, hitta summan av alla värden och dela sedan summan av antalet värden:

(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77

NumPy-modulen har metoder för detta ändamål:

Exempel

Använd NumPy mean() Metoden bestämmer genomsnittlig hastighet:

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)

Kör Exempel

Median

Median är mittenvärdet efter att alla värden har sorterats:

77, 78, 85, 86, 86, 86, 87, 87, 88, 94, 99, 103, 111

Det är viktigt att sortera siffrorna innan medianen hittas.

NumPy-modulen har metoder för detta ändamål:

Exempel

Använd NumPy median() Metod för att hitta medelvärdet:

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

Kör Exempel

Om det finns två medelvärden i mitten, dividera summan av dessa tal med 2.

, 77, 78, 85, 86, 86, 86, 87, 87, 94, 98, 99, 103
(86 + 87) / 2 = 86.5

Exempel

Använd NumPy-modulen:

import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

Kör Exempel

Modus

Modus är det värde som uppträder oftast:

99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86 = 86

SciPy-modulen har metoder för detta ändamål:

Exempel

Använd SciPy mode() Metod för att hitta det nummer som uppträder oftast:

from scipy import stats
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)

Kör Exempel

Kapitel Sammanfattning

Genomsnitt, median och mode är tekniker som ofta används inom maskininlärning, därför är det viktigt att förstå koncepten bakom dem.