Machine Learning - Gemiddelde en Mediaan patronen

Gemiddelde, median en modus

Wat kunnen we leren van een groep cijfers?

In machine learning (en wiskunde) zijn er drie waarden die we vaak interesseren:

  • Gemiddelde (Mean) - Het gemiddelde
  • Median (Median) - De middelste waarde, ook wel het gemiddelde genoemd
  • Modus (Mode) - De meest voorkomende waarde

Bijvoorbeeld: we hebben de snelheid van 13 auto's geregistreerd:

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

Wat is het gemiddelde, middelste of meest voorkomende snelheidswaarde?

Gemiddelde

De gemiddelde waarde is het gemiddelde.

Om het gemiddelde te berekenen, vind je de som van alle waarden en deel je deze door het aantal waarden:

(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77

Het NumPy-module heeft methoden voor dit doel:

Example

Please use NumPy mean() De methode bepaalt de gemiddelde snelheid:

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)

Run Example

Gemiddelde

Het gemiddelde is de middelste waarde na het sorteren van alle waarden:

77, 78, 85, 86, 86, 86, 87, 87, 88, 94, 99, 103, 111

Het sorteren van cijfers is belangrijk voordat je het gemiddelde vindt.

Het NumPy-module heeft methoden voor dit doel:

Example

Please use NumPy median() Method to find the middle value:

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

Run Example

If there are two numbers in the middle, divide the sum of these numbers by 2.

, 77, 78, 85, 86, 86, 86, 87, 87, 94, 98, 99, 103
(86 + 87) / 2 = 86.5

Example

Use the NumPy module:

import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

Run Example

Mode

The mode is the most frequently occurring value:

99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86 = 86

The SciPy module has methods for this purpose:

Example

Please use SciPy mode() Method to find the most frequently occurring number:

from scipy import stats
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)

Run Example

Chapter Summary

Mean, median and mode are frequently used techniques in machine learning, so it is important to understand the concepts behind them.