Среднее и медиана в машинном обучении

Среднее значение, медиана и мода

Что мы можем узнать из набора чисел?

В машинном обучении (и математике) обычно существует три значения, которые нас интересуют:

  • Среднее значение (Mean) - среднее значение
  • Медиана (Median) - середина значения, также известное как медиана
  • Мода (Mode) - наиболее часто встречающееся значение

Например: мы зарегистрировали скорости 13 автомобилей:

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

Что такое среднее, среднее или наиболее часто встречающееся значение скорости?

Среднее значение

Среднее значение - это平均值.

Чтобы вычислить среднее значение, найдите сумму всех значений и затем разделите сумму на количество значений:

(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77

Модуль NumPy имеет методы для этой цели:

Пример

Используйте NumPy mean() Метод определяет среднюю скорость:

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)

Запуск примера

Медиана

Медиана - это среднее значение всех значений после их сортировки:

77, 78, 85, 86, 86, 86, 87, 87, 88, 94, 99, 103, 111

排序数字在找到中位数之前非常重要。

Модуль NumPy имеет методы для этой цели:

Пример

Используйте NumPy median() Метод нахождения середины:

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

Запуск примера

Если между ними два числа, то сумму этих чисел делят на 2.

, 77, 78, 85, 86, 86, 86, 87, 87, 94, 98, 99, 103
(86 + 87) / 2 = 86.5

Пример

Используйте модуль NumPy:

import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

Запуск примера

Мода

Мода - это наиболее часто встречающееся значение:

99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86 = 86

Модуль SciPy имеет методы для этой цели:

Пример

Используйте SciPy mode() Метод нахождения наиболее часто встречающегося числа:

from scipy import stats
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)

Запуск примера

Резюме главы

Среднее значение, медиана и мода часто используются в машинном обучении, поэтому важно понять концепции, лежащие в их основе.