Стандартное отклонение в машинном обучении
- Предыдущая страница Среднее значение и мода
- Следующая страница Проценты
Что такое стандартное отклонение?
Стандартное отклонение (Standard Deviation, также часто называемое среднеквадратичным отклонением) - это число, описывающее степеньdispersion of значений.
Низкое стандартное отклонение означает, что большинство чисел接近 среднее значение (среднее значение).
Высокое стандартное отклонение означает, что эти значения распределены в более широком диапазоне.
Например: в этот раз мы зарегистрировали скорости 7 автомобилей:
speed = [86,87,88,86,87,85,86]
Стандартное отклонение:
0.9
Это означает, что большинство значений находятся в диапазоне 0.9 от среднего значения, то есть 86.4.
Давайте обработаем набор чисел с более широким диапазоном:
speed = [32,111,138,28,59,77,97]
Стандартное отклонение:
37.85
Это означает, что большинство значений находятся в диапазоне 37.85 от среднего значения (среднее значение 77.4).
Как вы видите, более высокое стандартное отклонение означает, что эти значения распределены в более широком диапазоне.
Модуль NumPy имеет метод для вычисления стандартного отклонения:
Пример
Используйте NumPy std()
Метод поиска стандартного отклонения:
import numpy speed = [86,87,88,86,87,85,86] x = numpy.std(speed) print(x)
Пример
import numpy speed = [32,111,138,28,59,77,97] x = numpy.std(speed) print(x)
Дисперсия
Дисперсия - это другое число, указывающее на степеньdispersion of значений.
На самом деле, если использовать квадратный корень из дисперсии, вы получите стандартное отклонение!
Или наоборот, если умножить стандартное отклонение на себя, вы получите дисперсию!
Чтобы вычислить дисперсию, вам необходимо выполнить следующие действия:
1. Найти среднее значение:
(32+111+138+28+59+77+97) / 7 = 77.4
2. Для каждого значения: найти разницу с средним значением:
32 - 77.4 = -45.4 111 - 77.4 = 33.6 138 - 77.4 = 60.6 28 - 77.4 = -49.4 59 - 77.4 = -18.4 77 - 77.4 = - 0.4 97 - 77.4 = 19.6
3. Для каждого различия: найти квадрат:
(-45.4)2 = 2061.16 (33.6)2 = 1128.96 (60.6)2 = 3672.36 (-49.4)2 (-49.4) = 2440.362 (-18.4) = 338.562 (- 0.4) = 0.162 (19.6)
= 384.16
4. Дисперсия — это среднее арифметическое этих квадратов разностей:
(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2
Пример
К счастью, у NumPy есть метод для вычисления дисперсии: var()
Метод определения дисперсии:
import numpy speed = [32,111,138,28,59,77,97] x = numpy.var(speed) print(x)
Среднее квадратическое отклонение
Как мы знаем, формула для вычисления среднего квадратического отклонения — это квадратный корень из дисперсии:
√ 1432.25 = 37.85
Либо, как показано в примере выше, используйте NumPy для вычисления среднеквадратического отклонения:
Пример
Используйте метод std() NumPy для поиска среднеквадратического отклонения:
import numpy speed = [32,111,138,28,59,77,97] x = numpy.std(speed) print(x)
Символ
Среднее квадратическое отклонение обычно обозначается символом Sigmaσ
Дисперсия обычно обозначается символом Sigma Square σ2 Представление
Резюме главы
Среднее квадратическое отклонение и дисперсия — это часто используемые термины в машинном обучении, поэтому важно понимать, как получить их и их концепцию.
- Предыдущая страница Среднее значение и мода
- Следующая страница Проценты