Нормальное распределение данных в машинном обучении
- Предыдущая страница Распределение данных
- Следующая страница Сгруппированные точки
Нормальное распределение данных (Normal Data Distribution)
В предыдущей главе мы изучили, как создать полностью случайный массив заданного размера и между двумя заданными значениями.
В этой главе мы изучим, как создать массив, значения которого сосредоточены вокруг заданного значения.
В теории вероятности, после того как математик Карл Фридрих Гаусс (Carl Friedrich Gauss) предложил формулу этого распределения данных, это распределение данных назвали нормальным распределением данных или распределением Гаусса.
Пример
Типичные нормальные распределения данных:
import numpy import matplotlib.pyplot as plt x = numpy.random.normal(5.0, 1.0, 100000) plt.hist(x, 100) plt.show()
Результат:

Комментарий:Из-за криволинейной формы нормального распределения его также называют кривой Гаусса.
Интерпретация гистограммы
Мы используем numpy.random.normal()
Метод создания массива (с 100000 значений) рисует гистограмму с 100 столбцами.
Мы указываем среднее значение 5.0 и стандартное отклонение 1.0.
Это означает, что эти значения должны сосредоточиться вокруг 5.0, и редко отклоняться от среднего на 1.0.
Из гистограммы можно увидеть, что большинство значений находится между 4.0 и 6.0, максимальное значение约为 5.0.
- Предыдущая страница Распределение данных
- Следующая страница Сгруппированные точки