기계 학습 - 평균 중위수 패턴
평균, 중앙값 및 모드
한 그룹의 숫자에서 무엇을 배울 수 있을까요?
기계 학습(수학)에서는 일반적으로 우리가 관심을 가지는 세 가지 값이 있습니다:
- 평균(Mean) - 평균 값
- 중앙값(Median) - 중앙값 또는 중앙값
- 모드(Mode) - 가장 일반적인 값
예를 들어: 우리는 13 대의 차의 속도를 등록했습니다:
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
평균, 중앙 또는 가장 일반적인 속도 값이 무엇인가요?
평균
평균은 평균 값입니다。
평균을 계산하려면 모든 값의 합을 찾고 그 합을 값의 개수로 나눕니다:
(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77
NumPy 모듈은 이 목적을 위한 메서드를 가지고 있습니다:
예제
NumPy를 사용하세요 mean()
평균 속도를 결정하는 메서드:
import numpy speed = [99,86,87,88,111,86,103,87,94,78,77,85,86] x = numpy.mean(speed) print(x)
중앙값
중앙값은 모든 값이 정렬된 후의 중간 값입니다:
77, 78, 85, 86, 86, 86, 87, 87, 88, 94, 99, 103, 111
중앙값을 찾기 전에 숫자를 정렬하는 것이 중요합니다。
NumPy 모듈은 이 목적을 위한 메서드를 가지고 있습니다:
예제
NumPy를 사용하세요 median()
중간값을 찾는 방법:
import numpy speed = [99,86,87,88,111,86,103,87,94,78,77,85,86] x = numpy.median(speed) print(x)
중간에 두 개의 숫자가 있다면, 이 두 숫자의 합을 나누어 2로 나눕니다.
, 77, 78, 85, 86, 86, 86, 87, 87, 94, 98, 99, 103 (86 + 87) / 2 = 86.5
예제
NumPy 모듈을 사용하세요:
import numpy speed = [99,86,87,88,86,103,87,94,78,77,85,86] x = numpy.median(speed) print(x)
최빈값
최빈값은 가장 자주 나타나는 값입니다:
99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86 = 86
SciPy 모듈은 이 목적을 위한 메서드를 가지고 있습니다:
예제
SciPy를 사용하세요 mode()
최빈값을 찾는 방법:
from scipy import stats speed = [99,86,87,88,111,86,103,87,94,78,77,85,86] x = stats.mode(speed) print(x)
장절 요약
평균, 중앙값 및 모든 값은 기계 학습에서 자주 사용되며, 따라서 그 뒤에 있는 개념을 이해하는 것이 중요합니다.