기계 학습 - 평균 중위수 패턴

평균, 중앙값 및 모드

한 그룹의 숫자에서 무엇을 배울 수 있을까요?

기계 학습(수학)에서는 일반적으로 우리가 관심을 가지는 세 가지 값이 있습니다:

  • 평균(Mean) - 평균 값
  • 중앙값(Median) - 중앙값 또는 중앙값
  • 모드(Mode) - 가장 일반적인 값

예를 들어: 우리는 13 대의 차의 속도를 등록했습니다:

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

평균, 중앙 또는 가장 일반적인 속도 값이 무엇인가요?

평균

평균은 평균 값입니다。

평균을 계산하려면 모든 값의 합을 찾고 그 합을 값의 개수로 나눕니다:

(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77

NumPy 모듈은 이 목적을 위한 메서드를 가지고 있습니다:

예제

NumPy를 사용하세요 mean() 평균 속도를 결정하는 메서드:

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)

예제 실행

중앙값

중앙값은 모든 값이 정렬된 후의 중간 값입니다:

77, 78, 85, 86, 86, 86, 87, 87, 88, 94, 99, 103, 111

중앙값을 찾기 전에 숫자를 정렬하는 것이 중요합니다。

NumPy 모듈은 이 목적을 위한 메서드를 가지고 있습니다:

예제

NumPy를 사용하세요 median() 중간값을 찾는 방법:

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

예제 실행

중간에 두 개의 숫자가 있다면, 이 두 숫자의 합을 나누어 2로 나눕니다.

, 77, 78, 85, 86, 86, 86, 87, 87, 94, 98, 99, 103
(86 + 87) / 2 = 86.5

예제

NumPy 모듈을 사용하세요:

import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

예제 실행

최빈값

최빈값은 가장 자주 나타나는 값입니다:

99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86 = 86

SciPy 모듈은 이 목적을 위한 메서드를 가지고 있습니다:

예제

SciPy를 사용하세요 mode() 최빈값을 찾는 방법:

from scipy import stats
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)

예제 실행

장절 요약

평균, 중앙값 및 모든 값은 기계 학습에서 자주 사용되며, 따라서 그 뒤에 있는 개념을 이해하는 것이 중요합니다.