機械学習 - 平均値/中央値パターン

平均値、中位数、モード

一つの数字のグループから何を学べますか?

機械学習(および数学)では、通常、私たちが興味を持ちやすい3つの値があります:

  • 平均値(Mean) - 平均値
  • 中位数(Median) - 中点値、別名中位数
  • モード(Mode) - 最も一般的な値

例えば:13台の車の速度を登録しました:

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

平均、中央、または最も一般的な速度値とは何ですか?

平均値

平均値はその値です。

平均を計算するには、すべての値の合計を求め、その合計を値の数で割ってください:

(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77

NumPy モジュールにはこの目的のために方法があります:

NumPy を使用してください mean() 平均速度を決定する方法:

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)

実行例

中位数

中位数はすべての値を並べ替えた後の中央の値です:

77, 78, 85, 86, 86, 86, 87, 87, 88, 94, 99, 103, 111

中位数を見つける前に、数字を並べ替えることは非常に重要です。

NumPy モジュールにはこの目的のために方法があります:

NumPy を使用してください median() 中央値を見つける方法:

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

実行例

中央に2つの数字がある場合、これらの数字の和を2で割ってください。

, 77, 78, 85, 86, 86, 86, 87, 87, 94, 98, 99, 103
(86 + 87) / 2 = 86.5

NumPy モジュールを使用する:

import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

実行例

モード

最も頻繁に現れる値は:

99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86 = 86

SciPy モジュールにはこの目的のためにメソッドがあります:

SciPy を使用してください mode() 最も頻繁に現れる数字を見つける方法:

from scipy import stats
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)

実行例

章のまとめ

平均、中央値、モードは機械学習でよく使用される技術であり、その背後の概念を理解することが重要です。