Makine Öğrenimi - Standart Sapma

Standart sapma nedir?

Standart sapma (Standard Deviation, genellikle ortalama kare farkı olarak da bilinir) değerlerin dağılım derecesini tanımlayan bir sayıdır.

Düşük standart sapma, çoğu sayının ortalama (ortalama) yakınında olduğunu gösterir.

Yüksek standart sapma, bu değerlerin daha geniş bir范围内 dağıldığını gösterir.

Örneğin: Bu sefer 7 aracın hızını kaydettik:

hız = [86,87,88,86,87,85,86]

Standart sapma:

0.9

Bu, çoğu değerin ortalamanın 0.9 aralığında, yani 86.4'te olduğunu anlamına gelir.

Daha geniş bir sayı kümesiyle işlem yapalım:

speed = [32,111,138,28,59,77,97]

Standart sapma:

37.85

Bu, çoğu değerin ortalama (ortalama 77.4) 37.85 aralığında olduğunu anlamına gelir.

Gördüğünüz gibi, yüksek standart sapma, bu değerlerin daha geniş bir范围内 dağıldığını gösterir.

NumPy modülü, standart sapmayı hesaplamak için bir yöntem sağlar:

Örnek

NumPy kullanın std() Standart sapmayı bulma yöntemi:

import numpy
hız = [86,87,88,86,87,85,86]
x = numpy.std(hız)
print(x)

Çalıştırma Örneği

Örnek

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(hız)
print(x)

Çalıştırma Örneği

Varyans

Varyans, değerlerin dağılım derecesini gösteren başka bir sayıdır.

Aslında, varyansın karesi kökünü alırsanız, standart sapma elde edilir!

veya tersi, eğer standart sapmayı kendine çarparsanız, varyans elde edersiniz!

Varyansı hesaplamak için aşağıdaki adımları gerçekleştirmeniz gerekiyor:

1. Ortalamayı bulma:

(32+111+138+28+59+77+97) / 7 = 77.4

2. İçin her bir değer: Ortalama ile farkı bul:

 32 - 77.4 = -45.4
111 - 77.4 =  33.6
138 - 77.4 =  60.6
 28 - 77.4 = -49.4
 59 - 77.4 = -18.4
 77 - 77.4 = - 0.4
 97 - 77.4 =  19.6

3. İçin her bir fark: Karesini bul:

(-45.4)2 = 2061.16 
 (33.6)2 = 1128.96 
 (60.6)2 = 3672.36 
(-49.4)2 = 2440.36 
(-18.4)2 =  338.56 
(- 0.4)2 =    0.16 
 (19.6)2 =  384.16

4. Varyans, bu kare farkların ortalamasıdır:

(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2

Şanslı bir şekilde, NumPy varyansı hesaplamak için bir yöntemi vardır:

Örnek

NumPy ile var() Varyansı belirleme yöntemi:

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.var(speed)
print(x)

Çalıştırma Örneği

Ortalama Çoğuluğu

Dediğimiz gibi, ortalama çoğuluğun formülü varyansın köküdür:

√ 1432.25 = 37.85

veya, yukarıdaki örnekte olduğu gibi, NumPy ile ortalama çoğuluğu hesaplayın:

Örnek

Lütfen NumPy std() yöntemini kullanarak ortalama çoğuluğu bulun:

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)

Çalıştırma Örneği

Sembol

Ortalama Çokluğu genellikle Sigma simgesi ile gösterilir:σ

Varyans genellikle Sigma Karesi simgesi ile temsil edilir: σ2 İfade

Bölüm Özeti

Ortalama Çokluğunu ve Varyansı, makine öğreniminde sıkça kullanılan terimlerdir, bu nedenle onları nasıl elde edeceğinizi ve arkasındaki kavramları anlamak çok önemlidir.