Apprendimento automatico - Deviazione standard
Cos'è la deviazione standard?
La deviazione standard (Standard Deviation, anche conosciuta come varianza media) è un numero che descrive la dispersione dei valori.
Una deviazione standard bassa indica che la maggior parte dei numeri è vicino alla media (media).
Una deviazione standard alta indica che questi valori si distribuiscono in un intervallo più ampio.
Ad esempio: questa volta abbiamo registrato la velocità di 7 auto:
speed = [86,87,88,86,87,85,86]
La deviazione standard è:
0.9
Questo significa che la maggior parte dei valori si trova all'interno di un intervallo di 0.9 dalla media, ossia 86.4.
Trattiamo una serie di numeri con un intervallo più ampio:
speed = [32,111,138,28,59,77,97]
La deviazione standard è:
37.85
Questo significa che la maggior parte dei valori si trova all'interno di un intervallo di 37.85 dal valore medio (media 77.4).
Come vedete, una deviazione standard più alta indica che questi valori si distribuiscono in un intervallo più ampio.
Il modulo NumPy ha un metodo per calcolare la deviazione standard:
实例
Utilizzare NumPy std()
Metodo per trovare la deviazione standard:
import numpy speed = [86,87,88,86,87,85,86] x = numpy.std(speed) print(x)
实例
import numpy speed = [32,111,138,28,59,77,97] x = numpy.std(speed) print(x)
Varianza
La varianza è un altro numero che indica la dispersione dei valori.
In realtà, se si utilizza la radice quadrata della varianza, si ottiene la deviazione standard!
Oppure al contrario, se si moltiplica la deviazione standard per se stessa, si ottiene la varianza!
Per calcolare la varianza, è necessario eseguire le seguenti operazioni:
1. Calcolare la media:
(32+111+138+28+59+77+97) / 7 = 77.4
2. Per ogni valore: trovare la differenza rispetto alla media:
32 - 77.4 = -45.4 111 - 77.4 = 33.6 138 - 77.4 = 60.6 28 - 77.4 = -49.4 59 - 77.4 = -18.4 77 - 77.4 = -0.4 97 - 77.4 = 19.6
3. Per ogni differenza: trovare il quadrato:
(-45.4)2 = 2061.16 (33.6)2 = 1128.96 (60.6)2 = 3672.36 (-49.4)2 = 2440.36 (-18.4)2 = 338.56 (- 0.4)2 = 0.16 (19.6)2 = 384.16
4. 方差是这些平方差的平均值:
(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2
幸运的是,NumPy 有一种计算方差的方法:
实例
使用 NumPy var()
方法确定方差:
import numpy speed = [32,111,138,28,59,77,97] x = numpy.var(speed) print(x)
标准差
如我们所知,计算标准差的公式是方差的平方根:
√ 1432.25 = 37.85
或者,如上例所示,使用 NumPy 计算标准差:
实例
请使用 NumPy std() 方法查找标准差:
import numpy speed = [32,111,138,28,59,77,97] x = numpy.std(speed) print(x)
符号
标准差通常用 Sigma 符号表示:σ
方差通常由 Sigma Square 符号 σ2 表示
章节总结
标准差和方差是机器学习中经常使用的术语,因此了解如何获取它们以及它们背后的概念非常重要。