机器学习 - 标准差

อะไรคือค่าความเปลี่ยนแปลงเฉลี่ย?

ค่าความเปลี่ยนแปลงเฉลี่ย (Standard Deviation หรือ ค่าความเปลี่ยนแปลงเฉลี่ย) คือ หนึ่งตัวเลขที่เอ่ยถึงความแตกต่างของค่าเฉลี่ย:

ค่าความเปลี่ยนแปลงเฉลี่ยต่ำหมายความว่าค่าส่วนใหญ่อยู่ใกล้กับค่าเฉลี่ย (ค่าเฉลี่ย)

ค่าความเปลี่ยนแปลงเฉลี่ยสูงหมายความว่าค่าเหล่านี้แพร่กระจายในขอบเขตกว้างขึ้น

เช่น: ครั้งนี้เราได้บันทึกความเร็วของรถยนต์ 7 คัน:

speed = [86,87,88,86,87,85,86]

ค่าความเปลี่ยนแปลงเฉลี่ยคือ:

0.9

หมายความว่าค่าส่วนใหญ่อยู่ในขอบเขต 0.9 ของค่าเฉลี่ย ซึ่งคือ 86.4

จะมีการประมวลผลตัวเลขที่มีขอบเขตกว้างขึ้น:

speed = [32,111,138,28,59,77,97]

ค่าความเปลี่ยนแปลงเฉลี่ยคือ:

37.85

นี่หมายความว่าค่าส่วนใหญ่อยู่ในขอบเขต 37.85 ของค่าเฉลี่ย (ค่าเฉลี่ยคือ 77.4)

เห็นได้ว่า ค่าความเปลี่ยนแปลงเฉลี่ยสูง หมายความว่าค่าเหล่านี้แพร่กระจายในขอบเขตกว้างขึ้น

มอดูล NumPy มีวิธีคำนวณค่าความเปลี่ยนแปลงเฉลี่ย:

ตัวอย่าง

ใช้ NumPy std() วิธีหาค่าความเปลี่ยนแปลงเฉลี่ย:

import numpy
speed = [86,87,88,86,87,85,86]
x = numpy.std(speed)
print(x)

ทดสอบการทำงาน

ตัวอย่าง

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)

ทดสอบการทำงาน

ค่าความเปลี่ยนแปลงเฉลี่ย

ค่าความเปลี่ยนแปลงเฉลี่ย คือ หนึ่งตัวเลขที่ชี้ถึงความแตกต่างของค่าเฉลี่ย:

ในตอนที่แล้ว หากใช้ร跟方差的平方根 จะได้ค่าความเปลี่ยนแปลงเฉลี่ย!

หรือที่เรียกว่า ค่าความเปลี่ยนแปลงเฉลี่ยของค่าเฉลี่ยตามตัวเอง!

หากต้องการคำนวณค่าความเปลี่ยนแปลงเฉลี่ยตามวิธีต่อไปนี้:

1. หาค่าเฉลี่ย:

(32+111+138+28+59+77+97) / 7 = 77.4

2. สำหรับแต่ละค่า: หาค่าแตกต่างจากค่าเฉลี่ย:

 32 - 77.4 = -45.4
111 - 77.4 =  33.6
138 - 77.4 =  60.6
 28 - 77.4 = -49.4
 59 - 77.4 = -18.4
 77 - 77.4 = - 0.4
 97 - 77.4 =  19.6

3. สำหรับแต่ละความแตกต่าง: หาค่าเชิงมาตร:

(-45.4)2 = 2061.16 
 (33.6)2 = 1128.96 
 (60.6)2 = 3672.36 
(-49.4)2 = 2440.36 
(-18.4)2 =  338.56 
(- 0.4)2 =    0.16 
 (19.6)2 =  384.16

4. 方差是这些平方差的平均值:

(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2

幸运的是,NumPy 有一种计算方差的方法:

ตัวอย่าง

使用 NumPy var() 方法确定方差:

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.var(speed)
print(x)

ทดสอบการทำงาน

标准差

如我们所知,计算标准差的公式是方差的平方根:

√ 1432.25 = 37.85

หรือ ใช้ NumPy คำนวณมาตรฐานตามตัวอย่างเหตุผลดังนี้

ตัวอย่าง

ใช้วิธี NumPy std() ในการหามาตรฐาน

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)

ทดสอบการทำงาน

สัญลักษณ์

มาตรฐานทั่วไปถูกแสดงด้วยสัญลักษณ์เซก้าเซี่ยวσ

มาตรฐานทั่วไปถูกแสดงด้วยสัญลักษณ์เซก้าเซี่ยวครึ่งกลุ่ม σ2 แสดง

สรุปบท

มีข้อความเกี่ยวกับมาตรฐานและความแปลกปลอกที่ถูกใช้บ่อยในการเรียนรู้เครื่อง ดังนั้น การเข้าใจว่าจะเอามันได้และความหมายของมันเป็นสิ่งที่สำคัญมาก