آموزش ماشین‌leaning - معیار استاندارد

انحراف معیار چیست؟

انحراف معیار (Standard Deviation، همچنین به عنوان میانگین مربع شناخته می‌شود) یک عدد است که میزان پراکندگی ارقام را توصیف می‌کند.

انحراف معیار پایین نشان‌دهنده آن است که بیشتر ارقام به میانگین (که میانگین است) نزدیک هستند.

انحراف معیار بالا نشان‌دهنده آن است که این ارقام در یک دامنه‌ی وسیع‌تر توزیع شده‌اند.

مثال: این بار ما سرعت 7 خودرو را ثبت کرده‌ایم:

speed = [86,87,88,86,87,85,86]

انحراف معیار است:

0.9

این به این معنی است که بیشتر ارقام در محدوده‌ای به اندازه 0.9 از میانگین قرار دارند، یعنی 86.4.

بیایید به یک مجموعه‌ی اعداد با دامنه‌ی گسترده‌تر بپردازیم:

speed = [32,111,138,28,59,77,97]

انحراف معیار است:

37.85

این به این معنی است که بیشتر ارقام در محدوده‌ای به اندازه 37.85 از میانگین (که 77.4 است) قرار دارند.

همانطور که مشاهده می‌کنید، انحراف معیار بالا نشان‌دهنده آن است که این ارقام در یک دامنه‌ی وسیع‌تر توزیع شده‌اند.

مодуل NumPy یک روش برای محاسبه انحراف معیار دارد:

مثال

NumPy استفاده کنید std() روش برای پیدا کردن انحراف معیار:

import numpy
speed = [86,87,88,86,87,85,86]
x = numpy.std(speed)
print(x)

اجرای مثال

مثال

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)

اجرای مثال

واریانس

واریانس یک عدد دیگر است که میزان پراکندگی ارقام را نشان می‌دهد.

در واقع، اگر ریشه‌کвадرات واریانس را بگیرید، انحراف معیار را می‌گیرید!

یا برعکس، اگر انحراف معیار را به خود ضرب دهید، واریانس را می‌گیرید!

برای محاسبه واریانس، باید عمل زیر را انجام دهید:

1. میانگین را محاسبه کنید:

(32+111+138+28+59+77+97) / 7 = 77.4

2. برای هر مقدار: اختلاف با میانگین پیدا کنید:

 32 - 77.4 = -45.4
111 - 77.4 =  33.6
138 - 77.4 =  60.6
 28 - 77.4 = -49.4
 59 - 77.4 = -18.4
 77 - 77.4 = - 0.4
 97 - 77.4 =  19.6

3. برای هر اختلاف: ارزش مربع پیدا کنید:

(-45.4)2 = 2061.16 
 (33.6)2 = 1128.96 
 (60.6)2 = 3672.36 
(-49.4)2 (-49.4) 
= 2440.362 (-18.4) 
=  338.562 (- 0.4) 
 =    0.162 (19.6)

= 384.16

4. واریانس میانگین مربعات منحرف است:

(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2

مثال

خوشبختانه، NumPy روشی برای محاسبه واریانس دارد: var() روش برای تعیین واریانس:

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.var(speed)
print(x)

اجرای مثال

انحراف معیار

همانطور که می‌دانیم، فرمول محاسبه انحراف معیار ریشه دوم واریانس است:

√ 1432.25 = 37.85

یا، مانند مثال بالا، از NumPy برای محاسبه انحراف معیار استفاده کنید:

مثال

برای پیدا کردن انحراف معیار از روش std() NumPy استفاده کنید:

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)

اجرای مثال

نشان‌ها

انحراف معیار معمولاً با نماد Sigma نشان داده می‌شود:σ

واریانس معمولاً با نماد Sigma Square نشان داده می‌شود σ2 نشان‌دهی

جمع‌بندی فصل

انحراف معیار و واریانس اصطلاحاتی هستند که در یادگیری ماشین به طور متداول استفاده می‌شوند، بنابراین مهم است که بدانیم چگونه آن‌ها را به دست آوریم و مفاهیم پشت آن‌ها را بدانیم.