آموزش ماشینleaning - معیار استاندارد
- صفحه قبل مقیاس میانگین و مد
- صفحه بعدی دوئدهمین درصد
انحراف معیار چیست؟
انحراف معیار (Standard Deviation، همچنین به عنوان میانگین مربع شناخته میشود) یک عدد است که میزان پراکندگی ارقام را توصیف میکند.
انحراف معیار پایین نشاندهنده آن است که بیشتر ارقام به میانگین (که میانگین است) نزدیک هستند.
انحراف معیار بالا نشاندهنده آن است که این ارقام در یک دامنهی وسیعتر توزیع شدهاند.
مثال: این بار ما سرعت 7 خودرو را ثبت کردهایم:
speed = [86,87,88,86,87,85,86]
انحراف معیار است:
0.9
این به این معنی است که بیشتر ارقام در محدودهای به اندازه 0.9 از میانگین قرار دارند، یعنی 86.4.
بیایید به یک مجموعهی اعداد با دامنهی گستردهتر بپردازیم:
speed = [32,111,138,28,59,77,97]
انحراف معیار است:
37.85
این به این معنی است که بیشتر ارقام در محدودهای به اندازه 37.85 از میانگین (که 77.4 است) قرار دارند.
همانطور که مشاهده میکنید، انحراف معیار بالا نشاندهنده آن است که این ارقام در یک دامنهی وسیعتر توزیع شدهاند.
مодуل NumPy یک روش برای محاسبه انحراف معیار دارد:
مثال
NumPy استفاده کنید std()
روش برای پیدا کردن انحراف معیار:
import numpy speed = [86,87,88,86,87,85,86] x = numpy.std(speed) print(x)
مثال
import numpy speed = [32,111,138,28,59,77,97] x = numpy.std(speed) print(x)
واریانس
واریانس یک عدد دیگر است که میزان پراکندگی ارقام را نشان میدهد.
در واقع، اگر ریشهکвадرات واریانس را بگیرید، انحراف معیار را میگیرید!
یا برعکس، اگر انحراف معیار را به خود ضرب دهید، واریانس را میگیرید!
برای محاسبه واریانس، باید عمل زیر را انجام دهید:
1. میانگین را محاسبه کنید:
(32+111+138+28+59+77+97) / 7 = 77.4
2. برای هر مقدار: اختلاف با میانگین پیدا کنید:
32 - 77.4 = -45.4 111 - 77.4 = 33.6 138 - 77.4 = 60.6 28 - 77.4 = -49.4 59 - 77.4 = -18.4 77 - 77.4 = - 0.4 97 - 77.4 = 19.6
3. برای هر اختلاف: ارزش مربع پیدا کنید:
(-45.4)2 = 2061.16 (33.6)2 = 1128.96 (60.6)2 = 3672.36 (-49.4)2 (-49.4) = 2440.362 (-18.4) = 338.562 (- 0.4) = 0.162 (19.6)
= 384.16
4. واریانس میانگین مربعات منحرف است:
(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2
مثال
خوشبختانه، NumPy روشی برای محاسبه واریانس دارد: var()
روش برای تعیین واریانس:
import numpy speed = [32,111,138,28,59,77,97] x = numpy.var(speed) print(x)
انحراف معیار
همانطور که میدانیم، فرمول محاسبه انحراف معیار ریشه دوم واریانس است:
√ 1432.25 = 37.85
یا، مانند مثال بالا، از NumPy برای محاسبه انحراف معیار استفاده کنید:
مثال
برای پیدا کردن انحراف معیار از روش std() NumPy استفاده کنید:
import numpy speed = [32,111,138,28,59,77,97] x = numpy.std(speed) print(x)
نشانها
انحراف معیار معمولاً با نماد Sigma نشان داده میشود:σ
واریانس معمولاً با نماد Sigma Square نشان داده میشود σ2 نشاندهی
جمعبندی فصل
انحراف معیار و واریانس اصطلاحاتی هستند که در یادگیری ماشین به طور متداول استفاده میشوند، بنابراین مهم است که بدانیم چگونه آنها را به دست آوریم و مفاهیم پشت آنها را بدانیم.
- صفحه قبل مقیاس میانگین و مد
- صفحه بعدی دوئدهمین درصد