Machine Learning - Standard Deviation
- Nakaraang Pahina Pangunguhit Ng Kadahilanan At Median
- Susunod Na Pahina Porsyento
Ano ang standard deviation?
Ang standard deviation (Standard Deviation, kilala din bilang mean square deviation) ay isang numero na naglalarawan sa antas ng pagkalat ng mga halaga.
Ang mababang standard deviation ay nangangahulugan na ang karamihan ng mga numero ay malapit sa katamtaman (katamtaman).
Ang mataas na standard deviation ay nangangahulugan na ang mga halaga ay nananatiling mas malawak na saklaw.
Halimbawa: Sa panahong ito, nirekord namin ang bilang ng 7 na kalsada na bilis:
speed = [86,87,88,86,87,85,86]
Ang standard deviation ay isang numero na naglalarawan sa antas ng pagkalat ng mga halaga.
0.9
Ito ay nangangahulugan na ang karamihan ng mga halaga ay nasa saklaw ng 0.9 ng katamtaman, na 86.4.
Hayaan natin na gamitin ang mas malawak na saklaw ng mga numero:
speed = [32,111,138,28,59,77,97]
Ang standard deviation ay isang numero na naglalarawan sa antas ng pagkalat ng mga halaga.
37.85
Ito ay nangangahulugan na ang karamihan ng mga halaga ay nasa saklaw ng 37.85 ng pagkakalat ng katamtaman (katamtaman ay 77.4).
Tulad ng nakikita ninyo, ang mataas na standard deviation ay nangangahulugan na ang mga halaga ay nananatiling mas malawak na saklaw.
Ang NumPy module ay may paraan para magsagawa ng standard deviation:
Halimbawa
Gumamit ng NumPy std()
Para sa paghahanap ng standard deviation:
Import Numpy speed = [86,87,88,86,87,85,86] x = numpy.std(speed) print(x)
Halimbawa
Import Numpy speed = [32,111,138,28,59,77,97] x = numpy.std(speed) print(x)
Varian
Ang varian ay isa pang numero na nagtutukoy sa antas ng pagkalat ng mga halaga.
Sa katunayan, kapag ginagamit ang katamtaman ng varian, makakakuha ka ng standard deviation!
O vice versa, kapag pinagpangkat ng sarili ang standard deviation, makakakuha ka ng varian!
Kung gusto mong kalkulahin ang varian, dapat mo gawin ang sumusunod:
1. Humuhubog sa pagkakalat:
(32+111+138+28+59+77+97) / 7 = 77.4
2. Para sa bawat halaga:
32 - 77.4 = -45.4 111 - 77.4 = 33.6 138 - 77.4 = 60.6 28 - 77.4 = -49.4 59 - 77.4 = -18.4 77 - 77.4 = - 0.4 97 - 77.4 = 19.6
3. Para sa bawat pagkakaiba:
(-45.4)2 = 2061.16 (33.6)2 = 1128.96 (60.6)2 = 3672.36 (-49.4)2 = 2440.36 (-18.4)2 = 338.56 (- 0.4)2 = 0.16 (19.6)2 = 384.16
4. Ang Variance ay ang karaniwang value ng mga squared differences:
(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2
Masarap na, ang NumPy ay may isang pamamaraan upang kalkulahin ang Variance:
Halimbawa
Gumamit Ng NumPy var()
Ang pamamaraan upang matukoy ang Variance:
Import Numpy speed = [32,111,138,28,59,77,97] x = numpy.var(speed) print(x)
Standard Deviation
Kung alam natin, ang formula ng pagkalkula ng Standard Deviation ay ang katapusan ng square ng variance:
√ 1432.25 = 37.85
O, tulad ng halimbawa sa itaas, gamitin ang NumPy upang kalkulahin ang Standard Deviation:
Halimbawa
Gumamit ng NumPy std() method upang hanapin ang Standard Deviation:
Import Numpy speed = [32,111,138,28,59,77,97] x = numpy.std(speed) print(x)
Simbolo
Ang Standard Deviation ay palamang ginamit ng Sigma simbolo:σ
Ang Variance ay palamang ginamit ng Sigma Square simbolo σ2 Ipakita
Buwanang Salaysay
Ang Standard Deviation At Variance ay mga pangunahing terimong ginamit sa machine learning, kaya mahalaga na malaman kung paano kunin sila at ang mga konseptong nasa likod nito.
- Nakaraang Pahina Pangunguhit Ng Kadahilanan At Median
- Susunod Na Pahina Porsyento