Μηχανική Μάθηση - Διασπορά

Τι είναι η μέση απόκλιση?

Η μέση απόκλιση (Standard Deviation, συχνά ονομάζεται και μέση απόκλιση) είναι ένας αριθμός που περιγράφει το βαθμό διακύμανσης των τιμών.

Χαμηλή μέση απόκλιση σημαίνει ότι οι περισσότερες τιμές βρίσκονται κοντά στη μέση τιμή (η μέση τιμή).

Υψηλή μέση απόκλιση σημαίνει ότι αυτές οι τιμές διανέμονται σε ευρύτερο εύρος.

Παράδειγμα: αυτή τη φορά έχουμε καταγράψει την ταχύτητα 7 αυτοκινήτων:

geschwindigkeit = [86,87,88,86,87,85,86]

Η μέση απόκλιση είναι:

0.9

Αυτό σημαίνει ότι οι περισσότερες τιμές βρίσκονται στο εύρος της μέσης τιμής 0.9, δηλαδή 86.4.

Ας χειριστούμε μια ομάδα αριθμών με μεγαλύτερο εύρος:

speed = [32,111,138,28,59,77,97]

Η μέση απόκλιση είναι:

37.85

Αυτό σημαίνει ότι οι περισσότερες τιμές βρίσκονται στο εύρος της μέσης τιμής (η μέση τιμή είναι 77.4) 37.85.

Ως όπου φαίνεται, υψηλή μέση απόκλιση σημαίνει ότι αυτές οι τιμές διανέμονται σε ευρύτερο εύρος.

Το μονόπτυμμα NumPy έχει έναν τρόπο υπολογισμού της μέσης απόκλισης:

Παράδειγμα

Χρησιμοποιήστε το NumPy std() Μέθοδος εύρεσης της μέσης απόκλισης:

import numpy
geschwindigkeit = [86,87,88,86,87,85,86]
x = numpy.std(geschwindigkeit)
print(x)

Εκτέλεση Παραδείγματος

Παράδειγμα

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(geschwindigkeit)
print(x)

Εκτέλεση Παραδείγματος

Διακύμανση

Η διακύμανση είναι ένας άλλος αριθμός που δείχνει το βαθμό διακύμανσης των τιμών.

Πράγματι, αν χρησιμοποιήσετε τη Ͽαυτότητα της διακύμανσης, θα��ήσετε τη μέση απόκλιση!

ή αντίθετα, αν πολλαπλασιάσετε τη μέση απόκλιση με την ίδια, θα��ήσετε τη διακύμανση!

Για να υπολογίσετε τη διακύμανση, πρέπει να εκτελέσετε τις παρακάτω ενέργειες:

1. Ζητήστε την μέση τιμή:

(32+111+138+28+59+77+97) / 7 = 77.4

2. Για κάθε τιμή: βρείτε τη διαφορά από την μέση τιμή:

 32 - 77.4 = -45.4
111 - 77.4 =  33.6
138 - 77.4 =  60.6
 28 - 77.4 = -49.4
 59 - 77.4 = -18.4
 77 - 77.4 = - 0.4
 97 - 77.4 =  19.6

3. Για κάθε διαφορά: βρείτε το τετράγωνο:

(-45.4)2 = 2061.16 
 (33.6)2 = 1128.96 
 (60.6)2 = 3672.36 
(-49.4)2 (-49.4) 
= 2440.362 (-18.4) 
=  338.562 (- 0.4) 
 =    0.162 (19.6)

= 384.16

4. Η διάταξη είναι η μέση τιμή των τετραγώνων διαφορών αυτών:

(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2

Παράδειγμα

Fortunately, NumPy has a method for calculating variance: var() Μέθοδος καθορισμού διάταξης:

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.var(speed)
print(x)

Εκτέλεση Παραδείγματος

Τυπική Απόκλιση

Ως γνωστόν, η εξίσωση για τον υπολογισμό της τυπικής απόκλισης είναι η rădούσια της διάταξης

√ 1432.25 = 37.85

ή όπως στο παραπάνω παράδειγμα, χρησιμοποιήστε το NumPy για να υπολογίσετε την τυπική απόκλιση:

Παράδειγμα

Χρησιμοποιήστε τη μέθοδο std() του NumPy για να βρείτε την τυπική απόκλιση:

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)

Εκτέλεση Παραδείγματος

Σύμβολο

Η τυπική απόκλιση συχνά εκφράζεται με το σύμβολο του Σίγματοςσ

Η διάταξη συχνά υποδεικνύεται με το σύμβολο του κουβόπουλου του Σίγματος σ2 Αναπαράσταση

Συνοπτική Περιγραφή Κεφαλίδων

Η τυπική απόκλιση και η διάταξη είναι συχνά όροι στη μηχανική μάθηση, οπότε είναι πολύ σημαντικό να κατανοήσουμε πώς να τους πάρουμε και τις έννοιες πίσω τους.