Maschinelles Lernen - Mittelwert-Modus
- Vorherige Seite Einführung
- Nächste Seite Standardabweichung
Durchschnitt, Median und Modus
Was können wir aus einer Gruppe von Zahlen lernen?
In der maschinellen Lernung (und Mathematik) gibt es in der Regel drei Werte, die wir interessieren:
- Durchschnitt (Mean) - Der Durchschnittswert
- Median (Median) - Der Mittelpunktswert, auch Median genannt
- Modus (Mode) - Der häufigste Wert
Zum Beispiel: Wir haben die Geschwindigkeiten von 13 Autos registriert:
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
Was ist der durchschnittliche, mittlere oder häufigste Geschwindigkeitswert?
Median
Die durchschnittliche Werte ist der Durchschnittswert.
Um den Durchschnittswert zu berechnen, finden Sie den Gesamtwert aller Werte und teilen Sie diesen durch die Anzahl der Werte:
(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77
Der NumPy-Modul verfügt über Methoden zu diesem Zweck:
Beispiel
Verwenden Sie NumPy mean()
Die Methode bestimmt die durchschnittliche Geschwindigkeit:
import numpy speed = [99,86,87,88,111,86,103,87,94,78,77,85,86] x = numpy.mean(speed) print(x)
Median
Der Median ist der mittlere Wert nach dem Sortieren aller Werte:
77, 78, 85, 86, 86, 86, 87, 87, 88, 94, 99, 103, 111
Es ist wichtig, die Zahlen zu sortieren, bevor das Medianwert gefunden wird.
Der NumPy-Modul verfügt über Methoden zu diesem Zweck:
Beispiel
Verwenden Sie NumPy median()
Methode zum Finden des Mittleren Werts:
import numpy speed = [99,86,87,88,111,86,103,87,94,78,77,85,86] x = numpy.median(speed) print(x)
Wenn zwei Ziffern in der Mitte vorhanden sind, teilen Sie die Summe dieser Ziffern durch 2.
, 77, 78, 85, 86, 86, 86, 87, 87, 94, 98, 99, 103 (86 + 87) / 2 = 86.5
Beispiel
Verwenden Sie das NumPy-Modul:
import numpy speed = [99,86,87,88,86,103,87,94,78,77,85,86] x = numpy.median(speed) print(x)
Modus
Der Modus ist der häufigste Wert:
99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86 = 86
Der SciPy-Modul verfügt über Methoden für diesen Zweck:
Beispiel
Verwenden Sie SciPy mode()
Methode zum Finden der häufigsten Zahl:
from scipy import stats speed = [99,86,87,88,111,86,103,87,94,78,77,85,86] x = stats.mode(speed) print(x)
Kapitelzusammenfassung
Mittelwert, Median und Modus sind oft verwendete Techniken in der Maschinenlernen, daher ist es wichtig, die dahinter liegenden Konzepte zu verstehen.
- Vorherige Seite Einführung
- Nächste Seite Standardabweichung