Κανονική Διανομή Δεδομένων Μηχανικής Μάθησης

Κανονική κατανομή δεδομένων (Normal Data Distribution)

Στο προηγούμενο κεφάλαιο, μάθαμε πώς να δημιουργήσουμε έναν πίνακα μεγέθους και να τον γεμίσουμε με δεδομένα που είναι πλήρως τυχαία μεταξύ δύο δεδομένων τιμών.

Σε αυτό το κεφάλαιο, θα μάθουμε πώς να δημιουργήσουμε έναν πίνακα που θα συγκεντρώνει τιμές γύρω από μια δεδομένη τιμή.

Στην πιθανολογία, μετά την πρόταση της συντακτικής φόρμας αυτής της κατανομής δεδομένων από τον μαθηματικό Καρλ Φρίντριχ Γάουσ (Carl Friedrich Gauss), αυτή η κατανομή δεδομένων ονομάστηκε κανονική κατανομή δεδομένων ή κατανομή Γάουσ.

Παράδειγμα

Τυπική κανονική κατανομή δεδομένων:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()

Αποτελέσματα:


Εκτέλεση Παραδείγματος

Σημείωση:Επειδή η καμπύλη καμπύλη καμπύλη έχει τη μορφή κώμματος, γι 'αυτό ονομάζεται και καμπύλη κώμματος.

Επεξήγηση Ιστογράμματος

Χρησιμοποιούμε numpy.random.normal() Ο πίνακας που δημιουργήθηκε με μέθοδο (με 100000 τιμές) θα εμφανιστεί ως ιστογράμμα με 100 στήλες.

Ορίζουμε την μέση τιμή ως 5.0 και την τυπική απόκλιση ως 1.0.

Αυτό σημαίνει ότι αυτές οι τιμές θα πρέπει να συγκεντρωθούν γύρω από 5.0 και να είναι σπάνια αποκλίσεις από την μέση τιμή 1.0.

Από το ιστογράμμα μπορούμε να δούμε ότι οι περισσότερες τιμές βρίσκονται μεταξύ 4.0 και 6.0, με το υψηλότερο όριο περίπου 5.0.