Διανομή Δεδομένων Μηχανικής Μάθησης
- Προηγούμενη Σελίδα Περαστικός Αριθμός
- Επόμενη Σελίδα Κανονική Διανομή Δεδομένων
Διανομή δεδομένων (Data Distribution)
Στην αρχή του οδηγού, χρησιμοποιήσαμε μόνο ένα πολύ μικρό σύνολο δεδομένων στα παραδείγματα, με σκοπό να κατανοήσουμε διαφορετικές έννοιες.
Στην πραγματικότητα, τα σύνολα δεδομένων είναι πολύ μεγαλύτερα, αλλά τουλάχιστον στην αρχή του έργου, είναι δύσκολο να συλλέξουμε δεδομένα από την πραγματικότητα.
Πώς μπορούμε να αποκτήσουμε μεγάλα σύνολα δεδομένων;
Για να δημιουργήσουμε ένα μεγάλο σύνολο δεδομένων για δοκιμή, χρησιμοποιούμε το Python μονάδα NumPy, η οποία περιέχει πολλά μέσα για τη δημιουργία τυχαίων δεδομένων οποιουδήποτε μεγέθους.
Παράδειγμα
Δημιουργία μιας πίνακα που περιέχει 250 τυχαία αριθμοί πόντους μεταξύ 0 και 5:
import numpy x = numpy.random.uniform(0.0, 5.0, 250) print(x)
Διάγραμμα πυραμίδας
Για να καταγράψουμε τη διανομή δεδομένων, μπορούμε να διαγράψουμε το διάγραμμα πυραμίδας των συλλεγμένων δεδομένων.
Θα χρησιμοποιήσουμε το Python μονάδα Matplotlib για να διαγράψουμε το διάγραμμα πυραμίδας:
Παράδειγμα
Διαγράμματα πυραμίδας:
import numpy import matplotlib.pyplot as plt x = numpy.random.uniform(0.0, 5.0, 250) plt.hist(x, 5) plt.show()
Αποτελέσματα:

Επεξήγηση του Γραφήματος
Χρησιμοποιούμε τον πίνακα από το παραπάνω παράδειγμα για να رسمουμε 5 κολόνες.
Το πρώτο στήλο αντιπροσωπεύει πόσα τιμές του πίνακα είναι μεταξύ 0 και 1.
Το δεύτερο στήλο αντιπροσωπεύει πόσα αριθμητικά είναι μεταξύ 1 και 2.
και άλλα.
Τα αποτελέσματα που获得了 είναι:
52 τιμές είναι μεταξύ 0 και 1 48 τιμές είναι μεταξύ 1 και 2 49 τιμές είναι μεταξύ 2 και 3 51 τιμές είναι μεταξύ 3 και 4 50 τιμές είναι μεταξύ 4 και 5
Σημείωση:Οι τιμές του πίνακα είναι τυχαίες αριθμοί και δεν θα εμφανιστούν πλήρως ταυτόσημα στο υπολογιστή σας.
Διανομή Μεγάλων Δεδομένων
Ένας πίνακας με 250 τιμές δεν θεωρείται μεγάλος, αλλά τώρα γνωρίζετε πώς να δημιουργήσετε έναν σύνολο τυχαίων τιμών και να δημιουργήσετε συλλογές δεδομένων της επιθυμητής κλίμακας με αλλαγή των παραμέτρων.
Παράδειγμα
Δημιουργία ενός πίνακα με 100000 τυχαίων αριθμών και εμφάνιση των με 100 στήλες γραφήματος:
import numpy import matplotlib.pyplot as plt x = numpy.random.uniform(0.0, 5.0, 100000) plt.hist(x, 100) plt.show()
- Προηγούμενη Σελίδα Περαστικός Αριθμός
- Επόμενη Σελίδα Κανονική Διανομή Δεδομένων