Εισαγωγή στη Μηχανική Μάθηση

Η μηχανική μάθηση επιτρέπει στα υπολογιστικά να μαθαίνουν από δεδομένα και στατιστικές πληροφορίες.

Η μηχανική μάθηση είναι ένα βήμα προς την κατεύθυνση της τεχνητής νοημοσύνης (AI).

Η μηχανική μάθηση είναι ένα πρόγραμμα που μπορεί να αναλύει δεδομένα και να μαθαίνει να προβλέπει αποτελέσματα.

Πού να ξεκινήσουμε;

Σε αυτό το tutorial, θα επιστρέψουμε στη μαθηματική και θα μελετήσουμε τη στατιστική, καθώς και πώς να υπολογίσουμε σημαντικές τιμές με βάση τη συλλογή δεδομένων.

Θα μάθουμε επίσης πώς να χρησιμοποιούμε διάφορα μοντέλα Python για να βρούμε τις απαντήσεις που χρειαζόμαστε.

Και θα μάθουμε πώς να γράφουμε λειτουργίες που μπορούν να προβλέψουν αποτελέσματα με βάση τις γνώσεις μας.

Συλλογή δεδομένων

Στα υπολογιστικά, η συλλογή δεδομένων αναφέρεται σε οποιαδήποτε συλλογή δεδομένων. Μπορεί να είναι από πίνακα μέχρι ολόκληρη βάση δεδομένων.

Ένας παράδειγμα πίνακα:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

Ένας παράδειγμα βάσης δεδομένων:

Όνομα Αυτοκινήτου Χρώμα Ηλικία Σύγχυση AutoPass
BMW κόκκινο 5 99 Y
Volvo μαύρο 7 86 Y
VW γκρίζα 8 87 N
VW λευκό 7 88 Y
Ford λευκό 2 111 Y
VW λευκό 17 86 Y
Tesla κόκκινο 2 103 Y
BMW μαύρο 9 87 Y
Volvo γκρίζα 4 94 N
Ford λευκό 11 78 N
Toyota γκρίζα 12 77 N
VW λευκό 9 85 N
Toyota μπλε 6 86 Y

Με τον έλεγχο του πίνακα, μπορούμε να υποθέσουμε ότι η μέση τιμή μπορεί να είναι περίπου 80 ή 90, και μπορούμε επίσης να καθορίσουμε το μέγιστο και το ελάχιστο, αλλά τι περισσότερο μπορούμε να κάνουμε;

Με την εξέταση της βάσης δεδομένων, μπορούμε να δούμε ότι η πιο δημοφιλής απόχρωση είναι το λευκό, η πιο παλιά ηλικία του αυτοκινήτου είναι 17 χρόνια, αλλά τι θα κάνουμε αν μπορούσαμε να προβλέψουμε αν ένα αυτοκίνητο έχει AutoPass μόνο με την εξέταση άλλων τιμών;

Αυτό είναι ο στόχος της μηχανικής μάθησης! Ανάλυση δεδομένων και πρόβλεψη αποτελεσμάτων!

Στη μηχανική μάθηση, χρησιμοποιούνται συνήθως μεγάλα σύνολα δεδομένων. Σε αυτό το μάθημα, προσπαθούμε να σας κάνουμε να κατανοήσετε όσο το δυνατόν πιο εύκολα τις διαφορετικές έννοιες της μηχανικής μάθησης και θα χρησιμοποιήσουμε μικρά σύνολα δεδομένων που είναι εύκολα κατανοητά.

Τύπος δεδομένων

Για να αναλύσουμε δεδομένα, είναι πολύ σημαντικό να γνωρίζουμε τον τύπο των δεδομένων που θα χειριστούμε.

Μπορούμε να κατηγορίσουμε τους τύπους δεδομένων σε τρεις κύριες κατηγορίες:

  • Αριθμητικό (Numerical)
  • Κατηγορία (Categorical)
  • Τάξη (Ordinal)

Αριθμητικά δεδομέναΕίναι αριθμοί που μπορούν να κατηγοριοποιηθούν σε δύο τύπους τιμών:

Διασπασμένα δεδομένα (Discrete Data)
- Αριθμητικά που περιορίζονται σε ακέραιους αριθμούς. Παράδειγμα: ο αριθμός των αυτοκινήτων που περνούν.
Συνεχής δεδομένα (Continuous Data)
- Αριθμητικά με άπειρες τιμές. Παράδειγμα: το κόστος ενός προϊόντος ή το μέγεθος ενός προϊόντος.

Κατηγορικά δεδομέναΕίναι αξίες που δεν μπορούν να μετρηθούν μεταξύ τους. Παράδειγμα: τινά χρώματα ή οποιαδήποτε yes/no αξία.

Αριθμητικά δεδομένα τάξηςΠαρόμοια με τα κατηγορικά δεδομένα, αλλά μπορούν να μετρηθούν μεταξύ τους. Παράδειγμα: Αξιολογήσεις σχολείων που είναι καλύτερες από το B, και ούτω καθεξής.

Με την κατανόηση του τύπου δεδομένων της πηγής δεδομένων, μπορείτε να ξέρετε ποιον τύπο τεχνικής να χρησιμοποιήσετε κατά τη διάρκεια της ανάλυσης δεδομένων.

Στο επόμενο κεφάλαιο, θα μάθετε περισσότερα για την στατιστική και την ανάλυση δεδομένων.