Einführung in maschinelles Lernen
- Vorherige Seite ufuncs in NumPy
- Nächste Seite Mittelwertmodus
Maschinelles Lernen ermöglicht es Computern, aus Daten und statistischen Informationen zu lernen.
Maschinelles Lernen ist ein Schritt in Richtung Künstlicher Intelligenz (KI).
Maschinelles Lernen ist ein Programm, das Daten analysieren und Ergebnisse vorhersehen kann.
Wo fange ich an?
In diesem Tutorial kehren wir zur Mathematik zurück und untersuchen Statistik und wie man wichtige Werte auf Basis eines Datenbestands berechnet.
Wir werden auch lernen, wie wir mit verschiedenen Python-Modulen die benötigten Antworten erhalten.
Und wir werden lernen, wie wir auf Basis unseres Wissens Funktionen schreiben können, die Ergebnisse vorhersehen.
Datenbestand
In der Computerwissenschaft bezieht sich der Datenbestand auf jede Art von Datensatz. Es kann alles von einem Array bis zu einer vollständigen Datenbank sein.
Ein Beispiel für ein Array:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
Ein Beispiel für eine Datenbank:
Fahrzeugname | Farbe | Alter | Geschwindigkeit | AutoPass |
---|---|---|---|---|
BMW | rot | 5 | 99 | Y |
Volvo | schwarz | 7 | 86 | Y |
VW | grau | 8 | 87 | N |
VW | weiß | 7 | 88 | Y |
Ford | weiß | 2 | 111 | Y |
VW | weiß | 17 | 86 | Y |
Tesla | rot | 2 | 103 | Y |
BMW | schwarz | 9 | 87 | Y |
Volvo | grau | 4 | 94 | N |
Ford | weiß | 11 | 78 | N |
Toyota | grau | 12 | 77 | N |
VW | weiß | 9 | 85 | N |
Toyota | blau | 6 | 86 | Y |
Durch das Überprüfen des Arrays können wir vermuten, dass der Durchschnitt möglicherweise etwa 80 oder 90 beträgt, und wir können auch das Maximum und das Minimum bestimmen, aber was können wir noch tun?
Durch das Betrachten der Datenbank können wir sehen, dass die beliebtesten Farben Weiß sind, der älteste Fahrzeuge Alter ist 17 Jahre alt, aber was passiert, wenn man nur durch das Betrachten anderer Werte vorhersehen kann, ob ein Auto AutoPass hat?
Das ist das Ziel des maschinellen Lernens! Daten analysieren und Ergebnisse vorherzusagen!
In der maschinellen Lernung werden in der Regel sehr große Datensätze verwendet. In diesem Tutorial werden wir versuchen, Ihnen die verschiedenen Konzepte des maschinellen Lernens so einfach wie möglich zu vermitteln und kleine Datenmengen zu verwenden.
Datentypen
Um Daten zu analysieren, ist es sehr wichtig zu verstehen, welche Datentypen wir behandeln.
Wir können die Datentypen in drei Hauptkategorien einteilen:
- Numerisch (Numerical)
- Kategorie (Categorical)
- Ordnung (Ordinal)
Numerische DatenSind Zahlen, die in zwei numerische Kategorien unterteilt werden können:
- Diskrete Daten (Discrete Data)
- - Begrenzt auf ganze Zahlen. Beispiel: Die Anzahl der durchgegangenen Autos.
- Kontinuierliche Daten (Continuous Data)
- - Besitzt unendlich viele Werte. Beispiel: Der Preis eines Produkts oder die Größe eines Produkts.
Kategorische DatenSind Werte, die nicht messbar miteinander sind. Beispiel: Farbenwerte oder jede ja/nein-Werte.
OrdnungsdatenÄhnlich wie kategorische Daten, aber messbar miteinander. Beispiel: Eine Schule, die A über B in der Schulnote优于, und so weiter.
Durch die Kenntnis der Datentypen der Datenquelle können Sie wissen, welche Techniken Sie bei der Datenanalyse verwenden.
In dem nächsten Kapitel werden Sie mehr über Statistik und Datenanalyse lernen.
- Vorherige Seite ufuncs in NumPy
- Nächste Seite Mittelwertmodus