Apprentissage automatique - Introduction
- Page précédente ufuncs NumPy
- Page suivante Mode médiane moyen
L'apprentissage automatique permet aux ordinateurs d'apprendre à partir de données et d'informations statistiques.
L'apprentissage automatique est l'un des pas vers l'intelligence artificielle (IA).
L'apprentissage automatique est un programme capable d'analyser les données et d'apprendre à prédire des résultats.
Où commencer ?
Dans ce tutoriel, nous retournerons à la mathématique et étudierons la statistique, ainsi que la manière de calculer des valeurs importantes à partir des ensembles de données.
Nous allons également apprendre à utiliser divers modules Python pour obtenir les réponses nécessaires.
Et nous allons également apprendre à écrire des fonctions capables de prédire des résultats en fonction des connaissances acquises.
Ensemble de données
Dans un ordinateur, un ensemble de données fait référence à toute collection de données. Cela peut être tout, de l'array à une base de données complète.
Exemple d'un tableau :
[99,86,87,88,111,86,103,87,94,78,77,85,86]
Exemple d'une base de données :
Nom du véhicule | Couleur | Âge | Vitesse | AutoPass |
---|---|---|---|---|
BMW | rouge | 5 | 99 | Y |
Volvo | noir | 7 | 86 | Y |
VW | gris | 8 | 87 | N |
VW | blanc | 7 | 88 | Y |
Ford | blanc | 2 | 111 | Y |
VW | blanc | 17 | 86 | Y |
Tesla | rouge | 2 | 103 | Y |
BMW | noir | 9 | 87 | Y |
Volvo | gris | 4 | 94 | N |
Ford | blanc | 11 | 78 | N |
Toyota | gris | 12 | 77 | N |
VW | blanc | 9 | 85 | N |
Toyota | bleu | 6 | 86 | Y |
En examinant l'array, nous pouvons deviner que la valeur moyenne pourrait être d'environ 80 ou 90, et nous pouvons également déterminer la valeur maximale et minimale, mais que pouvons-nous encore faire ?
En regardant la base de données, nous pouvons voir que la couleur la plus populaire est le blanc, l'âge des véhicules le plus ancien est de 17 ans, mais que faire si nous pouvions prédire si un véhicule a AutoPass en ne regardant que d'autres valeurs ?
C'est l'objectif de l'apprentissage automatique ! Analyse des données et prédiction des résultats !
Dans l'apprentissage automatique, on utilise généralement de très grandes bases de données. Dans ce tutoriel, nous essaierons de vous faire comprendre le plus simplement possible les différents concepts de l'apprentissage automatique, en utilisant des ensembles de données de petite taille faciles à comprendre.
Type de données
Pour analyser les données, il est très important de comprendre le type de données que nous devons traiter.
Nous pouvons classer les types de données en trois catégories principales :
- Numérique
- Catégoriel
- Ordinal
Données numériquesSont des nombres qui peuvent être divisés en deux catégories de valeurs :
- Données discrètes (Discrete Data)
- - Numéros limités aux entiers. Par exemple : le nombre de voitures passées.
- Données continues (Continuous Data)
- - Numéros avec des valeurs infinies. Par exemple : le prix d'un article ou la taille d'un article.
Données catégoriellesSont des valeurs non mesurables entre elles. Par exemple : les valeurs de couleur ou toute valeur yes/no.
Données ordinalesSimilaire aux données catégorielles, mais mesurables entre elles. Exemple : les résultats scolaires d'un A supérieur à un B, etc.
En comprenant le type de données du source des données, vous pouvez savoir quel type de technologie utiliser lors de l'analyse des données.
Dans le prochain chapitre, vous apprendrez davantage sur les statistiques et l'analyse des données.
- Page précédente ufuncs NumPy
- Page suivante Mode médiane moyen