Aprendizaje automático - Introducción
- Página anterior ufuncs de NumPy
- Página siguiente Modo de mediana promedio
El aprendizaje automático permite que las computadoras aprendan de datos de investigación y estadísticas.
El aprendizaje automático es un paso hacia la dirección de la inteligencia artificial (IA).
El aprendizaje automático es un programa que puede analizar datos y aprender a predecir resultados.
¿Dónde comenzar?
En este tutorial, volveremos a la matemática y estudiaremos la estadística, así como cómo calcular valores importantes basados en el conjunto de datos.
También aprenderemos a usar varios módulos de Python para obtener las respuestas necesarias.
Además, aprenderemos a escribir funciones que puedan predecir resultados basadas en lo que hemos aprendido.
Conjunto de datos
En la computadora, un conjunto de datos se refiere a cualquier colección de datos. Puede ser cualquier contenido desde un array hasta una base de datos completa.
Ejemplo de array:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
Ejemplo de base de datos:
Nombredelcoche | Color | Edad | Velocidad | AutoPass |
---|---|---|---|---|
BMW | rojo | 5 | 99 | S |
Volvo | negro | 7 | 86 | S |
VW | gris | 8 | 87 | N |
VW | blanco | 7 | 88 | S |
Ford | blanco | 2 | 111 | S |
VW | blanco | 17 | 86 | S |
Tesla | rojo | 2 | 103 | S |
BMW | negro | 9 | 87 | S |
Volvo | gris | 4 | 94 | N |
Ford | blanco | 11 | 78 | N |
Toyota | gris | 12 | 77 | N |
VW | blanco | 9 | 85 | N |
Toyota | azul | 6 | 86 | S |
Al examinar el array, podemos suponer que el promedio puede estar alrededor de 80 o 90, y también podemos determinar el valor máximo y mínimo, pero ¿qué más podemos hacer?
Al ver la base de datos, podemos ver que el color más popular es el blanco, la antigüedad del vehículo más antiguo es de 17 años, pero ¿qué pasa si solo viendo otros valores podemos predecir si un automóvil tiene AutoPass?
¡Eso es el objetivo del aprendizaje automático! Analizar datos y predecir resultados!
En el aprendizaje automático, se utilizan generalmente conjuntos de datos muy grandes. En este tutorial, intentaremos que entiendas lo más fácilmente posible los diferentes conceptos del aprendizaje automático y utilizaremos algunos conjuntos de datos pequeños y fáciles de entender.
Tipos de datos
Para analizar datos, es muy importante entender el tipo de datos con el que estamos trabajando.
Podemos clasificar los tipos de datos en tres categorías principales:
- Numérico
- Cualitativo
- Ordinal
Datos numéricosSon números que se pueden dividir en dos categorías de valores:
- Datos discretos (Discrete Data)
- - Números limitados a enteros. Por ejemplo: el número de autos que pasan.
- Datos continuos (Continuous Data)
- - Números con valores infinitos. Por ejemplo: el precio de un producto o el tamaño de un producto.
Datos cualitativosSon valores que no se pueden medir entre sí. Por ejemplo: valores de color o cualquier valor sí/no.
Datos ordinalSimilares a los datos cualitativos, pero pueden ser medidos entre sí. Ejemplo: Las calificaciones escolares de A son mejores que las de B, y así sucesivamente.
Al conocer los tipos de datos de la fuente de datos, puedes saber qué técnicas usar al analizar los datos.
En el siguiente capítulo, aprenderás más sobre estadísticas y análisis de datos.
- Página anterior ufuncs de NumPy
- Página siguiente Modo de mediana promedio