Aprendizado de Máquina - Introdução

A aprendizagem de máquina permite que computadores aprendam a partir de dados de pesquisa e informações estatísticas.

A aprendizagem de máquina é um passo na direção da inteligência artificial (IA).

A aprendizagem de máquina é um programa que pode analisar dados e aprender a prever resultados.

Por onde começar?

Neste tutorial, retornaremos à matemática e estudaremos a estatística, bem como como calcular valores importantes com base em conjuntos de dados.

Também aprenderemos a usar vários módulos Python para obter as respostas necessárias.

E, também aprenderemos a escrever funções que possam prever resultados com base no que aprendemos.

Conjunto de dados

Em computadores, um conjunto de dados se refere a qualquer conjunto de dados. Pode ser tudo, desde um array até um banco de dados completo.

Um exemplo de array:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

Um exemplo de banco de dados:

Nomedocarro Cor Idade Velocidade AutoPass
BMW vermelho 5 99 Y
Volvo preto 7 86 Y
VW cinzento 8 87 N
VW branco 7 88 Y
Ford branco 2 111 Y
VW branco 17 86 Y
Tesla vermelho 2 103 Y
BMW preto 9 87 Y
Volvo cinzento 4 94 N
Ford branco 11 78 N
Toyota cinzento 12 77 N
VW branco 9 85 N
Toyota azul 6 86 Y

Através da visualização do array, podemos conjecturar que a média pode estar em torno de 80 ou 90, e também podemos determinar o valor máximo e o valor mínimo, mas o que mais podemos fazer?

Ao olhar para o banco de dados, podemos ver que a cor mais popular é branca, a idade do carro mais antigo é de 17 anos, mas e se pudéssemos prever se um carro tem AutoPass apenas olhando para outros valores?

Este é o objetivo da aprendizagem de máquina! Analisar dados e prever resultados!

Na aprendizagem de máquina, geralmente usamos conjuntos de dados muito grandes. Neste tutorial, tentaremos tornar o aprendizado de máquina o mais fácil possível para você, usando alguns conjuntos de dados pequenos e fáceis de entender.

Tipo de Dados

Para analisar dados, é muito importante entender o tipo de dados que estamos lidando.

Podemos classificar os tipos de dados em três categorias principais:

  • Numérico
  • Categórico
  • Ordinal

Dados NuméricosSão números que podem ser classificados em duas categorias de valores:

Dados Discretos (Discrete Data)
- Número limitado a inteiros. Exemplo: número de carros passando.
Dados Contínuos (Continuous Data)
- Número com valores infinitos. Exemplo: preço de um produto ou tamanho de um produto.

Dados QualitativosSão valores que não podem ser medidos uns pelos outros. Exemplo: valores de cor ou qualquer valor yes/no.

Dados OrdinaisSemelhante aos dados qualitativos, mas que podem ser medidos. Exemplo: Notas escolares de A para B, por exemplo.

Ao entender o tipo de dados da fonte de dados, você pode saber qual técnica usar ao analisar dados.

No próximo capítulo, você aprenderá mais sobre estatísticas e análise de dados.