Aprendizado de Máquina - Modos Média/Moda

Média, mediana e modo

O que podemos aprender de um conjunto de números?

Em aprendizado de máquina (e matemática), geralmente existem três valores que nos interessam:

  • Média (Mean) - A média
  • Mediana (Median) - O ponto central, também conhecido como mediana
  • Modo (Mode) - O valor mais comum

Por exemplo: já registramos as velocidades de 13 veículos:

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

O que é a média, a mediana ou o valor mais comum?

Média

A média é o valor médio.

Para calcular a média, encontre a soma total de todos os valores e divida pelo número de valores:

(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77

O módulo NumPy possui métodos para esse propósito:

Exemplo

Use NumPy mean() O método determina a velocidade média:

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)

Executar Exemplo

Mediana

A mediana é o valor central após a ordenação de todos os valores:

77, 78, 85, 86, 86, 86, 87, 87, 88, 94, 99, 103, 111

É importante ordenar os números antes de encontrar a mediana.

O módulo NumPy possui métodos para esse propósito:

Exemplo

Use NumPy median() Método para encontrar o valor central:

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

Executar Exemplo

Se houver dois números no meio, some esses números e divida pelo 2.

, 77, 78, 85, 86, 86, 86, 87, 87, 94, 98, 99, 103
(86 + 87) / 2 = 86.5

Exemplo

Use o módulo NumPy:

import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

Executar Exemplo

Moda

A moda é o valor que ocorre mais vezes:

99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86 = 86

O módulo SciPy possui métodos para esse propósito:

Exemplo

Use SciPy mode() Método para encontrar o número que ocorre mais vezes:

from scipy import stats
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)

Executar Exemplo

Resumo do Capítulo

Média, mediana e moda são técnicas frequentemente usadas na aprendizagem de máquina, portanto, é importante entender os conceitos por trás delas.