Перцентили в машинном обучении

Что такое百分иля?

В статистике百分или (Percentiles) предоставляют вам число, которое описывает значение, которое меньше заданного процента.

Например: предположим, что у нас есть массив, содержащий ages людей, живущих на одной улице.

ages = [5,31,43,48,50,41,7,11,15,39,80,82,32,2,8,6,25,36,27,61,31]

Что такое 75-я百分иля? Ответ: 43, что означает, что 75% людей имеют 43 года или меньше.

Модуль NumPy имеет метод для поиска заданной百分или:

Пример

Использование NumPy percentile() Метод поиска百分илей:

import numpy
ages = [5,31,43,48,50,41,7,11,15,39,80,82,32,2,8,6,25,36,27,61,31]
x = numpy.percentile(ages, 75)
print(x)

Запуск примера

Пример

Какова возрастная группа 90% населения?

import numpy
ages = [5,31,43,48,50,41,7,11,15,39,80,82,32,2,8,6,25,36,27,61,31]
x = numpy.percentile(ages, 90)
print(x)

Запуск примера