机器学习 - 平均中位数模式

ค่าเฉลี่ย ค่าส่วนกลาง และมอเดิล

อะไรที่เราสามารถเรียนรู้จากชุดตัวเลขนี้?

ในการเรียนรู้เครื่อง (และคณิตศาสตร์) มักมีสามค่าที่เราสนใจ:

  • ค่าเฉลี่ย (Mean) - ค่าเฉลี่ย
  • ค่าส่วนกลาง (Median) - ค่ากลาง หรือเรียกว่าค่าส่วนกลาง
  • มอเดิล (Mode) - ค่าที่เกิดขึ้นบ่อยที่สุด

เช่น: เราได้ลงทะเบียนความเร็วของรถยนต์ 13 คัน:

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

อะไรคือค่าเฉลี่ย ค่ากลาง หรือค่าที่เกิดขึ้นบ่อยที่สุดของความเร็ว?

ค่าเฉลี่ย

ค่าเฉลี่ยคือค่าเฉลี่ย:

เพื่อคำนวณค่าเฉลี่ย หาจำนวนทั้งหมดของค่า แล้วแบ่งจำนวนทั้งหมดด้วยจำนวนของค่า:

(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77

NumPy โมดูลมีวิธีสำหรับเป้าหมายนี้:

ตัวอย่าง

ใช้ NumPy mean() วิธีที่ตัดสินความเฉลี่ยความเร็ว:

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)

ปฏิบัติตัวอย่าง

ค่าส่วนกลาง

ค่าส่วนกลางคือค่ากลางหลังจากการจัดเรียงทุกค่า:

77, 78, 85, 86, 86, 86, 87, 87, 88, 94, 99, 103, 111

การจัดเรียงตัวเลขก่อนหน้าที่จะหาค่าส่วนกลางมีความสำคัญมาก:

NumPy โมดูลมีวิธีสำหรับเป้าหมายนี้:

ตัวอย่าง

ใช้ NumPy median() วิธีหามีดกลาง:

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

ปฏิบัติตัวอย่าง

ถ้ามีเลขสองตัวในกลาง ให้หารเลขทั้งหมดโดย 2

, 77, 78, 85, 86, 86, 86, 87, 87, 94, 98, 99, 103
(86 + 87) / 2 = 86.5

ตัวอย่าง

ใช้มอดูล NumPy:

import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

ปฏิบัติตัวอย่าง

มอเดิล

มอเดิลคือตัวเลขที่เกิดขึ้นบ่อยที่สุด:

99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86 = 86

มอดูล SciPy มีวิธีที่ใช้สำหรับวัตถุประสงค์นี้:

ตัวอย่าง

ใช้ SciPy mode() วิธีหาตัวเลขที่เกิดขึ้นบ่อยที่สุด:

from scipy import stats
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)

ปฏิบัติตัวอย่าง

สรุปบท

เมดีอัน มิดและมอเดิลคือเทคนิคที่ถูกใช้บ่อยในการเรียนรู้เครื่อง ดังนั้น มันสำคัญที่จะเข้าใจความหมายของเหตุผลของมัน