机器学习 - 平均中位数模式
- หน้าก่อนหน้า เริ่มต้น
- หน้าต่อไป ความผิดพลาดมาตรฐาน
ค่าเฉลี่ย ค่าส่วนกลาง และมอเดิล
อะไรที่เราสามารถเรียนรู้จากชุดตัวเลขนี้?
ในการเรียนรู้เครื่อง (และคณิตศาสตร์) มักมีสามค่าที่เราสนใจ:
- ค่าเฉลี่ย (Mean) - ค่าเฉลี่ย
- ค่าส่วนกลาง (Median) - ค่ากลาง หรือเรียกว่าค่าส่วนกลาง
- มอเดิล (Mode) - ค่าที่เกิดขึ้นบ่อยที่สุด
เช่น: เราได้ลงทะเบียนความเร็วของรถยนต์ 13 คัน:
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
อะไรคือค่าเฉลี่ย ค่ากลาง หรือค่าที่เกิดขึ้นบ่อยที่สุดของความเร็ว?
ค่าเฉลี่ย
ค่าเฉลี่ยคือค่าเฉลี่ย:
เพื่อคำนวณค่าเฉลี่ย หาจำนวนทั้งหมดของค่า แล้วแบ่งจำนวนทั้งหมดด้วยจำนวนของค่า:
(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77
NumPy โมดูลมีวิธีสำหรับเป้าหมายนี้:
ตัวอย่าง
ใช้ NumPy mean()
วิธีที่ตัดสินความเฉลี่ยความเร็ว:
import numpy speed = [99,86,87,88,111,86,103,87,94,78,77,85,86] x = numpy.mean(speed) print(x)
ค่าส่วนกลาง
ค่าส่วนกลางคือค่ากลางหลังจากการจัดเรียงทุกค่า:
77, 78, 85, 86, 86, 86, 87, 87, 88, 94, 99, 103, 111
การจัดเรียงตัวเลขก่อนหน้าที่จะหาค่าส่วนกลางมีความสำคัญมาก:
NumPy โมดูลมีวิธีสำหรับเป้าหมายนี้:
ตัวอย่าง
ใช้ NumPy median()
วิธีหามีดกลาง:
import numpy speed = [99,86,87,88,111,86,103,87,94,78,77,85,86] x = numpy.median(speed) print(x)
ถ้ามีเลขสองตัวในกลาง ให้หารเลขทั้งหมดโดย 2
, 77, 78, 85, 86, 86, 86, 87, 87, 94, 98, 99, 103 (86 + 87) / 2 = 86.5
ตัวอย่าง
ใช้มอดูล NumPy:
import numpy speed = [99,86,87,88,86,103,87,94,78,77,85,86] x = numpy.median(speed) print(x)
มอเดิล
มอเดิลคือตัวเลขที่เกิดขึ้นบ่อยที่สุด:
99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86 = 86
มอดูล SciPy มีวิธีที่ใช้สำหรับวัตถุประสงค์นี้:
ตัวอย่าง
ใช้ SciPy mode()
วิธีหาตัวเลขที่เกิดขึ้นบ่อยที่สุด:
from scipy import stats speed = [99,86,87,88,111,86,103,87,94,78,77,85,86] x = stats.mode(speed) print(x)
สรุปบท
เมดีอัน มิดและมอเดิลคือเทคนิคที่ถูกใช้บ่อยในการเรียนรู้เครื่อง ดังนั้น มันสำคัญที่จะเข้าใจความหมายของเหตุผลของมัน
- หน้าก่อนหน้า เริ่มต้น
- หน้าต่อไป ความผิดพลาดมาตรฐาน