Học máy - Phân phối dữ liệu norm
- Trang trước Phân phối dữ liệu
- Trang tiếp theo Đồ thị điểm
Phân phối dữ liệu chuẩn (Normal Data Distribution)
Trong chương trước, chúng ta đã học cách tạo một mảng hoàn toàn ngẫu nhiên với kích thước và giá trị giữa hai giá trị cho trước.
Trong chương này, chúng ta sẽ học cách tạo một mảng tập trung xung quanh giá trị cho trước.
Trong lý thuyết xác suất, sau khi nhà toán học Carl Friedrich Gauss đề xuất công thức của phân phối dữ liệu này, phân phối dữ liệu này được gọi là phân phối dữ liệu chuẩn hoặc phân phối dữ liệu Gauss.
Mô hình
Phân phối dữ liệu chuẩn典型:
import numpy import matplotlib.pyplot as plt x = numpy.random.normal(5.0, 1.0, 100000) plt.hist(x, 100) plt.show()
Kết quả:

Ghi chú:Do đồ thị phân phối chuẩn có hình dạng đặc trưng của hình nón, vì vậy nó cũng được gọi là đường cong nón.
Giải thích đồ thị histogram
Chúng tôi sử dụng numpy.random.normal()
Método tạo mảng (có 100000 giá trị) vẽ đồ thị histogram với 100 cột.
Chúng tôi xác định giá trị trung bình là 5.0 và độ lệch chuẩn là 1.0.
Điều này có nghĩa là các giá trị nên tập trung xung quanh 5.0 và hiếm khi chệch xa giá trị trung bình 1.0.
Từ đồ thị histogram, có thể thấy hầu hết các giá trị đều ở khoảng 4.0 đến 6.0, giá trị cao nhất khoảng 5.0.
- Trang trước Phân phối dữ liệu
- Trang tiếp theo Đồ thị điểm