آموزش ماشینآموخته - توزیع دادههای نرمال
- صفحه قبلی توزیع دادهها
- صفحه بعدی نقشههای گسترشدهی
توزیع دادههای طبیعی (Normal Data Distribution)
در فصل قبلی، ما یاد گرفتیم که چگونه یک آرایه کاملاً تصادفی با اندازه مشخص و بین دو مقدار مشخص ایجاد کنیم.
در این فصل، ما یاد میگیریم که چگونه یک آرایه ایجاد کنیم که مقادیر در اطراف یک مقدار خاص متمرکز شوند.
در نظریه احتمالات، پس از ارائه فرمول این توزیع دادهها توسط ریاضیدان کارل فردریش گاوس (Carl Friedrich Gauss)، این توزیع دادهها به توزیع دادههای طبیعی یا توزیع گاوس معروف شد.
مثال
توزیع دادههای طبیعی معمولی:
import numpy import matplotlib.pyplot as plt x = numpy.random.normal(5.0, 1.0, 100000) plt.hist(x, 100) plt.show()
نتیجه:

نکته:به دلیل اینکه نمودار توزیع طبیعی دارای شکل ویژهای به شکل قلاب است، بنابراین به آن منحنی قلابی نیز گفته میشود.
توضیح هندسه
ما از numpy.random.normal()
ارائهای از آرایهای که توسط روش ایجاد شده (با 100000 مقدار) یک نمودار هندسی با 100 ستون ترسیم میکند.
ما میانگین را 5.0 و انحراف معیار را 1.0 مشخص میکنیم.
این بدان معناست که این مقادیر باید در حدود 5.0 متمرکز شوند و به ندرت از میانگین 1.0 منحرف شوند.
از نمودار هندسی میتوان دید که بیشتر مقادیر بین 4.0 تا 6.0 قرار دارند و بیشترین مقدار حدود 5.0 است.
- صفحه قبلی توزیع دادهها
- صفحه بعدی نقشههای گسترشدهی