نمودار نقاط در یادگیری ماشین
- صفحه قبلی توزیع دادههای نرمال
- صفحه بعدی برآورد خطی
نمودار نقطهای (Scatter Plot)
نمودار نقطهای یک نمودار است که هر مقدار در مجموعه دادهها با یک نقطه نشان داده میشود.

مدول Matplotlib یک روش برای ترسیم نمودار نقطهای دارد که به دو مجموعه طولانیتر از یکدیگر نیاز دارد، یک مجموعه برای مقادیر محور x و مجموعه دیگری برای مقادیر محور y:
x = [5,7,8,7,2,17,2,9,4,11,12,9,6] y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
مجموعه x نشاندهنده سن هر خودرو است.
مجموعه y نشاندهنده سرعت هر خودرو است.
مثال
لطفاً از scatter()
روش ترسیم نمودار نقطهای:
import matplotlib.pyplot as plt x = [5,7,8,7,2,17,2,9,4,11,12,9,6] y = [99,86,87,88,111,86,103,87,94,78,77,85,86] plt.scatter(x, y) plt.show()
نتیجه:

توضیح نمودار نقاط
محور x نشاندهنده سن خودرو است، محور y نشاندهنده سرعت است.
از تصویر میتوان دید که دو اتومبیل سریعترین ۲ سال استفاده کردهاند، اتومبیل کندترین ۱۲ سال استفاده کرده است.
نکته:به نظر میرسد که ماشینهای قدیمیتر سرعت کمتری دارند، اما این ممکن است یک تصادف باشد، چون فقط 13 خودرو را ثبت کردهایم.
توزیع دادههای تصادفی
در یادگیری ماشین، مجموعه دادهها میتواند شامل هزاران یا حتی میلیونها مقدار باشد.
در هنگام تست الگوریتمها، ممکن است دادههای واقعی نداشته باشید و باید از مقادیر تولید شده تصادفی استفاده کنید.
مانند آنچه که در فصل قبل یاد گرفتیم، ما میتوانیم از ماژول NumPy کمک بگیریم!
بیایید دو آرایه ایجاد کنیم که هر دو با اعداد تصادفی از توزیع دادههای نرمال پر شدهاند.
میانگین اولین آرایه برابر با 5.0 و انحراف معیار آن برابر با 1.0 تنظیم شده است.
میانگین دومین آرایه برابر با 10.0 و انحراف معیار آن برابر با 2.0 تنظیم شده است:
مثال
نمودار نقاط 1000 تایی:
import numpy import matplotlib.pyplot as plt x = numpy.random.normal(5.0, 1.0, 1000) y = numpy.random.normal(10.0, 2.0, 1000) plt.scatter(x, y) plt.show()
نتیجه:

توضیح نمودار نقاط
ما میتوانیم ببینیم که نقاط در اطراف ارزش 5 در محور x و 10 در محور y متمرکز شدهاند.
ما میتوانیم ببینیم که در محور y بیشتر از محور x گسترش یافته است.
- صفحه قبلی توزیع دادههای نرمال
- صفحه بعدی برآورد خطی