نمودار نقاط در یادگیری ماشین

نمودار نقطه‌ای (Scatter Plot)

نمودار نقطه‌ای یک نمودار است که هر مقدار در مجموعه داده‌ها با یک نقطه نشان داده می‌شود.


مدول Matplotlib یک روش برای ترسیم نمودار نقطه‌ای دارد که به دو مجموعه طولانی‌تر از یکدیگر نیاز دارد، یک مجموعه برای مقادیر محور x و مجموعه دیگری برای مقادیر محور y:

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

مجموعه x نشان‌دهنده سن هر خودرو است.

مجموعه y نشان‌دهنده سرعت هر خودرو است.

مثال

لطفاً از scatter() روش ترسیم نمودار نقطه‌ای:

import matplotlib.pyplot as plt
x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
plt.scatter(x, y)
plt.show()

نتیجه:


مثال اجرا

توضیح نمودار نقاط

محور x نشان‌دهنده سن خودرو است، محور y نشان‌دهنده سرعت است.

از تصویر می‌توان دید که دو اتومبیل سریع‌ترین ۲ سال استفاده کرده‌اند، اتومبیل کندترین ۱۲ سال استفاده کرده است.

نکته:به نظر می‌رسد که ماشین‌های قدیمی‌تر سرعت کمتری دارند، اما این ممکن است یک تصادف باشد، چون فقط 13 خودرو را ثبت کرده‌ایم.

توزیع داده‌های تصادفی

در یادگیری ماشین، مجموعه داده‌ها می‌تواند شامل هزاران یا حتی میلیون‌ها مقدار باشد.

در هنگام تست الگوریتم‌ها، ممکن است داده‌های واقعی نداشته باشید و باید از مقادیر تولید شده تصادفی استفاده کنید.

مانند آنچه که در فصل قبل یاد گرفتیم، ما می‌توانیم از ماژول NumPy کمک بگیریم!

بیایید دو آرایه ایجاد کنیم که هر دو با اعداد تصادفی از توزیع داده‌های نرمال پر شده‌اند.

میانگین اولین آرایه برابر با 5.0 و انحراف معیار آن برابر با 1.0 تنظیم شده است.

میانگین دومین آرایه برابر با 10.0 و انحراف معیار آن برابر با 2.0 تنظیم شده است:

مثال

نمودار نقاط 1000 تایی:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)
plt.scatter(x, y)
plt.show()

نتیجه:


مثال اجرا

توضیح نمودار نقاط

ما می‌توانیم ببینیم که نقاط در اطراف ارزش 5 در محور x و 10 در محور y متمرکز شده‌اند.

ما می‌توانیم ببینیم که در محور y بیشتر از محور x گسترش یافته است.