मशीन लर्निंग - स्पैट ग्राफ
- पिछला पृष्ठ नॉर्मल डाटा वितरण
- अगला पृष्ठ लाइनर रीग्रेशन
स्पिडर प्लॉट (Scatter Plot)
स्पिडर प्लॉट एक अलग-अलग मान के लिए एक बिन्दु के रूप में डेटा सेट में प्रतिनिधित्व करने वाला ग्राफ है।

Matplotlib मॉड्यूल के एक स्पिडर प्लॉट ड्रा करने के तरीका है, जो दो लंबाई एक-से-एक समान एक्सेस रीस्ट्राइंग की आवश्यकता है, एक एक्सेस x अक्ष के मानों के लिए और दूसरा एक्सेस y अक्ष के मानों के लिए:
x = [5,7,8,7,2,17,2,9,4,11,12,9,6] y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x एक्सेस प्रत्येक वाहन की आयु को प्रतिनिधित्व करता है。
y एक्सेस वाहनों की गति को प्रतिनिधित्व करता है。
इंस्टांस
कृपया इसे इस्तेमाल करें scatter()
स्पिडर प्लॉट ड्रा करने का तरीका:
import matplotlib.pyplot as plt x = [5,7,8,7,2,17,2,9,4,11,12,9,6] y = [99,86,87,88,111,86,103,87,94,78,77,85,86] plt.scatter(x, y) plt.show()
परिणाम:

स्पर्शक चित्र व्याख्या
x अक्ष का प्रयोग करके वाहन की आयु को दर्शाया जाता है, y अक्ष का प्रयोग करके गति को दर्शाया जाता है।
चित्र से देखा जा सकता है कि दो सबसे तेजी से चलने वाले वाहन 2 वर्षों तक इस्तेमाल किए गए, सबसे धीमे वाहन 12 वर्षों तक इस्तेमाल किए गए।
टिप्पणी:वाहन के नए होने के साथ, गति भी तेज होती है, लेकिन यह एक दुर्भाग्य हो सकता है, क्योंकि हम केवल 13 वाहनों को रजिस्टर कर चुके हैं。
रैंडम डाटा वितरण
मशीन शिक्षा में, डाटा सेट के लिए हजारों या फिर लाखों अनुक्रम हो सकते हैं。
अलगोरिद्म का परीक्षण करते समय, आपके पास वास्तविक डाटा नहीं हो सकता है, आपको शायद रैंडम तैयार की गई मूल्यों का उपयोग करना होगा。
जैसा कि हमने पिछले चाप में सीखा है, NumPy मॉड्यूल हमें मदद करता है!
हम दो आयाम बनाएं जो दोनों को नॉर्मल डाटा वितरण के 1000 अनुक्रमों से भरा हैं。
पहली आयाम का औसत 5.0 और मानक त्रुटि 1.0 रखा गया है。
दूसरी आयाम का औसत 10.0 और मानक त्रुटि 2.0 रखा गया है:
इंस्टांस
1000 बिन्दुओं वाला स्पर्शक चित्र:
import numpy import matplotlib.pyplot as plt x = numpy.random.normal(5.0, 1.0, 1000) y = numpy.random.normal(10.0, 2.0, 1000) plt.scatter(x, y) plt.show()
परिणाम:

स्पर्शक चित्र व्याख्या
हम देख सकते हैं कि बिन्दु अनुक्रम x अक्ष के 5 और y अक्ष के 10 के आसपास केंद्रित हैं。
हम देख सकते हैं कि y अक्ष पर फैलना x अक्ष से अधिक है。
- पिछला पृष्ठ नॉर्मल डाटा वितरण
- अगला पृष्ठ लाइनर रीग्रेशन