মেশিন লার্নিং - স্ক্যাটার

স্পর্শকচিত্র (Scatter Plot)

স্পর্শকচিত্র হল যেখানে ডেটা সেটের প্রত্যেকটি মানকে একটি পয়েন্ট দ্বারা প্রতিনিধিত্ব করা হয়


Matplotlib মডিউলের একটি স্পর্শকচিত্র প্রদর্শনের পদ্ধতি রয়েছে, যা দুটি একই দৈর্ঘ্যের আইসিক্রম প্রয়োজন, একটি আইসিক্রম x-অক্ষের মানগুলো এবং আরেকটি আইসিক্রম y-অক্ষের মানগুলো প্রয়োজন:

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

x আইসিক্রমকে প্রত্যেক গাড়ির বয়সকে প্রতিনিধিত্ব করে

y আইসিক্রমকে প্রত্যেক গাড়ির গতির প্রতিনিধিত্ব করে

ইনস্ট্যান্স

অনুগ্রহ করে, scatter() স্পর্শকচিত্র প্রদর্শনের পদ্ধতি:

import matplotlib.pyplot as plt
x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
plt.scatter(x, y)
plt.show()

ফলাফল:


ইনস্ট্যান্স চালু করুন

স্প্রেডশিট ব্যাখ্যা

x-অক্ষ গাড়ির বয়সকে নির্দেশ করে, y-অক্ষ গতিকে নির্দেশ করে。

চিত্র থেকে দেখা যায়, দুটি সর্বাধিক দ্রুত গাড়িকে ২ বছর ব্যবহার করা হয়েছে, সর্বনিম্ন দ্রুততার গাড়িকে ১২ বছর ব্যবহার করা হয়েছে。

মন্তব্য:মোটরগাড়ি আরও নতুন হলে, গুজরান্তির হারও দ্রুত হয়, কিন্তু এটি হয়তো একটি সুযোগপূর্ণ ঘটনা, কারণ আমরা শুধুমাত্র ১৩টি গাড়ি নিবন্ধিত করেছি

র‍্যান্ডম ডাটা বিতরণ

মেশিন লার্নিংয়ে, ডাটা সেটটি হাজার হাজার বা কোটিরও বেশি মান ধারণ করতে পারে

টেস্টিং এলগরিদম করার সময়, আপনি সত্যিকারী ডাটা হবেন না, আপনি যে কোনও র‍্যান্ডম গণনা ব্যবহার করতে হবে

যেমন আমরা আগের চাপে শিখেছিলাম, NumPy মডিউল আমাদের সাহায্য করতে পারে!

আমরা দুটি আক্স তৈরি করতে যাই, যারা সকলেই নর্মাল ডাটা বিতরণ থেকে ১০০০টি একক স্বাধীন সংখ্যা নিয়ে পূর্ণ হয়

প্রথমটি আক্সের গড়মান ৫.০ এবং মানবীয় গড়মান ১.০ হয়

দ্বিতীয়টি আক্সের গড়মান ১০.০ এবং মানবীয় গড়মান ২.০ হয়

ইনস্ট্যান্স

১০০০টি পয়েন্টের স্প্রেডশিট:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)
plt.scatter(x, y)
plt.show()

ফলাফল:


ইনস্ট্যান্স চালু করুন

স্প্রেডশিট ব্যাখ্যা

আমরা দেখতে পাই যে, পয়েন্টগুলি x-অক্ষের ৫ এবং y-অক্ষের ১০ সার্ভিং আক্ষরিক বোঝা হয়。

আমরা এছাড়াও দেখতে পাই যে, y-অক্ষে সম্প্রসারণ বেশি হয় x-অক্ষের তুলনায়。