মেশিন লার্নিং - স্ট্যান্ডার্ড দূরত্ব

স্তন্ধর দূরত্ব কী?

স্তন্ধর দূরত্ব (Standard Deviation, সাধারণত গড়মান দূরত্ব বলা হয়) হলো একটি সংখ্যা যা মানের বিচ্ছিন্নতা বর্ণনা করে。

নিম্ন স্তন্ধর দূরত্ব বলতে এমন মান বোঝায় যারা গড়মানের কাছাকাছি রয়েছে (গড়মান)

উচ্চ স্তন্ধর দূরত্ব বলতে এমন মান বোঝায় যারা আরও বিস্তৃত আকারে বিতরণ করা হয়

উদাহরণ: এবার আমরা 7টি গাড়ির গতি রেজিস্টার করেছি:

speed = [86,87,88,86,87,85,86]

স্তন্ধর দূরত্ব হলো:

0.9

এর মানে অধিকাংশ মান গড়মানের 0.9 আকারের ভিতরে রয়েছে, অর্থাৎ 86.4

আমরা আরও বিস্তৃত সংখ্যা সমষ্টিকে পড়তে চাই:

speed = [32,111,138,28,59,77,97]

স্তন্ধর দূরত্ব হলো:

37.85

এর মানে অধিকাংশ মান গড়মান (গড়মান 77.4) এর 37.85 আকারের ভিতরে রয়েছে

যেমন দেখা গেছে, উচ্চ স্তন্ধর দূরত্ব হলো এমন মান যারা আরও বিস্তৃত আকারে বিতরণ করা হয়

NumPy মডিউলটির একটি স্তন্ধর দূরত্ব নির্ধারণের পদ্ধতি রয়েছে:

উদাহরণ

NumPy ব্যবহার করুন std() স্তন্ধর দূরত্ব নির্ধারণের পদ্ধতি:

import numpy
speed = [86,87,88,86,87,85,86]
x = numpy.std(speed)
print(x)

রান ইনস্ট্যান্স

উদাহরণ

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)

রান ইনস্ট্যান্স

বৈধ্য

বৈধ্য হলো একটি অন্যান্য সংখ্যা যা মানের বিচ্ছিন্নতা নির্দেশ করে。

তবে, যদি বৈধ্যের বর্গ মান নিন, তবে স্তন্ধর দূরত্ব পাওয়া যাবে!

বা পরিবর্তনিত, যদি স্তন্ধর দূরত্ব কেন্দ্রীয় মানের সঙ্গে গুণ করা হয়, তবে বৈধ্য পাওয়া যাবে!

যদি বৈধ্য নির্ধারণ করতে হয়, তবে নিচের পদক্ষেপ নিন:

1. গড়মান নির্ধারণ করুন:

(32+111+138+28+59+77+97) / 7 = 77.4

2. প্রত্যেক মানের জন্য: গড়মান থেকে পার্থক্য বের করুন:

 32 - 77.4 = -45.4
111 - 77.4 =  33.6
138 - 77.4 =  60.6
 28 - 77.4 = -49.4
 59 - 77.4 = -18.4
 77 - 77.4 = - 0.4
 97 - 77.4 =  19.6

3. প্রত্যেক পার্থক্যের জন্য: বর্গ মান বের করুন:

(-45.4)2 = 2061.16 
 (33.6)2 = 1128.96 
 (60.6)2 = 3672.36 
(-49.4)2 = 2440.36 
(-18.4)2 =  338.56 
(- 0.4)2 =    0.16 
 (19.6)2 =  384.16

4. বৈষম্য হল এই সমগ্র বর্ধমান বৈষম্যের গড়

(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2

সৌভাগ্যবানভাবে, NumPy একটি বৈষম্য গণনার পদ্ধতি রয়েছে:

উদাহরণ

NumPy ব্যবহার করে var() পদ্ধতি সাধারণের জন্য

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.var(speed)
print(x)

রান ইনস্ট্যান্স

স্ট্যান্ডার্ড দূরত্ব

আমরা জানি যে, স্ট্যান্ডার্ড দূরত্ব গণনার সমীকরণ হল:

√ 1432.25 = 37.85

বা, উপরোক্ত উদাহরণের মতো, NumPy দ্বারা স্ট্যান্ডার্ড দূরত্ব গণনা করুন:

উদাহরণ

অনুগ্রহ করে NumPy std() পদ্ধতিটি ব্যবহার করে স্ট্যান্ডার্ড দূরত্ব সনাক্ত করুন:

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)

রান ইনস্ট্যান্স

সংকেত

স্ট্যান্ডার্ড দূরত্ব সাধারণত Sigma সংকেতσ

বৈষম্য সাধারণত Sigma Square সংকেত σ2 প্রতিনিধিত্ব

বিভাগ সার

স্ট্যান্ডার্ড দূরত্ব এবং বৈষম্য হল মেশিন লার্নিংয়ের সাথে সাথে ব্যবহৃত প্রতিশব্দ, তাই তাদের কিভাবে পাওয়া যায় এবং তাদের পিছনের অর্থ বোঝা খুবই গুরুত্বপূর্ণ