ਮਸ਼ੀਨ ਸਿੱਖਿਆ - ਡਾਟਾ ਵਿਤਰਣ
- ਪਿਛਲਾ ਪੰਨਾ ਪੈਂਸਲ ਨੰਬਰ
- ਅਗਲਾ ਪੰਨਾ ਨਾਰਮਲ ਡੇਟਾ ਵਿਸ਼ਵਾਸ
ਡਾਟਾ ਵਿਸ਼ਵਾਸ
ਇਸ ਟਿੰਨੀਅਰੀ ਵਿੱਚ, ਅਸੀਂ ਕੁਝ ਸਮੇਂ ਪਹਿਲਾਂ ਸਿਰਫ ਘੱਟ ਮਾਤਰਾ ਵਾਲੇ ਡਾਟਾ ਦੇ ਉਦਾਹਰਣਾਂ ਵਿੱਚ ਵਰਤੇ ਹਾਂ, ਜਿਸ ਦਾ ਉਦੇਸ਼ ਵੱਖ-ਵੱਖ ਕਨਸੈਪਚਿਅਰਾਂ ਨੂੰ ਸਮਝਣਾ ਹੈ。
ਅਜਿਹੇ ਰਿਆਲੀ ਦੁਨੀਆ ਵਿੱਚ, ਡਾਟਾ ਸੈੱਟ ਕਈ ਵਾਰ ਵੱਡੇ ਹੁੰਦੇ ਹਨ, ਪਰ ਪ੍ਰੋਜੈਕਟ ਦੇ ਪਹਿਲੇ ਪੜਾਅ ਵਿੱਚ, ਰਿਆਲੀ ਦੁਨੀਆ ਦੇ ਡਾਟਾ ਜੁਟਾਉਣਾ ਮੁਸ਼ਕਿਲ ਹੁੰਦਾ ਹੈ。
ਅਸੀਂ ਕਿਵੇਂ ਵੱਡੇ ਡਾਟਾ ਸੈੱਟ ਹਾਸਲ ਕਰਦੇ ਹਾਂ?
ਟੈਸਟ ਲਈ ਵੱਡੇ ਡਾਟਾ ਸੈੱਟ ਦੀ ਰਚਨਾ ਕਰਨ ਲਈ, ਅਸੀਂ Python ਮੌਡੂਲ ਨਮਪਾਈ ਦੀ ਮਦਦ ਲੈਂਦੇ ਹਾਂ, ਜਿਸ ਵਿੱਚ ਕਈ ਰੈਂਡਮ ਸਿਜ਼ਿਜ਼ਡ ਡਾਟਾ ਸੈੱਟ ਬਣਾਉਣ ਦੇ ਤਰੀਕੇ ਹਨ。
ਉਦਾਹਰਣ
0 ਤੋਂ 5 ਦਰਮਿਆਨ 250 ਰੈਂਡਮ ਫਲੌਟਿੰਗ ਪੈਮਾਨੇ ਵਾਲੇ ਇੱਕ ਮੰਡਾਲ ਬਣਾਉਣਾ:
import numpy x = numpy.random.uniform(0.0, 5.0, 250) print(x)
ਹਸਤਾਖਰ ਡਿਗਰਾਮ
ਡਾਟਾ ਸੈੱਟ ਨੂੰ ਵਿਜ਼ੂਅਲਾਈਜ਼ ਕਰਨ ਲਈ, ਅਸੀਂ ਜੁਟਾਏ ਹੋਏ ਡਾਟਾ 'ਤੇ ਹਸਤਾਖਰ ਡਿਗਰਾਮ ਦਰਸਾ ਸਕਦੇ ਹਾਂ。
ਅਸੀਂ Python ਮੌਡੂਲ ਮੈਟਪਲੌਟ ਦੀ ਮਦਦ ਨਾਲ ਡਿਗਰਾਮ ਦਰਸਾਉਣਾ ਚਾਹੁੰਦੇ ਹਾਂ:
ਉਦਾਹਰਣ
ਡਿਗਰਾਮ ਦਰਸਾਉਣਾ:
import numpy import matplotlib.pyplot as plt x = numpy.random.uniform(0.0, 5.0, 250) plt.hist(x, 5) plt.show()
ਨਤੀਜਾ:

ਹਿਸਟੋਗ੍ਰਾਮ ਵਿਸ਼ੇਸ਼ਤਾ
ਅਸੀਂ ਉਦਾਹਰਣ ਵਿੱਚ ਦਿੱਤੇ ਮੰਡੇ ਨਾਲ 5 ਪੱਖੇ ਗਰਾਫ ਬਣਾਉਣ ਲਈ ਵਰਤੀਏ
ਪਹਿਲਾ ਪੱਖ ਰੇਖਾਂ ਵਿੱਚ ਮੰਡਾ ਵਿੱਚ ਕਿਤਨੇ 0 ਤੋਂ 1 ਦਰਮਿਆਨ ਮੁੱਲ ਹਨ
ਦੂਜਾ ਪੱਖ ਰੇਖਾਂ ਵਿੱਚ ਕਿਤਨੇ 1 ਤੋਂ 2 ਦਰਮਿਆਨ ਮੁੱਲ ਹਨ
ਇਹ ਹੋਰ ਹਨ
ਅਸੀਂ ਪ੍ਰਾਪਤ ਕੀਤੇ ਗਏ ਨਤੀਜੇ ਹਨ:
52 ਮੁੱਲ 0 ਤੋਂ 1 ਦਰਮਿਆਨ ਹਨ 48 ਮੁੱਲ 1 ਤੋਂ 2 ਦਰਮਿਆਨ ਹਨ 49 ਮੁੱਲ 2 ਤੋਂ 3 ਦਰਮਿਆਨ ਹਨ 51 ਮੁੱਲ 3 ਤੋਂ 4 ਦਰਮਿਆਨ ਹਨ 50 ਮੁੱਲ 4 ਤੋਂ 5 ਦਰਮਿਆਨ ਹਨ
ਟਿੱਪਣੀਆਂ:ਮੰਡਾ ਮੁੱਲ ਰੰਗੇ ਸੰਖਿਆਵਾਂ ਹਨ, ਪਰ ਤੁਹਾਡੇ ਕੰਪਿਊਟਰ ਵਿੱਚ ਹੀ ਇੱਕ ਜ਼ਿਆਦਾ ਵਿਸ਼ਵਾਸ ਨਹੀਂ ਦਿਖਾਇਆ ਜਾਵੇਗਾ。
ਵੱਡੇ ਮਾਤਰਾ ਵਿਸ਼ਵਾਸ
250 ਮੁੱਲਾਂ ਵਾਲਾ ਮੰਡਾ ਬਹੁਤ ਵੱਡਾ ਨਹੀਂ ਹੈ, ਪਰ ਹੁਣ ਤੁਸੀਂ ਰੰਗੇ ਮੁੱਲਾਂ ਦੇ ਸੈਟ ਕਿਵੇਂ ਬਣਾਓ ਜਾਂਦੇ ਹਨ ਜਾਣ ਗਏ ਹੋ ਅਤੇ ਪੈਰਾਮੀਟਰ ਬਦਲਣ ਨਾਲ ਇੱਕ ਜ਼ਰੂਰੀ ਕੋਈ ਸਮਾਚਾਰ ਸਮੂਹ ਬਣਾਓ ਸਕਦੇ ਹੋ
ਉਦਾਹਰਣ
100000 ਰੰਗੇ ਸੰਖਿਆਵਾਂ ਦਾ ਇੱਕ ਮੰਡਾ ਬਣਾਓ ਅਤੇ ਉਹਨਾਂ ਨੂੰ 100 ਪੱਖੇ ਵਾਲੇ ਹਿਸਟੋਗ੍ਰਾਮ ਵਿੱਚ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰੋ:
import numpy import matplotlib.pyplot as plt x = numpy.random.uniform(0.0, 5.0, 100000) plt.hist(x, 100) plt.show()
- ਪਿਛਲਾ ਪੰਨਾ ਪੈਂਸਲ ਨੰਬਰ
- ਅਗਲਾ ਪੰਨਾ ਨਾਰਮਲ ਡੇਟਾ ਵਿਸ਼ਵਾਸ