Makine Öğrenimi - Scatter Grafiği

Veri Dağılımı (Data Distribution)

Bu eğitim, farklı konuları anlamak amacıyla çok az miktarda veri kullandığımız daha erken bir örnekteydi.

Gerçek dünyada veri kümesi çok daha büyük olabilir, ancak projenin erken aşamalarında gerçek dünya verilerini toplamak zor olabilir.

Nasıl büyük veri kümesi elde ederiz?

Test veri kümesi oluşturmak için Python Modülü NumPy kullanıyoruz, bu modül çok çeşitli boyutlardaki rastgele veri kümesi oluşturma yöntemleri içerir.

Örnek

0 ile 5 arasında 250 tane rastgele küsüratlı sayı içeren bir dizi oluşturma:

import numpy
x = numpy.random.uniform(0.0, 5.0, 250)
print(x)

Çalıştırma Örneği

Histogram

Veri kümesini görselleştirmek için toplanan verileri histogram çizebiliriz.

Histogram çizmek için Python Modülü Matplotlib'ı kullanacağız:

Örnek

Histogram çiz

import numpy
import matplotlib.pyplot as plt
x = numpy.random.uniform(0.0, 5.0, 250)
plt.hist(x, 5)
plt.show()

Sonuç:}}


Çalıştırma Örneği

Histogram Açıklaması

Örnekteki diziyi 5 adet sütun grafiği ile çizdik.

İlk sütun dizide 0 ile 1 arasında olan değerlerin sayısını temsil eder.

İkinci sütun 1 ile 2 arasında olan sayıların sayısını temsil eder.

ve benzerleri.

Almış olduğumuz sonuçlar:

52 değeri 0 ile 1 arasında
48 değeri 1 ile 2 arasında
49 değeri 2 ile 3 arasında
51 değeri 3 ile 4 arasında
50 değeri 4 ile 5 arasında

Açıklama:Dizi değerleri rastgele sayılardır ve bilgisayarınızda tamamen aynı sonuçları göstermez.

Büyük Veri Dağılımı

250 değeri içeren bir dizi büyük sayılmaz, ancak şimdi rastgele değerlerin bir setini nasıl oluşturduğunuzu öğrendiniz ve parametreleri değiştirerek gerekli boyutta veri setleri oluşturabilirsiniz.

Örnek

100000 adet rastgele sayı içeren bir dizi oluşturun ve 100 sütunlu bir histogram ile gösterin:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.uniform(0.0, 5.0, 100000)
plt.hist(x, 100)
plt.show()

Çalıştırma Örneği