Makine Öğrenimi - Scatter Grafiği
- Önceki Sayfa Yüzde Sayı
- Sonraki Sayfa Normal Veri Dağılımı
Veri Dağılımı (Data Distribution)
Bu eğitim, farklı konuları anlamak amacıyla çok az miktarda veri kullandığımız daha erken bir örnekteydi.
Gerçek dünyada veri kümesi çok daha büyük olabilir, ancak projenin erken aşamalarında gerçek dünya verilerini toplamak zor olabilir.
Nasıl büyük veri kümesi elde ederiz?
Test veri kümesi oluşturmak için Python Modülü NumPy kullanıyoruz, bu modül çok çeşitli boyutlardaki rastgele veri kümesi oluşturma yöntemleri içerir.
Örnek
0 ile 5 arasında 250 tane rastgele küsüratlı sayı içeren bir dizi oluşturma:
import numpy x = numpy.random.uniform(0.0, 5.0, 250) print(x)
Histogram
Veri kümesini görselleştirmek için toplanan verileri histogram çizebiliriz.
Histogram çizmek için Python Modülü Matplotlib'ı kullanacağız:
Örnek
Histogram çiz
import numpy import matplotlib.pyplot as plt x = numpy.random.uniform(0.0, 5.0, 250) plt.hist(x, 5) plt.show()
Sonuç:}}

Histogram Açıklaması
Örnekteki diziyi 5 adet sütun grafiği ile çizdik.
İlk sütun dizide 0 ile 1 arasında olan değerlerin sayısını temsil eder.
İkinci sütun 1 ile 2 arasında olan sayıların sayısını temsil eder.
ve benzerleri.
Almış olduğumuz sonuçlar:
52 değeri 0 ile 1 arasında 48 değeri 1 ile 2 arasında 49 değeri 2 ile 3 arasında 51 değeri 3 ile 4 arasında 50 değeri 4 ile 5 arasında
Açıklama:Dizi değerleri rastgele sayılardır ve bilgisayarınızda tamamen aynı sonuçları göstermez.
Büyük Veri Dağılımı
250 değeri içeren bir dizi büyük sayılmaz, ancak şimdi rastgele değerlerin bir setini nasıl oluşturduğunuzu öğrendiniz ve parametreleri değiştirerek gerekli boyutta veri setleri oluşturabilirsiniz.
Örnek
100000 adet rastgele sayı içeren bir dizi oluşturun ve 100 sütunlu bir histogram ile gösterin:
import numpy import matplotlib.pyplot as plt x = numpy.random.uniform(0.0, 5.0, 100000) plt.hist(x, 100) plt.show()
- Önceki Sayfa Yüzde Sayı
- Sonraki Sayfa Normal Veri Dağılımı