Pengenalan Pengajaran Mesin - Memulai
- Halaman Sebelumnya ufunc NumPy
- Halaman Berikutnya Mode Mediana Rata-rata
PemBELAJARAN mesin memungkinkan komputer untuk belajar dari data penelitian dan informasi statistik.
PemBELAJARAN mesin adalah salah satu tahap untuk menuju teknologi pemrosesan informasi (AI).
PemBELAJARAN mesin adalah program yang dapat menganalisis data dan belajar untuk memprediksi hasil.
Dari mana mulai?
Dalam tutorial ini, kita akan kembali ke matematika dan mengkaji statistik serta bagaimana menghitung nilai penting berdasarkan dataset.
Kami juga akan belajar bagaimana menggunakan berbagai modul Python untuk mendapatkan jawaban yang dibutuhkan.
Dan, kita akan belajar bagaimana menulis fungsi yang dapat memprediksi hasil berdasarkan pengalaman yang kita miliki.
Dataset
Dalam komputer, dataset adalah referensi untuk setiap pengumpulan data. Ini dapat berupa array hingga database yang penuh.
Contoh array:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
Contoh database:
Carname | Color | Age | Speed | AutoPass |
---|---|---|---|---|
BMW | red | 5 | 99 | Y |
Volvo | black | 7 | 86 | Y |
VW | gray | 8 | 87 | N |
VW | white | 7 | 88 | Y |
Ford | white | 2 | 111 | Y |
VW | white | 17 | 86 | Y |
Tesla | red | 2 | 103 | Y |
BMW | black | 9 | 87 | Y |
Volvo | gray | 4 | 94 | N |
Ford | white | 11 | 78 | N |
Toyota | gray | 12 | 77 | N |
VW | white | 9 | 85 | N |
Toyota | blue | 6 | 86 | Y |
Dengan melihat array, kita dapat menyangkut nilai rata-rata mungkin sekitar 80 atau 90, dan kita juga dapat menentukan nilai maksimum dan minimum, tetapi apa yang lain yang dapat kita lakukan?
Dengan melihat database, kami dapat melihat warna yang paling populer adalah putih, umur mobil terlama adalah 17 tahun, tetapi bagaimana jika hanya melihat nilai lainnya untuk memprediksi apakah mobil memiliki AutoPass?
Ini adalah tujuannya! Menganalisis data dan memprediksi hasil!
Dalam pengajaran mesin, biasanya digunakan dataset yang sangat besar. Dalam tutorial ini, kami akan berusaha untuk membuat anda dapat memahami konsep mesin belajar yang berbeda dengan mudah, dan akan menggunakan beberapa dataset kecil yang mudah dipahami.
Jenis data
Untuk menganalisis data, penting untuk mengetahui jenis data yang akan diolah.
Kami dapat membagi jenis data menjadi tiga kategori utama:
- Numerik
- Kelasifikasi
- Ordinal
Data numerikAdalah bilangan yang dapat dibagi dalam dua kelas nilai:
- Data diskrit (Discrete Data)
- - Bilangan yang dihadapi dengan bilangan bulat. Contoh: jumlah kereta yang melalui.
- Data kontinu (Continuous Data)
- - Bilangan yang memiliki nilai tak tentu. Contoh: harga produk atau ukuran produk.
Data kelasifikasiAdalah nilai yang tidak dapat diukur bersamaan. Contoh: nilai warna atau setiap nilai ya/tidak.
Data ordinalSeperti data kelasifikasi, tetapi dapat diukur bersamaan. Contoh: Skor sekolah yang lebih baik daripada B, dan seterusnya.
Dengan mengenal jenis data sumber data, anda dapat mengetahui teknik yang akan digunakan dalam analisis data.
Dalam bab berikutnya, anda akan belajar tentang statistik dan analisis data yang lebih banyak.
- Halaman Sebelumnya ufunc NumPy
- Halaman Berikutnya Mode Mediana Rata-rata