Pengenalan Belajar Mesin - Masuk
- Halaman Sebelumnya ufunc NumPy
- Halaman Berikutnya Mode Median Rata-rata
PemBELAJARAN mesin memungkinkan komputer untuk belajar dari data penelitian dan informasi statistik.
PemBELAJARAN mesin adalah salah satu tahap untuk menuju arah keperluan kognitif (AI).
PemBELAJARAN mesin adalah program yang dapat menganalisis data dan belajar untuk memprediksi hasil.
Dari mana mulai?
Pada tutorial ini, kita akan kembali ke matematika dan mempelajari statistik serta bagaimana menghitung nilai penting berdasarkan dataset.
Kami juga akan belajar bagaimana menggunakan berbagai modul Python untuk mendapatkan jawaban yang diinginkan.
Dan, kita akan belajar bagaimana menulis fungsi yang dapat memprediksi hasil berdasarkan pengetahuan yang kita miliki.
Dataset
Dalam komputer, dataset adalah referensi untuk setiap koleksi data. Ini dapat berupa array hingga database yang penuh.
Contoh array:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
Contoh database:
Namakendaraan | Warna | Umur | Kecepatan | AutoPass |
---|---|---|---|---|
BMW | merah | 5 | 99 | Y |
Volvo | hitam | 7 | 86 | Y |
VW | abu-abu | 8 | 87 | N |
VW | putih | 7 | 88 | Y |
Ford | putih | 2 | 111 | Y |
VW | putih | 17 | 86 | Y |
Tesla | merah | 2 | 103 | Y |
BMW | hitam | 9 | 87 | Y |
Volvo | abu-abu | 4 | 94 | N |
Ford | putih | 11 | 78 | N |
Toyota | abu-abu | 12 | 77 | N |
VW | putih | 9 | 85 | N |
Toyota | biru | 6 | 86 | Y |
Dengan melihat array, kita dapat menggugat rata-rata mungkin sekitar 80 atau 90, dan kita juga dapat menentukan nilai maksimum dan minimum, tetapi apa yang lain yang kita dapat lakukan?
Dengan melihat database, kita dapat melihat warna yang paling populer adalah putih, umur mobil tertua adalah 17 tahun, tetapi apa jika hanya melihat nilai lainnya, bagaimana dapat diprediksi apakah mobil memiliki AutoPass?
Ini adalah tujuannya! Analisis data dan ramalan hasil!
Dalam ilmu mesin, biasanya digunakan kumpulan data yang sangat besar. Dalam tutorial ini, kami akan berusaha membuat Anda dapat memahami konsep-konsep yang berbeda dalam ilmu mesin dengan mudah, dan akan menggunakan beberapa kumpulan data kecil yang mudah dipahami.
Tipe data
Untuk menganalisis data, penting untuk mengetahui tipe data yang akan dihandle.
Kami dapat membagi tipe data menjadi tiga kategori utama:
- Numerik
- Kelasifikasi
- Ordinal
Data numerikAdalah angka yang dapat dibagi menjadi dua kelas nilai:
- Data tak berkelanjutan (Discrete Data)
- - Angka yang dibatasi menjadi bilangan bulat. Contoh: jumlah mobil yang melalui.
- Data berkelanjutan (Continuous Data)
- - Angka dengan nilai tak terbatas. Contoh: harga produk atau ukuran produk.
Data kelasifikasiAdalah nilai yang tidak dapat diukur. Contoh: nilai warna atau setiap nilai yes/no.
Data ordinalSeperti data kelasifikasi, tetapi dapat diukur. Contoh: Nilai akademis sekolah A yang lebih baik daripada B, dan seterusnya.
Dengan mengenali tipe data sumber data, Anda dapat mengetahui teknik yang akan digunakan dalam analisis data.
Dalam bab berikutnya, Anda akan belajar tentang statistik dan analisis data yang lebih banyak.
- Halaman Sebelumnya ufunc NumPy
- Halaman Berikutnya Mode Median Rata-rata