Pengenalan Pengajaran Mesin - Memulai

PemBELAJARAN mesin memungkinkan komputer untuk belajar dari data penelitian dan informasi statistik.

PemBELAJARAN mesin adalah salah satu tahap untuk menuju teknologi pemrosesan informasi (AI).

PemBELAJARAN mesin adalah program yang dapat menganalisis data dan belajar untuk memprediksi hasil.

Dari mana mulai?

Dalam tutorial ini, kita akan kembali ke matematika dan mengkaji statistik serta bagaimana menghitung nilai penting berdasarkan dataset.

Kami juga akan belajar bagaimana menggunakan berbagai modul Python untuk mendapatkan jawaban yang dibutuhkan.

Dan, kita akan belajar bagaimana menulis fungsi yang dapat memprediksi hasil berdasarkan pengalaman yang kita miliki.

Dataset

Dalam komputer, dataset adalah referensi untuk setiap pengumpulan data. Ini dapat berupa array hingga database yang penuh.

Contoh array:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

Contoh database:

Carname Color Age Speed AutoPass
BMW red 5 99 Y
Volvo black 7 86 Y
VW gray 8 87 N
VW white 7 88 Y
Ford white 2 111 Y
VW white 17 86 Y
Tesla red 2 103 Y
BMW black 9 87 Y
Volvo gray 4 94 N
Ford white 11 78 N
Toyota gray 12 77 N
VW white 9 85 N
Toyota blue 6 86 Y

Dengan melihat array, kita dapat menyangkut nilai rata-rata mungkin sekitar 80 atau 90, dan kita juga dapat menentukan nilai maksimum dan minimum, tetapi apa yang lain yang dapat kita lakukan?

Dengan melihat database, kami dapat melihat warna yang paling populer adalah putih, umur mobil terlama adalah 17 tahun, tetapi bagaimana jika hanya melihat nilai lainnya untuk memprediksi apakah mobil memiliki AutoPass?

Ini adalah tujuannya! Menganalisis data dan memprediksi hasil!

Dalam pengajaran mesin, biasanya digunakan dataset yang sangat besar. Dalam tutorial ini, kami akan berusaha untuk membuat anda dapat memahami konsep mesin belajar yang berbeda dengan mudah, dan akan menggunakan beberapa dataset kecil yang mudah dipahami.

Jenis data

Untuk menganalisis data, penting untuk mengetahui jenis data yang akan diolah.

Kami dapat membagi jenis data menjadi tiga kategori utama:

  • Numerik
  • Kelasifikasi
  • Ordinal

Data numerikAdalah bilangan yang dapat dibagi dalam dua kelas nilai:

Data diskrit (Discrete Data)
- Bilangan yang dihadapi dengan bilangan bulat. Contoh: jumlah kereta yang melalui.
Data kontinu (Continuous Data)
- Bilangan yang memiliki nilai tak tentu. Contoh: harga produk atau ukuran produk.

Data kelasifikasiAdalah nilai yang tidak dapat diukur bersamaan. Contoh: nilai warna atau setiap nilai ya/tidak.

Data ordinalSeperti data kelasifikasi, tetapi dapat diukur bersamaan. Contoh: Skor sekolah yang lebih baik daripada B, dan seterusnya.

Dengan mengenal jenis data sumber data, anda dapat mengetahui teknik yang akan digunakan dalam analisis data.

Dalam bab berikutnya, anda akan belajar tentang statistik dan analisis data yang lebih banyak.