Machine Learning - Pagsisimula

Ang machine learning ay nagbibigay sa kompyuter ng kakayahan na maturuan mula sa pag-aaral ng datos at estatistika.

Ang machine learning ay isa sa mga hakbang sa direksyon ng artificial intelligence (AI).

Ang machine learning ay isang programang maaaring analin ang datos at maturuan ng pag-predict.

Saan magsimula?

Sa tutorial na ito, babalikan namin ang matematika at pag-aaral ng estatistika, at kung paano kalkulahin ang mahahalagang bilang base sa dataset.

Malalaman din namin kung paano gamitin ang iba't ibang module ng Python upang makuha ang kailangan nating sagot.

At, malalaman namin kung paano gumawa ng function na maaaring mag-prediction base sa kung ano ang natutunan namin.

Dataset

Sa kompyuter, ang dataset ay kahit anong koleksyon ng datos. Ito ay maaaring mula sa array hanggang sa buong database na kahit anong nilalaman.

Isang halimbawa ng array:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

Isang halimbawa ng database:

Carname Color Age Speed AutoPass
BMW red 5 99 Y
Volvo black 7 86 Y
VW gray 8 87 N
VW white 7 88 Y
Ford white 2 111 Y
VW white 17 86 Y
Tesla red 2 103 Y
BMW black 9 87 Y
Volvo gray 4 94 N
Ford white 11 78 N
Toyota gray 12 77 N
VW white 9 85 N
Toyota blue 6 86 Y

Sa pamamagitan ng pagtingin sa array, maaring hulaan namin na ang katamtaman ay humigit-kumulang sa 80 o 90, at maaari naming tiyakin ang pinakamataas at pinakamababang bilang, ngunit ano pa pa ang maaari naming gawin?

Sa pamamagitan ng pagtingin sa database, makikita namin na ang pinaka-tanyag na kulay ay puti, ang pinakamatanda na edad ng sasakyan ay 17 taon, ngunit kung mayroon bang hulaan kung mayroon bang AutoPass sa pamamagitan ng pagtingin sa ibang halaga?

Ito ang layunin ng machine learning! Analusihin ang data at hulaan ang resulta!

Sa machine learning, karaniwang ginagamit ang malaking dataset. Sa naturang tutorial, sinusubukan naming gamitin ang maliliit na dataset upang madaling maunawaan ng iba't ibang konsepto ng machine learning.

Data Type

Upang analuhin ang data, napakahalaga na malaman ang uri ng data na aking aayosin.

Maaari naming ihatid ang uri ng data sa tatlong pangunahing kategorya:

  • Numerical (Numerical)
  • Categorical (Categorical)
  • Ordinal (Ordinal)

Numerical DataIto ay bilang, at maaaring daluhang uri ng bilang:

Discrete Data (Discrete Data)
- Ang mga bilang na limitado sa mga integer. Halimbawa: Ang bilang ng mga sasakyan na lumiliko.
Continuous Data (Continuous Data)
- Ang mga bilang na walang hanggang bilang. Halimbawa: Ang presyo ng produkto o laki ng produkto.

Categorical DataIyong halimbawa ay ang mga halaga na hindi maaaring magiging magkapareho. Halimbawa: Ang kulay o kahit anong halaga na yes/no.

Numerical DataKatulad ng kategorya ng pagkakahiwalay, ngunit maaaring magiging panukalang pagtutuing. Halimbawa: Ang mga resulta ng paaralan ng A ay mas mabuti kay B, at iba pa.

Sa pamamagitan ng pagkatuklas ng uri ng data ng pinagmulan, maalaman mo ang teknolohiya na gagamitin sa pag-aayos ng data.

Sa susunod na kabanata, matututuhan mo ang mas maraming kaalaman tungkol sa istatistika at pagsusuri ng data.