Maskininlärning - Introduktion

Maskinlärning gör det möjligt för datorer att lära sig från data och statistisk information.

Maskinlärning är ett steg mot artificiell intelligens (AI).

Maskinlärning är ett program som kan analysera data och lära sig att förutsäga resultat.

Var börjar vi?

I denna tutorial kommer vi att återvända till matematik och studera statistik samt hur vi kan beräkna viktiga värden baserat på datauppsättningen.

Vi kommer också att lära oss hur vi kan använda olika Python-moduler för att få de svar vi behöver.

Och vi kommer att lära oss hur vi kan skriva funktioner som kan förutsäga resultat baserat på det vi har lärt oss.

Datauppsättning

I datorer betyder datauppsättning vilket som helst datainnehåll. Det kan vara allt från en array till en fullständig databas.

Ett exempel på en array:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

Ett exempel på en databas:

Bilnamn Färg Ålder Hastighet AutoPass
BMW röd 5 99 Y
Volvo svart 7 86 Y
VW grå 8 87 N
VW vit 7 88 Y
Ford vit 2 111 Y
VW vit 17 86 Y
Tesla röd 2 103 Y
BMW svart 9 87 Y
Volvo grå 4 94 N
Ford vit 11 78 N
Toyota grå 12 77 N
VW vit 9 85 N
Toyota blå 6 86 Y

Genom att granska arrayen kan vi gissa att medelvärdet kan vara ungefär 80 eller 90, och vi kan också fastställa max- och minsta värdena, men vad kan vi göra mer?

Genom att granska databasen kan vi se att den mest populära färgen är vit, den äldsta bilåldern är 17 år, men vad händer om vi bara tittar på andra värden och kan förutsäga om en bil har AutoPass?

Detta är målet med maskininlärning! Analysera data och förutsäga resultat!

I maskininlärning används ofta mycket stora dataset. I denna kurs försöker vi göra det så enkelt som möjligt för dig att förstå olika koncept inom maskininlärning och använder några små och lättförståeliga dataset.

Datatyper

För att analysera data är det viktigt att förstå vilken datatyp vi hanterar.

Vi kan klassificera datatyper i tre huvudkategorier:

  • Numerisk
  • Kategorisk
  • Ordinal

Numeriska dataär siffror som kan delas in i två värdeklasser:

Diskreta data (Diskreta Data)
- Begränsade till heltal. Exempel: Antalet bilar som passerar.
Kontinuerliga data (Kontinuerliga Data)
- Har oändligt många värden. Exempel: Priset på ett varor eller storleken på ett varor.

Kategoriserade dataär värden som inte kan mätas mot varandra. Exempel: Färgvärden eller några ja/nej-värden.

OrdinaldataLiknande kategoriserade data, men kan mätas mot varandra. Exempel: Skolbetyg som A är bättre än B, och så vidare.

Genom att förstå datakällans datatyper kan du veta vilka tekniker som ska användas vid analys av data.

I nästa kapitel kommer du att lära dig mer om statistik och analys av data.