Tekoäly - peruskurssi

Mekaaninen oppiminen mahdollistaa tietokoneen oppimisen tutkimustiedoista ja tilastotiedoista.

Mekaaninen oppiminen on yksi askeleista kohti tekoälyä (AI).

Mekaaninen oppiminen on ohjelma, joka voi analysoida tietoja ja oppia ennustamaan tuloksia.

Mistä aloittaa?

Tässä oppaassa palaamme matematiikkaan ja tutkimme tilastotieteen sekä sen, miten tietojoukon perusteella lasketaan tärkeitä arvoja.

Opimme myös, miten käyttää erilaisia Python-moduuleja saadaksemme tarvittavat vastaukset.

Lisäksi oppimme kirjoittamaan funktioita, jotka pystyvät ennustamaan tuloksia.

Tietojoukko

Tietokoneessa tietojoukko tarkoittaa mitä tahansa tietokokonaisuutta. Se voi olla mistä tahansa taulukosta täydelliseen tietokantaan.

Esimerkki taulukosta:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

Esimerkki tietokannasta:

Auton nimi Väri Ikä Nopeus AutoPass
BMW punainen 5 99 Y
Volvo musta 7 86 Y
VW harmaa 8 87 N
VW valkoinen 7 88 Y
Ford valkoinen 2 111 Y
VW valkoinen 17 86 Y
Tesla punainen 2 103 Y
BMW musta 9 87 Y
Volvo harmaa 4 94 N
Ford valkoinen 11 78 N
Toyota harmaa 12 77 N
VW valkoinen 9 85 N
Toyota sininen 6 86 Y

Tarkastamalla taulukkoa voimme arvioida keskiarvon olevan noin 80 tai 90, ja voimme myös määrittää suurimman ja pienimmän arvon, mutta mitä me voimme tehdä lisää?

Tarkastellessamme tietokantaa, voimme nähdä, että suosituin väri on valkoinen, vanhin ajoneuvon ikä on 17 vuotta, mutta mitä, jos voimme ennustaa, onko autoa AutoPass, vain tarkastelemalla muita arvoja?

Tämä on tietokoneoppimisen tavoite! Analysoi tietoja ja ennusta tuloksia!

Tietokoneoppimisessa käytetään yleensä suuria tietomääriä. Tässä oppaassa yritämme tehdä tietokoneoppimisen eri käsitteistä mahdollisimman ymmärrettäviä ja käytämme pieniä, helposti ymmärrettäviä tietomääriä.

Tietotyyppi

Jos haluat analysoida tietoja, on tärkeää ymmärtää, mitä tietotyyppiä käsittelet.

Voimme jakaa tietotyyppien kolmeen pääluokkaan:

  • Numerointidata (Numerical)
  • Luokitteludata (Categorical)
  • Lajitteluarvo (Ordinal)

NumerointidataOn numeroita, jotka voidaan jakaa kahteen arvoon:

Eristetty data (Discrete Data)
- Rajoitettu kokonaislukuina. Esimerkki: kuluneiden autojen määrä.
Jatkuva data (Continuous Data)
- Lukuja, joilla on ääretön arvo. Esimerkki: tuotteen hinta tai tuotteen koko.

LajitteludataOn arvoja, joita ei voida mitata toisiaan. Esimerkki: värit tai kyllä/ei-arvot.

LajitteludataLajitteludata, mutta voidaan mitata toisiaan. Esimerkki: A on parempi B:n koulutusarvosanat, jne.

Tuntemalla tietolähteen tietotyyppien, voit tietää, mitä teknologiaa käytetään tietojen analysoinnissa.

Seuraavassa luvussa opit lisää tilastollisista ja analyysidatasta.