Tekoäly - peruskurssi
- Edellinen sivu NumPy ufuncs
- Seuraava sivu Keskiarvo ja mediaani-tilavuus
Mekaaninen oppiminen mahdollistaa tietokoneen oppimisen tutkimustiedoista ja tilastotiedoista.
Mekaaninen oppiminen on yksi askeleista kohti tekoälyä (AI).
Mekaaninen oppiminen on ohjelma, joka voi analysoida tietoja ja oppia ennustamaan tuloksia.
Mistä aloittaa?
Tässä oppaassa palaamme matematiikkaan ja tutkimme tilastotieteen sekä sen, miten tietojoukon perusteella lasketaan tärkeitä arvoja.
Opimme myös, miten käyttää erilaisia Python-moduuleja saadaksemme tarvittavat vastaukset.
Lisäksi oppimme kirjoittamaan funktioita, jotka pystyvät ennustamaan tuloksia.
Tietojoukko
Tietokoneessa tietojoukko tarkoittaa mitä tahansa tietokokonaisuutta. Se voi olla mistä tahansa taulukosta täydelliseen tietokantaan.
Esimerkki taulukosta:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
Esimerkki tietokannasta:
Auton nimi | Väri | Ikä | Nopeus | AutoPass |
---|---|---|---|---|
BMW | punainen | 5 | 99 | Y |
Volvo | musta | 7 | 86 | Y |
VW | harmaa | 8 | 87 | N |
VW | valkoinen | 7 | 88 | Y |
Ford | valkoinen | 2 | 111 | Y |
VW | valkoinen | 17 | 86 | Y |
Tesla | punainen | 2 | 103 | Y |
BMW | musta | 9 | 87 | Y |
Volvo | harmaa | 4 | 94 | N |
Ford | valkoinen | 11 | 78 | N |
Toyota | harmaa | 12 | 77 | N |
VW | valkoinen | 9 | 85 | N |
Toyota | sininen | 6 | 86 | Y |
Tarkastamalla taulukkoa voimme arvioida keskiarvon olevan noin 80 tai 90, ja voimme myös määrittää suurimman ja pienimmän arvon, mutta mitä me voimme tehdä lisää?
Tarkastellessamme tietokantaa, voimme nähdä, että suosituin väri on valkoinen, vanhin ajoneuvon ikä on 17 vuotta, mutta mitä, jos voimme ennustaa, onko autoa AutoPass, vain tarkastelemalla muita arvoja?
Tämä on tietokoneoppimisen tavoite! Analysoi tietoja ja ennusta tuloksia!
Tietokoneoppimisessa käytetään yleensä suuria tietomääriä. Tässä oppaassa yritämme tehdä tietokoneoppimisen eri käsitteistä mahdollisimman ymmärrettäviä ja käytämme pieniä, helposti ymmärrettäviä tietomääriä.
Tietotyyppi
Jos haluat analysoida tietoja, on tärkeää ymmärtää, mitä tietotyyppiä käsittelet.
Voimme jakaa tietotyyppien kolmeen pääluokkaan:
- Numerointidata (Numerical)
- Luokitteludata (Categorical)
- Lajitteluarvo (Ordinal)
NumerointidataOn numeroita, jotka voidaan jakaa kahteen arvoon:
- Eristetty data (Discrete Data)
- - Rajoitettu kokonaislukuina. Esimerkki: kuluneiden autojen määrä.
- Jatkuva data (Continuous Data)
- - Lukuja, joilla on ääretön arvo. Esimerkki: tuotteen hinta tai tuotteen koko.
LajitteludataOn arvoja, joita ei voida mitata toisiaan. Esimerkki: värit tai kyllä/ei-arvot.
LajitteludataLajitteludata, mutta voidaan mitata toisiaan. Esimerkki: A on parempi B:n koulutusarvosanat, jne.
Tuntemalla tietolähteen tietotyyppien, voit tietää, mitä teknologiaa käytetään tietojen analysoinnissa.
Seuraavassa luvussa opit lisää tilastollisista ja analyysidatasta.
- Edellinen sivu NumPy ufuncs
- Seuraava sivu Keskiarvo ja mediaani-tilavuus