Wprowadzenie do uczenia maszynowego
- Poprzednia strona Ufunci w NumPy
- Następna strona Modele średniej i mediany
Uczenie maszynowe pozwala komputerom uczyć się z danych badawczych i informacji statystycznych.
Uczenie maszynowe to jeden z kroków w kierunku sztucznej inteligencji (AI).
Uczenie maszynowe to program, który analizuje dane i uczy się przewidywać wyniki.
Od czego zacząć?
W tym kursie wrócimy do matematyki i zbadamy statystykę oraz to, jak na podstawie zestawu danych obliczać ważne wartości.
Nauczymy się również, jak używać różnych modułów Pythona, aby uzyskać potrzebne odpowiedzi.
I nauczymy się, jak na podstawie nabytej wiedzy pisać funkcje przewidujące wyniki.
Zestaw danych
W komputerze, zestaw danych to każda kolekcja danych. Może to być wszystko, od tablicy do pełnej bazy danych.
Przykład tablicy:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
Przykład bazy danych:
NazwaSamochodu | Kolor | Wiek | Prędkość | AutoPass |
---|---|---|---|---|
BMW | czerwony | 5 | 99 | Y |
Volvo | czarny | 7 | 86 | Y |
VW | szary | 8 | 87 | N |
VW | biały | 7 | 88 | Y |
Ford | biały | 2 | 111 | Y |
VW | biały | 17 | 86 | Y |
Tesla | czerwony | 2 | 103 | Y |
BMW | czarny | 9 | 87 | Y |
Volvo | szary | 4 | 94 | N |
Ford | biały | 11 | 78 | N |
Toyota | szary | 12 | 77 | N |
VW | biały | 9 | 85 | N |
Toyota | niebieski | 6 | 86 | Y |
Przy spojrzeniu na tablicę, możemy zgadywać, że wartość średnia może wynosić około 80 lub 90, a możemy również określić maksymalną i minimalną wartość, ale co jeszcze możemy zrobić?
Przyglądając się bazie danych, możemy zobaczyć, że najbardziej popularnym kolorem jest biały, najstarszy wiek pojazdu wynosi 17 lat, ale co zrobić, jeśli można przewidzieć, czy samochód ma AutoPass, patrząc tylko na inne wartości?
To jest cel uczenia maszynowego! Analiza danych i przewidywanie wyników!
W uczeniu maszynowym często używa się bardzo dużych zbiorów danych. W tym kursie spróbujemy jak najbardziej upraszczając zrozumieć różne koncepty uczenia maszynowego, używając przy tym małych, łatwo zrozumiałych zbiorów danych.
Typy danych
Aby analizować dane, bardzo ważne jest, aby wiedzieć, jakiego typu dane przetwarzamy.
Możemy podzielić typy danych na trzy główne kategorie:
- Liczbowe (Numerical)
- Kategoryczne (Categorical)
- Ordinalne (Ordinal)
Dane liczboweTo liczby, które można podzielić na dwa typy wartości:
- Dane dyskretne (Discrete Data)
- - Ograniczone do liczb całkowitych. Przykład: liczba przejeżdżających samochodów.
- Dane ciągłe (Continuous Data)
- - Dzielniki o nieskończonych wartościach. Przykład: cena produktu lub rozmiar produktu.
Dane kategoryczneTo wartości, które nie mogą być mierzone wzajemnie. Przykład: wartości kolorów lub jakiekolwiek wartości yes/no.
Dane ordinalnePodobne do danych kategorycznych, ale można je mierzyć wzajemnie. Przykład: oceny szkół A lepsze niż B, itd.
Dzięki zrozumieniu typów danych źródłowych, będziesz wiedzieć, jakie techniki używać podczas analizy danych.
W następnym rozdziale nauczysz się więcej o statystykach i analizie danych.
- Poprzednia strona Ufunci w NumPy
- Następna strona Modele średniej i mediany