การเรียนรู้เรื่องการเรียนรู้ - พื้นฐาน
- หน้าก่อนหน้า NumPy ufuncs
- หน้าต่อไป โมดีลแบบกลางและเมดีแอน
วิชาการเรียนรู้ของคอมพิวเตอร์ทำให้คอมพิวเตอร์สามารถเรียนรู้จากข้อมูลที่ศึกษาและข้อมูลสถิติ
วิชาการเรียนรู้ของคอมพิวเตอร์เป็นหนึ่งในขั้นตอนที่นำไปสู่อาทิตย์ปฏิบัติการทางปฏิบัติทางด้านซอฟต์แวร์
วิชาการเรียนรู้ของคอมพิวเตอร์เป็นโปรแกรมที่สามารถวิเคราะห์ข้อมูลและเรียนรู้ผลลัพธ์ที่จะทำนาย
จากที่ไหนเริ่ม
ในตูร์นี้เราจะกลับไปที่ทฤษฎีทางคณิตศาสตร์และศึกษาสติทธิกรรมทางสถิติวิทยา และวิธีการคำนวณค่าสำคัญจากข้อมูลชุด
เรายังจะเรียนรู้ว่าจะใช้หลายๆโมดูล Python เพื่อให้คำตอบที่ต้องการ
และเราจะเรียนรู้ว่าจะเขียนฟังก์ชันที่สามารถทำนายผลลัพธ์ตามที่ทราบได้
Data set
ในคอมพิวเตอร์ ตัวแปร data set หมายถึงข้อมูลชุดใดๆ ที่อาจเป็นตัวแปร array หรือฐานข้อมูลทั้งหมด
ตัวอย่างของตัวแปรแบบแอร์เรย์
[99,86,87,88,111,86,103,87,94,78,77,85,86]
ตัวอย่างของฐานข้อมูล
Carname | Color | Age | Speed | AutoPass |
---|---|---|---|---|
BMW | red | 5 | 99 | Y |
Volvo | black | 7 | 86 | Y |
VW | gray | 8 | 87 | N |
VW | white | 7 | 88 | Y |
Ford | white | 2 | 111 | Y |
VW | white | 17 | 86 | Y |
Tesla | red | 2 | 103 | Y |
BMW | black | 9 | 87 | Y |
Volvo | gray | 4 | 94 | N |
Ford | white | 11 | 78 | N |
Toyota | gray | 12 | 77 | N |
VW | white | 9 | 85 | N |
Toyota | blue | 6 | 86 | Y |
จากการดูตารางเราสามารถคาดประมาณค่าเฉลี่ยที่แน่นอนว่าคงจะเป็น 80 หรือ 90 และเรายังสามารถเข้าใจค่าสูงสุดและต่ำสุดได้ แต่เรายังสามารถทำอะไรได้เพิ่มเติมนัก
ด้วยการดูฐานข้อมูล เราสามารถเห็นว่าสีที่ยอดนิยมที่สุดคือสีขาว อายุรถที่เก่าที่สุดคือ 17 ปี แต่ถ้าเราเพียงแค่ดูค่าอื่น ๆ ก็สามารถทำนายว่ารถมี AutoPass หรือไม่
นี่คือวัตถุประสงค์ของการเรียนรู้เครื่อง! วิเคราะห์ข้อมูลและทำนายผลลัพธ์!
ในการเรียนรู้เครื่อง มักจะใช้ตัวข้อมูลใหญ่มาก ในบทนี้ เราจะพยายามที่จะทำให้คุณเข้าใจความหมายของความคิดที่ต่าง ๆ ของการเรียนรู้เครื่องในรูปแบบข้อมูลที่ง่ายต่อการเข้าใจ และจะใช้ตัวข้อมูลที่เล็กที่สุดเพื่อเข้าใจ
ประเภทข้อมูล
เมื่อต้องการวิเคราะห์ข้อมูล มันมีความสำคัญอย่างยิ่งที่จะต้องรู้ประเภทของข้อมูลที่เราจะจัดการ
เราสามารถแบ่งประเภทข้อมูลเป็นสามประเภทหลัก
- เลข (Numerical)
- ประเภท (Categorical)
- ตามลำดับ (Ordinal)
ข้อมูลแบบเลขเป็นตัวเลขที่สามารถแบ่งเป็นสองประเภทของค่าต่าง ๆ
- ข้อมูลแบบแยก (Discrete Data)
- - ตัวเลขที่จำกัดเป็นตัวเลขเต็ม ตัวอย่าง: จำนวนรถที่ผ่าน
- ข้อมูลแบบต่อเนื่อง (Continuous Data)
- - ตัวเลขที่มีค่าไม่จำกัด ตัวอย่าง: ราคาของสินค้า หรือขนาดของสินค้า
ข้อมูลแบบประเภทค่าที่ไม่สามารถมีความเทียบเท่ากันได้ ตัวอย่าง: ค่าสี หรือค่า yes/no
ข้อมูลตามลำดับเหมือนข้อมูลแบบประเภท แต่สามารถมีความเทียบเท่ากันได้ ตัวอย่าง: คะแนนเรียนของโรงเรียนที่ดีกว่าของ A ของ B ตามลำดับ
ด้วยการเข้าถึงประเภทของข้อมูลของต้นข้อมูล คุณจะสามารถตระหนักว่าจะใช้เทคนิคใดในการวิเคราะห์ข้อมูล
ในบทที่ต่อไป คุณจะเรียนรู้เกี่ยวกับการวิเคราะห์สถิติและการวิเคราะห์ข้อมูลมากขึ้น
- หน้าก่อนหน้า NumPy ufuncs
- หน้าต่อไป โมดีลแบบกลางและเมดีแอน