机器学习 - 入门
- 上一页 NumPy ufuncs
- 下一页 平均中位数模式
ການເຕີບການສອນການຈະສາມາດຫຼັງການກວດສອບຂໍ້ມູນແລະສະຖິຕິມູນວິທະຍາສາກົນ.
ການເຕີບການສອນການແມ່ນໜຶ່ງບາງບານໃນການເດີນທາງມາດຕະການຄວາມຄິດປະຕິບັດຊີວິດ (AI).
ການຮຽນສອນການເຕີບການທີ່ສາມາດວິເຄາະຂໍ້ມູນແລະຮຽນການຄາດຄະແນນຜົນ.
ຈະເລີ່ມຈາກຈັກນັ້ນ?
ໃນຄູ່ນີ້ພວກເຮົາຈະກັບຄືນໄປຫາທາງການວິທະຍາສາດວິທະຍາສາກົນ ແລະຮຽນການສາມາດຄາດຄະແນນຄຳຕອບຢູ່ບໍ່ບາງທີ່ຈາກຖານຂໍ້ມູນ.
ພວກເຮົາຍັງຈະຮຽນການນຳໃຊ້ສະມາຊິກ Python ທັງໝົດເພື່ອຄົ້ນຫາຄຳຕອບທີ່ຕ້ອງການ.
ແລະ ພວກເຮົາຈະຮຽນການຂຽນຫົວວິທີທີ່ສາມາດຄາດຄະແນນຜົນຄາດຄະແນນຢູ່ບໍ່?
ຖານຂໍ້ມູນ
ໃນຄອມພິວເຕິກຂອງພວກເຮົາ ຖານຂໍ້ມູນອາດຈະເປັນສະແດງວັດຖຸລະບົບຫຼືຖານຂໍ້ມູນທັງໝົດ. ມັນສາມາດຈະແມ່ນວັດຖຸລະບົບຈາກສະແດງວັດຖຸລະບົບຫຼືຖານຂໍ້ມູນທັງໝົດ.
ຕົວຢ່າງຂອງວັດຖຸລະບົບ:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
ຕົວຢ່າງຂອງຖານຂໍ້ມູນ:
Carname | Color | Age | Speed | AutoPass |
---|---|---|---|---|
BMW | ສີແດງ | 5 | 99 | Y |
Volvo | ສີດຳ | 7 | 86 | Y |
VW | ສີຫຼາຍ | 8 | 87 | N |
VW | ສີຂາວ | 7 | 88 | Y |
Ford | ສີຂາວ | 2 | 111 | Y |
VW | ສີຂາວ | 17 | 86 | Y |
Tesla | ສີແດງ | 2 | 103 | Y |
BMW | ສີດຳ | 9 | 87 | Y |
Volvo | ສີຫຼາຍ | 4 | 94 | N |
Ford | ສີຂາວ | 11 | 78 | N |
Toyota | ສີຫຼາຍ | 12 | 77 | N |
VW | ສີຂາວ | 9 | 85 | N |
Toyota | ກາບຂຽວ | 6 | 86 | Y |
ຈາກການກວດສອບສະແດງວັດຖຸລະບົບພວກເຮົາສາມາດຄາດຄະແນນວ່າຄູ່ຄາງພະຍາຍາມຈະຢູ່ທີ່ 80 ຫຼື 90 ແລະພວກເຮົາຍັງສາມາດກວດຄຳຖານທີ່ຫຼາຍທີ່ສຸດແລະຫຼາຍທີ່ສຸດໄດ້ກໍ່ຕາມ ແຕ່ພວກເຮົາຍັງສາມາດເຮັດຫຍັງຢ່າງໃດອີກ?
通过查看数据库,我们可以看到最受欢迎的颜色是白色,最老的车龄是 17 年,但是如果仅通过查看其他值就可以预测汽车是否具有 AutoPass,该怎么办?
这就是机器学习的目的!分析数据并预测结果!
在机器学习中,通常使用非常大的数据集。在本教程中,我们会尝试让您尽可能容易地理解机器学习的不同概念,并将使用一些易于理解的小型数据集。
数据类型
如需分析数据,了解我们要处理的数据类型非常重要。
我们可以将数据类型分为三种主要类别:
- 数值(Numerical)
- 分类(Categorical)
- 序数(Ordinal)
数值数据是数字,可以分为两种数值类别:
- 离散数据(Discrete Data)
- - 限制为整数的数字。例如:经过的汽车数量。
- 连续数据(Continuous Data)
- - 具有无限值的数字。例如:一件商品的价格或一件商品的大小。
分类数据是无法相互度量的值。例如:颜色值或任何 yes/no 值。
序数数据类似于分类数据,但可以相互度量。示例:A 优于 B 的学校成绩,依此类推。
通过了解数据源的数据类型,您就能够知道在分析数据时使用何种技术。
在下一章中,您将学习有关统计和分析数据的更多知识。
- 上一页 NumPy ufuncs
- 下一页 平均中位数模式