మెకానికల్ లెర్నింగ్ - ప్రవేశం

మెకానికల్ ల్యార్నింగ్ అనేది కమ్ప్యూటర్స్ ను రిసర్చ్ డేటా మరియు స్టాటిస్టిక్స్ నుండి నేర్చుకోగల సామర్థ్యాన్ని కలిగిస్తుంది.

మెకానికల్ ల్యార్నింగ్ అనేది ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ (ఎఐ) దిశగా అడుగు వేసే ఒక చర్య ఉంది.

మెకానికల్ ల్యార్నింగ్ అనేది డేటాను విశ్లేషించి ఫలితాలను అంచనా వేయగల ప్రోగ్రామ్ ఉంది.

ఎక్కడ మొదలు పెట్టాలి?

ఈ పాఠ్యక్రమంలో, మేము మత్స్యశాస్త్రాన్ని తిరిగి చూసుకుని, డేటాసెట్ పై ముఖ్యమైన విలువలను గణించడానికి పరిశీలించాము.

మరియు, మేము అవసరమైన సమాచారాన్ని పొందడానికి వివిధ పైథాన్ మాడ్యూల్స్ ఉపయోగించడానికి నేర్చుకుంటాము.

మరియు, మేము మా కింది జ్ఞానం మీద ఆధారపడి ఫలితాలను అంచనా వేయగల ఫంక్షన్స్ రాయడానికి నేర్చుకుంటాము.

డేటాసెట్

కమ్ప్యూటర్లో, డేటాసెట్ అనేది ఏ రకమైన డేటా సేట్ కూడా అవకాశం ఉంది. ఇది ఏకమానికం నుండి పూర్తి డేటాబేస్ వరకు అన్ని విషయాలు ఉంటాయి.

ఒక ఏకమానిక ఉదాహరణ:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

ఒక డేటాబేస్ ఉదాహరణ:

కారు పేరు రంగు వయస్సు స్పీడ్ ఆటోపాస్
బిఎమ్డబ్ల్యూ ఎరుపు 5 99 Y
వోల్వో నలుపు 7 86 Y
వివి ముదురు 8 87 N
వివి తెల్ల 7 88 Y
ఫోర్డ్ తెల్ల 2 111 Y
వివి తెల్ల 17 86 Y
టెస్లా ఎరుపు 2 103 Y
బిఎమ్డబ్ల్యూ నలుపు 9 87 Y
వోల్వో ముదురు 4 94 N
ఫోర్డ్ తెల్ల 11 78 N
టోయోటా ముదురు 12 77 N
వివి తెల్ల 9 85 N
టోయోటా నీలి 6 86 Y

ప్రయోగం ద్వారా మేము మధ్యమ విలువను రెండింటిలో అనుకుంటాము, అవి 80 లేదా 90 కావచ్చు, మరియు మనం గరిష్ట మరియు కనిష్ట విలువలను తెలుసుకోగలము, కానీ మనం ఏమి చేయగలము?

డేటాబేస్‌ను చూస్తున్నప్పుడు మాకు అత్యంత ప్రాచుర్యం పొందిన రంగు తెలుపు ఉంది, అతి పాత వాహనం నుంచి 17 సంవత్సరాలు పాటు ఉంది కానీ ఇతర విలువలను చూస్తే ఆటోపాస్‌ను కలిగిన వాహనాలను భవిష్యత్తులో అంచనా వేయాలని ఎలా చేయాలి?

这就是机器学习的目的!分析数据并预测结果!

在机器学习中,通常使用非常大的数据集。在本教程中,我们会尝试让您尽可能容易地理解机器学习的不同概念,并将使用一些易于理解的小型数据集。

数据类型

如需分析数据,了解我们要处理的数据类型非常重要。

我们可以将数据类型分为三种主要类别:

  • 数值(Numerical)
  • 分类(Categorical)
  • 序数(Ordinal)

数值数据是数字,可以分为两种数值类别:

离散数据(Discrete Data)
- 限制为整数的数字。例如:经过的汽车数量。
连续数据(Continuous Data)
- 具有无限值的数字。例如:一件商品的价格或一件商品的大小。

分类数据是无法相互度量的值。例如:颜色值或任何 yes/no 值。

序数数据类似于分类数据,但可以相互度量。示例:A 优于 B 的学校成绩,依此类推。

通过了解数据源的数据类型,您就能够知道在分析数据时使用何种技术。

在下一章中,您将学习有关统计和分析数据的更多知识。