Ders Programı

Python Eğitimi

Dosya İşleme

Python NumPy

Makine Öğrenimi

Python MySQL

Python MongoDB

Python 参考手册

Modül referans el kitabı

Python How To

Python 实例

Seçmeli dersler

Kurs Önerileri:

CodeW3C.com 百宝箱

Makine Öğrenimi - Çoklu Geri Bildirim

Çoklu回归（Multiple Regression）

Çoklu回归（Multiple Regression）benzer şekilde lineer回归dır, ancak birden fazla bağımsız değer içerir, bu da iki veya daha fazla değişkene dayanarak bir değeri tahmin etmeye çalıştığımız anlamına gelir.

Lütfen aşağıdaki veri setini görün, içinde bazı otomobil bilgileri bulunmaktadır.

Car	Model	Volume	Weight	CO2
Toyota	Aygo	1000	790	99
Mitsubishi	Space Star	1200	1160	95
Skoda	Citigo	1000	929	95
Fiat	500	900	865	90
Mini	Cooper	1500	1140	105
VW	Up!	1000	929	105
Skoda	Fabia	1400	1109	90
Mercedes	A-Class	1500	1365	92
Ford	Fiesta	1500	1112	98
Audi	A1	1600	1150	99
Hyundai	I20	1100	980	99
Suzuki	Swift	1300	990	101
Ford	Fiesta	1000	1112	99
Honda	Civic	1600	1252	94
Hundai	I30	1600	1326	97
Opel	Astra	1600	1330	97
BMW	1	1600	1365	99
Mazda	3	2200	1280	104
Skoda	Rapid	1600	1119	104
Ford	Focus	2000	1328	105
Ford	Mondeo	1600	1584	94
Opel	Insignia	2000	1428	99
Mercedes	C-Class	2100	1365	99
Skoda	Octavia	1600	1415	99
Volvo	S60	2000	1415	99
Mercedes	CLA	1500	1465	102
Audi	A4	2000	1490	104
Audi	A6	2000	1725	114
Volvo	V70	1600	1523	109
BMW	5	2000	1705	114
Mercedes	E-Class	2100	1605	115
Volvo	XC70	2000	1746	117
Ford	B-Max	1600	1235	104
BMW	2	1600	1390	108
Opel	Zafira	1600	1405	109
Mercedes	SLK	2500	1395	120

MOTOR hacmi büyüklüğüne göre arabanın CO2 salım miktarını tahmin edebiliriz, ancak çoklu geri bildirimle daha fazla değişken, örneğin arabanın ağırlığı ekleyerek tahmini daha doğru hale getirebiliriz.

Çalışma prensibi

Python'da bu işi yapabilecek modüllere sahibiz. Öncelikle Pandas modülünü içe aktarın:

import pandas

Pandas modülü, csv dosyalarını okuyup DataFrame nesnesi olarak döndürebilir.

Bu dosya yalnızca test amaçlı kullanılır, buradan indirebilirsiniz:cars.csv

df = pandas.read_csv("cars.csv")

Daha sonra bağımsız değerleri sıralayın ve bu değişkeni 'X' adlandırın.

İlişkili değerleri 'y' adlı bir değişkende tutun.

X = df[['Weight', 'Volume']]
y = df['CO2']

İpucu:Genellikle bağımsız değer listesini büyük harflerle adlandırıyoruz Xilişkili değer listesini küçük harflerle adlandırıyoruz y.

sklearn modülünde bazı yöntemleri kullanacağız, bu yüzden bu modülü de içe aktarmalıyız:

from sklearn import linear_model

sklearn modülünde, bu modülde LinearRegression() metodu oluşturur bir lineer geri bildirim nesnesi.

Bu nesne adlı bir fit() yöntemi, bu yöntem bağımsız değerleri ve bağımlı değerleri parametre olarak alır ve bu ilişkiyi tanımlayan verileri geri bildirim nesnesine doldurur:

regr = linear_model.LinearRegression()
regr.fit(X, y)

Şimdi, arabanın ağırlığı ve hacmine dayanarak CO2 değerlerini tahmin edebileceğimiz bir geri bildirim nesnesi elde ettik:

# 2300kg ağırlığında, 1300ccm hacimde bir arabanın CO2 salım miktarını tahmin et:
predictedCO2 = regr.predict([[2300, 1300]])

实例

Tam örnek bakın:

import pandas
from sklearn import linear_model
df = pandas.read_csv("cars.csv")
X = df[['Weight', 'Volume']]
y = df['CO2']
regr = linear_model.LinearRegression()
regr.fit(X, y)
# 2300kg ağırlığında, 1300ccm hacimde bir arabanın CO2 salım miktarını tahmin et:
predictedCO2 = regr.predict([[2300, 1300]])
print(predictedCO2)

结果：

[107.2087328]

运行实例

Öngörüyoruz, 1.3 litre motorlu, 2300 kilogram ağırlığında bir arabanın, 1 kilometre yolculuk yaparken yaklaşık 107 gram CO2 salacak.

Katsayı

Katsayı, bilinmeyen değişkenle ilişkiyi tanımlayan faktördür.

örneğin: eğer x değişkendir, ise 2x Bu x kati iki katıdır.x Bu bilinmeyen değişkendir, sayısal 2 Bu katsayıdır.

Bu durumda, ağırlığın CO2'ye göre katsayı değerini, hacmin CO2'ye göre katsayı değerini talep edebiliriz. Aldığımız cevaplar, bir bağımsız değeri artırırsak veya azaltırsak neler olacağını bize söyler.

实例

Geri bildirim nesnesinin katsayı değerlerini yazdırın:

import pandas
from sklearn import linear_model
df = pandas.read_csv("cars.csv")
X = df[['Weight', 'Volume']]
y = df['CO2']
regr = linear_model.LinearRegression()
regr.fit(X, y)
print(regr.coef_)

结果：

[0.00755095 0.00780526]

运行实例

Sonuç açıklaması

Sonuç dizisi, ağırlık ve hacmin katsayı değerlerini temsil eder.

Ağırlık: 0.00755095
Hacim: 0.00780526

Bu değerler bize, ağırlık 1g artarsa CO2 salım miktarının 0.00755095g artacağını söyler.

Motorun boyutu (hacmi) 1 ccm artarsa, CO2 salım miktarı 0.00780526g artacaktır.

我认为这是一个合理的猜测，但还是请进行测试！

我们已经预言过，如果一辆配备 1300ccm 发动机的汽车重 2300 千克，则二氧化碳排放量将约为 107 克。

如果我们增加 1000g 的重量会怎样？

实例

复制之前的例子，但是将车重从 2300 更改为 3300：

import pandas
from sklearn import linear_model
df = pandas.read_csv("cars.csv")
X = df[['Weight', 'Volume']]
y = df['CO2']
regr = linear_model.LinearRegression()
regr.fit(X, y)
predictedCO2 = regr.predict([[3300, 1300]])
print(predictedCO2)

结果：

[114.75968007]

运行实例

我们已经预测，配备 1.3 升发动机，重量为 3.3 吨的汽车，每行驶 1 公里，就会释放约 115 克二氧化碳。

这表明 0.00755095 的系数是正确的：

107.2087328 + (1000 * 0.00755095) = 114.75968

Ders Programı

Python Eğitimi

Dosya İşleme

Python NumPy