使用線性回歸模型進行訓練及預測_(波士頓房價)_透過偏度(skewness)修正來提升預測準確度
沿用上一篇 EDA 先抓取到的波士頓房價資料,封裝額外一個python檔案。 getData.py from sklearn.datasets import load_boston import pandas as pd display = pd . options . display display . max_columns = None display . max_rows = None display . width = None display . max_colwidth = None def getRawData (): data = load_boston() df = pd . DataFrame(data = data . data,columns = data . feature_names) df . insert( 0 ,column = 'PRICE' ,value = data . target) print (data . DESCR) return df 訓練階段.ver1 train_model.py 訓練存出模型二進位檔 import pickle import pandas as pd from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split from getData import getRawData import numpy as np df = getRawData() data = np . c_[df[ 'LSTAT' ] ,df[ 'RM' ]] x = pd . DataFrame(data = data,columns = [ 'LSTAT' , 'RM' ]) #特徵集合 y = df[ 'PRICE' ] #進行訓練資料跟測試資料分割 #80% 訓練用 / 20%測試用,訓練好的模型,可以使用剩餘20%的test來進行驗證,並計算分數。 ...