發表文章

目前顯示的是有「機器學習」標籤的文章

使用線性回歸模型進行訓練及預測_(波士頓房價)_透過偏度(skewness)修正來提升預測準確度

圖片
沿用上一篇 EDA 先抓取到的波士頓房價資料,封裝額外一個python檔案。 getData.py from sklearn.datasets import load_boston import pandas as pd display = pd . options . display display . max_columns = None display . max_rows = None display . width = None display . max_colwidth = None def getRawData (): data = load_boston() df = pd . DataFrame(data = data . data,columns = data . feature_names) df . insert( 0 ,column = 'PRICE' ,value = data . target) print (data . DESCR) return df 訓練階段.ver1 train_model.py 訓練存出模型二進位檔 import pickle import pandas as pd from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split from getData import getRawData import numpy as np df = getRawData() data = np . c_[df[ 'LSTAT' ] ,df[ 'RM' ]] x = pd . DataFrame(data = data,columns = [ 'LSTAT' , 'RM' ]) #特徵集合 y = df[ 'PRICE' ] #進行訓練資料跟測試資料分割 #80% 訓練用 / 20%測試用,訓練好的模型,可以使用剩餘20%的test來進行驗證,並計算分數。 ...

機器學習_U1_何謂機器學習

圖片
在 圖解機器學習 「日本作者 杉山將 」一書是這麼說的,機器學習講白話一點就是 讓電腦有智慧可以跟人一樣具備學習能力的技術,是從堆積如山的數據 ( 又常被稱為「大數據」 ) 中尋找有用知識的數據挖掘技術。 機器學習的種類根據所處理的數據類型不同可分為三種 : (一)               監督式學習    由訓練資料中學到或建立一個模式(函數 / learning model ),並依此模式推測新的實例。訓練資料是由輸入物件(通常是向量)和預期輸出所組成。函數的輸出可以是一個連續的值(稱為迴歸分析),或是預測一個分類標籤(稱作分類)。 一個監督式學習者的任務在觀察完一些訓練範例(輸入和預期輸出)後,去預測這個函數對任何可能出現的輸入值的輸出。要達到此目的,學習者必須以 " 合理 " (見歸納偏向)的方式從現有的資料中一般化到非觀察到的情況。在人類和動物感知中,則通常被稱為概念學習( concept learning )。 Ex: 手寫文字識別、聲音處理、圖像處理、垃圾郵件分類與攔截、網頁檢索、基因診斷、股票預測等廣泛應用 (二)               無監督式學習               不需要人力來輸入標籤。它是監督式學習和強化學習等策略之外的一種選擇。在監督式學習中,典型的任務是分類和迴歸分析,且需要使用到人工預先準備好的範例 (base) 。                   一個常見的非監督式學習是數據聚類。在人工神經網路中,自我組織映射( SOM )和適應性共振理論( ART )則是最常用的非監督式學習。 ART 模型允許叢集的個數可隨著問題的大小而變動,並讓使用者控制成員和同一個叢集之間的相似度分數,其方式為透過一個由使用者自定而被稱為警覺參數的常數...