第25個冬天

發表文章

目前顯示的是有「機器學習」標籤的文章

使用線性回歸模型進行訓練及預測_(波士頓房價)_透過偏度(skewness)修正來提升預測準確度

- 3月 13, 2025

沿用上一篇 EDA 先抓取到的波士頓房價資料，封裝額外一個python檔案。 getData.py from sklearn.datasets import load_boston import pandas as pd display = pd . options . display display . max_columns = None display . max_rows = None display . width = None display . max_colwidth = None def getRawData (): data = load_boston() df = pd . DataFrame(data = data . data,columns = data . feature_names) df . insert( 0 ,column = 'PRICE' ,value = data . target) print (data . DESCR) return df 訓練階段.ver1 train_model.py 訓練存出模型二進位檔 import pickle import pandas as pd from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split from getData import getRawData import numpy as np df = getRawData() data = np . c_[df[ 'LSTAT' ] ,df[ 'RM' ]] x = pd . DataFrame(data = data,columns = [ 'LSTAT' , 'RM' ]) #特徵集合 y = df[ 'PRICE' ] #進行訓練資料跟測試資料分割 #80% 訓練用 / 20%測試用，訓練好的模型，可以使用剩餘20%的test來進行驗證，並計算分數。 ...

閱讀完整內容

機器學習_U1_何謂機器學習

- 7月 23, 2016

在圖解機器學習「日本作者杉山將」一書是這麼說的，機器學習講白話一點就是讓電腦有智慧可以跟人一樣具備學習能力的技術，是從堆積如山的數據 ( 又常被稱為「大數據」 ) 中尋找有用知識的數據挖掘技術。機器學習的種類根據所處理的數據類型不同可分為三種 : (一) 監督式學習由訓練資料中學到或建立一個模式（函數 / learning model ），並依此模式推測新的實例。訓練資料是由輸入物件（通常是向量）和預期輸出所組成。函數的輸出可以是一個連續的值（稱為迴歸分析），或是預測一個分類標籤（稱作分類）。一個監督式學習者的任務在觀察完一些訓練範例（輸入和預期輸出）後，去預測這個函數對任何可能出現的輸入值的輸出。要達到此目的，學習者必須以 " 合理 " （見歸納偏向）的方式從現有的資料中一般化到非觀察到的情況。在人類和動物感知中，則通常被稱為概念學習（ concept learning ）。 Ex: 手寫文字識別、聲音處理、圖像處理、垃圾郵件分類與攔截、網頁檢索、基因診斷、股票預測等廣泛應用 (二) 無監督式學習不需要人力來輸入標籤。它是監督式學習和強化學習等策略之外的一種選擇。在監督式學習中，典型的任務是分類和迴歸分析，且需要使用到人工預先準備好的範例 (base) 。一個常見的非監督式學習是數據聚類。在人工神經網路中，自我組織映射（ SOM ）和適應性共振理論（ ART ）則是最常用的非監督式學習。 ART 模型允許叢集的個數可隨著問題的大小而變動，並讓使用者控制成員和同一個叢集之間的相似度分數，其方式為透過一個由使用者自定而被稱為警覺參數的常數...

閱讀完整內容