發表文章

目前顯示的是有「資料探勘weka」標籤的文章

ppt題目ID3作法省略的步驟)_到底4/14後面的0跟1還有0.65怎麼來的?

圖片
這是老師講義

關聯分析_Apriori

圖片
Every rule is composed by two different sets of items, also known as itemsets,  X and  Y, where  X is called antecedent or left-hand-side (LHS) and Y consequent or right-hand-side (RHS).

決策樹_ID3

圖片

鳶尾花資料集_基本觀念介紹

圖片
鳶尾花   一種草本開花植物 只有三枚花瓣   其餘的為其保護花蕾的花萼部分。 在一般人們眼中,這三枚瓣狀花萼 外觀 像似花瓣,常導致人們將它們也誤認為花瓣。 鳶尾花的花名英文  Iris   源自於希臘語一詞,原意為彩虹。 被暗指鳶尾花的花瓣顏色的絢麗就好比彩虹。 鳶尾花資料集 最早由1936年 R.A. Fisher (Ronald Aylmer Fisher) 羅納德·費雪先生所創建出來的, 非常著名的一種模式識別資料集。 鳶尾花資料集 主要包含三種類別 1、山鳶尾(Iris Setosa) 2、變色鳶尾(Iris Versicolour) 3、維吉尼亞鳶尾(Iris Virginica) 定義了 五個 屬性 1、花萼長(sepal length) ---> numeric property / unit : cm 2、花萼寬(sepal width) ---> numeric property / unit : cm 3、花瓣長(petal length) ---> numeric property / unit : cm 4、花瓣寬(petal width) ---> numeric property / unit : cm 5、類別(class) ---> class property ----> Final 被放上網站上供大家用的時間為1988年 美國加州大學爾灣分校(University of California at Irvine)/ (UCI) 資料集link:   http://archive.ics.uci.edu/ml/datasets/Iris 網站上LOGO為一隻食蟻獸 為學校的吉祥物 "食蟻獸彼得" 在weka預設的data中就可以找到此資料集 鳶尾花資料集的每個類別都各有50個實體 移除出現頻繁的數值

懷卡托(weka)智能分析環境_作業教學_成功把網路上資料放進weka_逐步Debug

圖片
weka是紐西蘭的一種鳥名 又被稱作毛利母雞一種體型為一隻雞大小、不能飛的鳥類 看起來不錯吃 這裡在課堂中是指 由紐西蘭懷卡托大學用Java開發的數據挖掘常用軟體   WEKA存儲數據的格式是ARFF(Attribute-Relation File Format)文件, 一種ASCII文本文件。 第一階段. 觀察檔案內容格式 下載好weka3.8軟體後 到 C:\Program Files\Weka-3-8\data (PS:於WEKA安裝目錄的「data」子目錄下尋找) 開啟一個關於天氣預報的檔案內容描述   weather.numeric.arff 這裡推薦用  Ultraedit(要付費,免費有有效期限) 或是 Notepad++(免費無期限) 開啟 識別ARFF文件的重要依據是分行,因此不能在這種文件里隨意的斷行 也盡量不要用 文字記事本打開怕會受到因為 回車符 定義不一致而導致分行不正常 (换行符'\n'  以及  回車符'\r') ARFF files have two distinct sections. The first section is the Header information , which is followed the Data information. The Header of the ARFF file contains (1). the name of the relation, (2). a list of the attributes (the columns in the data), and their types. the nth @attribute declaration is always the nth field of the attribute 當你有 N個  @attribute  宣告的時候  就代表你 有 N個屬性欄位 第二階段.  自行網搜資料庫 http://data.gov.tw/ --> 全部資料集 ...