- 軟件大小:100.59M
- 軟件語言:中文
- 軟件類型:國產(chǎn)軟件
- 軟件類別:免費(fèi)軟件 / 數(shù)據(jù)庫類
- 更新時(shí)間:2017-05-24 08:26
- 運(yùn)行環(huán)境:WinAll, WinXP, Win7, Win8
- 軟件等級(jí):
- 軟件廠商:
- 官方網(wǎng)站:http://sonlywya.cn
100.59M/中文/0.7
54.59M/中文/10.0
36.62M/中文/10.0
10000.00M/中文/0.8
1228.79M/中文/10.0
weka中文版官方最新版是一款非常實(shí)用的數(shù)據(jù)挖掘軟件,這款軟件廣泛應(yīng)用于SQL數(shù)據(jù)庫領(lǐng)用,下面有綠色資源網(wǎng)小編為您帶來weka中文版32位/64位官網(wǎng)最新版下載,需要的朋友歡迎來本站免費(fèi)下載使用。
WEKA的全名是懷卡托智能分析環(huán)境(Waikato Environment for Knowledge Analysis),同時(shí)weka也是新西蘭的一種鳥名,而WEKA的主要開發(fā)者來自新西蘭。
Weka是一款開源的、非商業(yè)性質(zhì)的免費(fèi)數(shù)據(jù)挖掘軟件,集合了大量能承擔(dān)數(shù)據(jù)挖掘任務(wù)的計(jì)算機(jī)學(xué)習(xí)算法,包括對(duì)數(shù)據(jù)進(jìn)行預(yù)處理、分類、回歸、聚類、關(guān)聯(lián)規(guī)則以及在新的交互界面上的可視化。數(shù)據(jù)挖掘軟件Weka的技術(shù)基于假設(shè)數(shù)據(jù)是以一種單個(gè)文件或關(guān)聯(lián)的,在那里,每個(gè)數(shù)據(jù)點(diǎn)都被許多屬性標(biāo)注。
Weka使用Java的數(shù)據(jù)庫鏈接能力可以訪問SQL數(shù)據(jù)庫,并可以處理一個(gè)數(shù)據(jù)庫的查詢結(jié)果。它主要的用戶接品是Explorer,也同樣支持相同功能的命令行,或是一種基于組件的知識(shí)流接口。如果想自己實(shí)現(xiàn)數(shù)據(jù)挖掘算法的話,可以看一下Weka的接口文檔,在Weka 中集成自己的算法甚至借鑒它的方法自己實(shí)現(xiàn)可視化工具并不是一件很困難的事情。
WEKA把分類(Classification)和回歸(Regression)都放在“Classify”選項(xiàng)卡中,這是有原因的。
在這兩個(gè)任務(wù)中,都有一個(gè)目標(biāo)屬性(輸出變量)。我們希望根據(jù)一個(gè)樣本(WEKA中稱作實(shí)例)的一組特征(輸入變量),對(duì)目標(biāo)進(jìn)行預(yù)測(cè)。為了實(shí)現(xiàn) 這一目的,我們需要有一個(gè)訓(xùn)練數(shù)據(jù)集,這個(gè)數(shù)據(jù)集中每個(gè)實(shí)例的輸入和輸出都是已知的。觀察訓(xùn)練集中的實(shí)例,可以建立起預(yù)測(cè)的模型。有了這個(gè)模型,我們就可 以新的輸出未知的實(shí)例進(jìn)行預(yù)測(cè)了。衡量模型的好壞就在于預(yù)測(cè)的準(zhǔn)確程度。
在WEKA中,待預(yù)測(cè)的目標(biāo)(輸出)被稱作Class屬性,這應(yīng)該是來自分類任務(wù)的“類”。一般的,若Class屬性是分類型時(shí)我們的任務(wù)才叫分類,Class屬性是數(shù)值型時(shí)我們的任務(wù)叫回歸。
現(xiàn)在我們計(jì)劃挖掘出支持度在10%到100%之間,并且lift值超過1.5且lift值排在前100位的那些關(guān)聯(lián)規(guī)則。我們把 “l(fā)owerBoundMinSupport”和“upperBoundMinSupport”分別設(shè)為0.1和1,“metricType”設(shè)為 lift,“minMetric”設(shè)為1.5,“numRules”設(shè)為100。其他選項(xiàng)保持默認(rèn)即可。“OK” 之后在“Explorer”中點(diǎn)擊“Start”開始運(yùn)行算法,在右邊窗口顯示數(shù)據(jù)集摘要和挖掘結(jié)果。
下面是挖掘出來的lift排前5的規(guī)則。
Best rules found:
1. age=52_max save_act=YES current_act=YES 113 ==> income=43759_max 61 conf:(0.54) < lift:(4.05)> lev:(0.08) [45] conv:(1.85)
2. income=43759_max 80 ==> age=52_max save_act=YES current_act=YES 61 conf:(0.76) < lift:(4.05)> lev:(0.08) [45] conv:(3.25)
3. income=43759_max current_act=YES 63 ==> age=52_max save_act=YES 61 conf:(0.97) < lift:(3.85)> lev:(0.08) [45] conv:(15.72)
4. age=52_max save_act=YES 151 ==> income=43759_max current_act=YES 61 conf:(0.4) < lift:(3.85)> lev:(0.08) [45] conv:(1.49)
5. age=52_max save_act=YES 151 ==> income=43759_max 76 conf:(0.5) < lift:(3.77)> lev:(0.09) [55] conv:(1.72)
對(duì)于挖掘出的每條規(guī)則,WEKA列出了它們關(guān)聯(lián)程度的四項(xiàng)指標(biāo)。
命令行方式
我們也可以利用命令行來完成挖掘任務(wù),在“Simlpe CLI”模塊中輸入如下格式的命令:
java weka.associations.Apriori options -t directory-path"bank-data-final.arff
即可完成Apriori算法。注意,“-t”參數(shù)后的文件路徑中不能含有空格。
在前面我們使用的option為
-N 100 -T 1 -C 1.5 -D 0.05 -U 1.0 -M 0.1 -S -1.0 命令行中使用這些參數(shù)得到的結(jié)果和前面利用GUI得到的一樣。
我們還可以加上“- I”參數(shù),得到不同項(xiàng)數(shù)的頻繁項(xiàng)集。我用的命令如下:
java weka.associations.Apriori -N 100 -T 1 -C 1.5 -D 0.05 -U 1.0 -M 0.1 -S -1.0 -I -t d:"weka"bank-data-final.arff
挖掘結(jié)果在上方顯示,應(yīng)是這個(gè)文件 的樣子。
請(qǐng)描述您所遇到的錯(cuò)誤,我們將盡快予以修正,謝謝!
*必填項(xiàng),請(qǐng)輸入內(nèi)容