开发工具:
文件大小: 42mb
下载次数: 0
上传时间: 2019-08-03
详细说明:本文档是Weka的中文版详细教程。Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化(与之对应的是SPSS公司商业数据挖掘产品--Clementine )的,基于JAVA环境下开源的机器学习(machine learning)以及数据挖掘(data mining)软件。这是一个性价比最高的轻量级大数据分析必学软件,它和它的源代码可在其官方网站下载。IEF
WEKA软件
C]Weka GUI Chooser
Program Visualization Tools Help
PL邑+32
WEKA「备a
The University
of waikato
WEKA的界面
Experimenter
Lilnto Environment for Inowled-e Hnalycic
HnorledgeFlow
viφ了,5,
The univercity of hkir
sim立eT
HmL七冯= -land
口主要特点
它是集数据预处理、学习算法(分类、回归、聚类、关
联分析)和评估方法等为一体的综合性数据挖掘工具。
具有交互式可视化界面
提供算法学习比较环境
通过其接口,可实现自己的数据挖掘算法
3
2016/5/19
探索环境
算法试验环境
ka[的是建
解的M
C二
a
黑积号k加
r
HEHE
Mih ef eli s
Eas
部cr
U面
H8C02圈
九气 wbei SEamen EmAiL副
uNrs+q1-MB→N--5-2H
F eka GUI Chooser
Progr am Visualization Tools Help
真1c91五s
WEKA
The University
of waikato
知识流环境
命令行环境
linta EnTironment for Knowledge AnLlPs
Kno霄1 e dsef1aY
Ie
吕.b
c)1999-2011
e
I Talat FeMa
I Batiks wtsk aufs Castanes
圈 Th+ Lniversity f hailmto
Simple ClI
Hmil toⅡe丌工 aland
EImE F:wLE Borda
3. halp
电L1
ii FisSeL+
cHUtes
4
2016/5/19
IEF
Explorer环境
盘xp1
回
Preprocess Classify[ Cluster Associate Select attributes visualize
open file
open URL
open dAas
Generate
2
Undo
E
Choose
Apply
Current relation
Selected attribute
Relation: hank-data
Hame income
6
Type: Numeric
stances boll
ttributes 12
Missing: O [o%)
Distinct: 599
Unique:598(100%
Ttributes
Statistic
value
Minimum
5014.21
Iert
Pattern aximum
631301
Mean
27524031
Nam
stdDev
128994
Ion
ss: pep(Nom)
visualize l
income
6□ married
children
5
ave al
口 current act
r
g
bondage
one
Remoe
Stat
OK
8
「1cn
xO
5
2016/5/19
IEF
把“ Explorer”界面分成8个区域
口区域1的几个选项卡是用来切换不同的挖掘任务面板。
Preprocess(数据预处理):选择和修改要处理的数据。
classify(分类):训练和测试分类或回归模型。
cluster(聚类):从数据中聚类
Associate(关联分析):从数据中学习关联规则。
Select Attributes(选择属性):选择数据中最相关的属性。
Visualize(可视化):查看数据的二维散布图。
口区域2是一些常用按钮。包括打开、编辑、保存数据及数据转换等功
能。例如我们可以把文件“bank- data. csv”另存为“bank
data arff。
口区域3中可以选择(Ch。ose)某个筛选器( Filter),以实现筛选
数据或者对数据进行某种变换。数据预处理主要就利用它来实现。
6
2016/5/19
IEF
口区域4展示了数据集的关系名、属性数和实例数等基本情况。
口区域5中列出了数据集的所有属性。
勾选一些属性并“ Remove”就可以删除它们,删除后还可以利
用区域2的“Und。”按钮找回。
区域5上方的一排按钮是用来实现快速勾选的
口区域6中显示在区域5中选中的当前某个属性的摘要。
摘要包括属性名(Name)、属性类型(Type)、缺失值
( Missing)数及比例、不同值( Distinct)数、唯一值
( Unique)数及比例
对于数值属性和标称属性,摘要的方式是不一样的。图中显示的
是对数值属性“ Iioe”的摘要。
口数值属性显示最小值( Minimun)、最大值
( Maximum)、均值(Mean)和标准差( Std Dev)
口标称属性显示每个不同值的计数
7
2016/5/19
IEF
口区域7是区域5中选中属性的直方图。
若数据集的最后一个属性(这是分类或回归任务的默认目标
变量)是类标变量(例如“pep”),直方图中的每个长方
形就会按照该变量的比例分成不同颜色的段。
要想换个分段的依据,在区域7上方的下拉框中选个不同的
分类属性就可以了。
下拉框里选上“ No Class”或者一个数值属性会变成黑白
的直方图。
8
2016/5/19
IEF
口区域8窗口的底部区域,包括状态栏、10g按钮和Weka鸟。
状态栏( Status)显示一些信息让你知道正在做什么。例如,
如果 Explorer正忙于装载一个文件,状态栏就会有通知。
在状态栏中的任意位置右击鼠标将会出现一个小菜单。这个菜
单给了你两个选项:
口 Memory Information-显示WEKA可用的内存量。
口 Run garbage collector--强制运行Java垃圾回收器,
搜索不再需要的内存空间并将之释放,从而可为新任务分
配更多的内存。
Log按钮可以查看以weka操作日志。
右边的weka鸟在动的话,说明WEKA正在执行挖掘任务。
9
2016/5/19
IEF
Knowledge Flow环境
要 BRa noT1edge1互 ILLOM ELIT
CVisusliration
日[食病「「你奩日
SCPr
AI biTe
Irel
aat
taser
Asrforenee Cha
rv出P= Layont
盛、一
1e匀吧的
看。°
Arbr
S口
Torquer
Fokker
S出eim
PeforrenseEval-ter
Ha+、tset'、cma
奩
IE=Uall
citrate
尸贴t
far sne ter s
[KswrleleFlor
5:44
Ye
曰1 ecue tp the eka ingyledze F
hr王。aler
FinL shed
Crosslalidati orPoldMaker
Finished
tYih让1白tin
F“w. attribu!=5 alecto on.二f5
Finished
1.0-10.1-1.匪-12-0
10
2016/5/19
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.