基于Hadoop的MapReduce并行apriori算法,实验设计在3台虚拟机上,搭建步骤:(1) 虚拟机上安装ubuntu系统,安装JDK、SSH、Hadoop。
(2) 配置JDK、Hadoop环境变量及MapReduce组件。
(3) 配置SSH免密登录。
(4) 使用hadoop namenode -format命令格式化NameNode,使用start-all.sh命令启动所有Hadoop进程。
(5) 在各节点命令行输入jps检查是否启动成功,若成功,使用wordcount示例进行