内容纲要
-
环境
大数据平台基于CDH5.16.2搭建,对应的hadoop版本是2.6.0。
(hadoop版本在后面本要和使用工具的版本严格对应) -
从apache下载对应的hadoop版本,并解压到本地
hadoop 下载地址 -
下载hadoop本地执行环境,一定要和自己版本一致(或者全下载)
hadoop 较老版本
hadoop 较新版本
将hadoop本地环境文件覆盖到和上一步下载的hadoop文件夹中(版本要对照)
4.配置环境变量
新增:HADOOP_HOME=<hadoop文件目录>
Path后追加:;%HADOOP_HOME%\bin -
在idea下新建mvn项目,在界面右上交工具栏点击 ProjectStructure -> Modules -> Dependencies 如图
按照图中项将所需Jar包导入项目中 -
下载大数据平台hdfs的客户端配置,将下载配置中的
core-site.xml
hdfs-site.xml
log4j.properties
ssl-client.xml放入项目的resource目录下
-
直接运行程序,正常就可以看到执行结果,如果有问题请自行解决:trollface: