本地安装kylin学习环境

本地安装kylin学习环境:
(以HDP2.5和kylin2.5.0+为例)
原理简介:HDP是一个集成的大数据环境,包括了通用的大数据组件例如MR,hive,HBASE等等,而且有统一的ambari进行管理,使用十分方便。HDP的大数据集群环境是以docker的方式在虚拟机内运行的,相当于是VMware运行的centos虚拟机内运行一个docker,docker内就是大数据集群,我们需要在docker内配合已有的大数据集群来搭建自己的kylin。涉及到docker的端口映射,大数据集群的环境设定等问题
① 下载HDP sandbox for VMware并导入虚拟机
② 开启虚拟机,以SSH方式登录,密码默认为root/Hadoop
③ Systemctl disable sandbox.service
④ 重启虚拟机
⑤ vi /root/start-scripts/start-sandbox.sh
在-p 6080:6080 \下一行添加 –p 7070:7070
注意:这一步可以添加自己需要的端口,但要注意不要和虚拟机冲突,否则会导致docker无法启动
⑥ docker rm sandbox
⑦ systemctl enable sandbox.service
⑧ 重启
⑨ 浏览器打开IP:4200,以root/hadoop登录后,会提示输入旧密码hadoop,在输入两次新的密码即可,记住此处密码,以后常用
⑩ ambari-admin-passward-reset
设置ambari的账户和密码,设置为admin/admin即可,也可自行设定
⑪ 浏览器打开IP:8080,以admin/admin登录ambari,查看各组件运行状态,并且注意,ambari并不默认开启HBASE,需手动开启,以后每次启动kylin都需要注意HBASE状态
⑫ 回到IP:4200,wget下载kylin
cd /usr/local/
wget http://mirror.bit.edu.cn/apache/kylin/apache-kylin-2.5.0/apache-kylin-2.5.0-bin-hbase1x.tar.gz
⑬ 下载后解压,设置KYLIN_HOME为解压后的目录
⑭ 注意必须单独设置SPARK_HOME,否则kylin无法启动,HDP的SPARK目录为:
/usr/hdp/2.5.0.0-1245/spark2
⑮ bin/kylin.sh start 运行kylin
bin/sample.sh 导入样例数据和模型和cube 重启kylin或重新加载元数据后可用

你可能感兴趣的:(kylin,大数据,多维分析)