学习Hortonworks Sandbox的线索
简介
本文档帮助那些对Sandbox没有很多经验的用户。我们将在虚拟机和云环境中安装和浏览Sandbox。我们也会过Ambari用户接口。 让我们开始我们的Hadoop之旅。
准备
- 下载并安装Hortonworks Sandbox
Sandbox是什么
Sandbox是一个简易的、预配置的学习环境,包含最新版Apache Hadoop Enterprise, 特别的Hortonworks Data Platform(HDP)版本. Sandbox已经被打包到虚拟环境中,能够在云端或者个人虚拟机上运行。Sandbox可以帮助你自助学习或者浏览HDP。
第1步: 在虚拟机中浏览Sandbox
1.1 安装Sandbox
请参考如下安装步骤启动VM,而后启动HDP Sandbox.
注意:Sandbox系统需求要求内存不少于8G的64位操作系统并且开启BIOS的虚拟化功能。 查看最新特性,和在升级到HDP 2.4中已知并解决的问题请参考版本说明 含有Azure的Sandbox正在构建,很快就会更新到HDP2.4。
1.2 查看版本号
sandbox-version
1.3 查看主机地址
一旦安装Sandbox,它会解析环境主机地址,这个地址可能根据你用的虚拟机(Vmware, VirtualBox等)不同而不同。按照经验来说,安装结束后,确认页面会提示你的Sandbox的主机地址。
注意:如果有Azure,你的主机可以在仪表盘的公共IP地址(Public IP Address)找到。 更多说明,可以获取在Azure上部署Hortonworks Sandbox说明文档
如果你正在使用私有齐群或者云端运行Sandbox,请出到你的Sandbox解析到的主机。
1.4 连接到欢迎界面
在你的主机地址后添加端口号:8888,打开浏览器,然后进入Sandbox欢迎界面http://_host_:8888
。
1.5 多种方式执行终端命令
注意:下面所有的方法,登陆凭证指令在登陆到Sandbox终端时都相同。
-使用root作为用户名并且使用hadoop作为密码。
-首次登陆后,你将会被提醒重新输入密码,然后修改密码。
Secure Shell(SSH)方法
打开终端(mac或者Linux)或者putty(windows)。输入如下命令通过SSH登陆Sandbox:
# Usage:
ssh <username>@<hostname> -p <port>;
# Example:
ssh [email protected] -p 2222;
Shell网页客户端方法
打开浏览器。输入如下文本到你的浏览器中登陆到Sandbox:
# Usage:
# _host_:4200
Example:
127.0.0.1:4200
虚拟机终端方法
通过Virtualbox或者VMware打开Sandbox。出现Sandbox虚拟机欢迎界面。Linux或者Windows用户,输入ALT+F5
并且Mac用户,输入Fn+Alt+F5
登录到Sandbox虚拟机终端。
第2步:浏览Ambari
使用Sandbox欢迎界面的url导航到Ambari欢迎界面。
注意:登陆用户名和密码都是maria_dev。
2.1 使用终端找出正在运行的Sandbox的主机IP
如果你想要找到正在运行的Sandbox的主机地址,ssh到成功安装的sandbox终端并且按照如下步骤:
- 使用root作为用户名和hadoop作为密码登陆。
- 输入
ifconfig
并且找到eth0下的inet addr:。 - 使用inet addr, 端口号:8080,在浏览器中打开。这样就能跳转到Ambari登陆页面。
- 这个inet addr对每个会话是随机生成的并且不同的会话之间也不同。
Sandbox提供的服务
Service | URL |
---|---|
Sandbox欢迎页面 | http://host:8888 |
Ambari仪表板 | http://host:8080 |
Ambari欢迎页面 | http://host:8080/views/ADMIN_VIEW/2.2.1.0/INSTANCE/#/ |
Hive用户界面 | http://host/#/main/views/HIVE/1.0.0/AUTO_HIVE_INSTANCE |
Pig用户界面 | http://host:8080/#/main/views/PIG/1.0.0/Pig |
File用户界面 | http://host:8080/#/main/views/FILES/1.0.0/Files |
SSH网页客户端 | http://host:4200 |
Hadoop配置 | http://host:50070/dfshealth.html http://host:50070/explorer.html |
登陆凭证
服务 | 用户名 | 密码 |
---|---|---|
Ambari | maria_dev | maria_dev |
Ambari | admin | 2.2节 |
Linux OS | root | hadoop |
2.2 手动设置Ambari管理员密码
- 启动你的sandbox并且打开终端(mac或者Linux)或者putty(windows)
- SSH使用root登陆到sandbox
ssh [email protected] -p 2222
。Azure和VMware用户,_host_
和_port_
会有所不同。 - 输入如下命名:
注意:现在你可以以管理员身份登陆到ambari执行操作,比如启动或者停止服务。# Updates password ambari-admin-password-reset
2.3 浏览Ambari欢迎界面的5个主要功能
进入Ambari欢迎界面URL,然后你可以看到类似的界面:
- “管理集群” 带你进入作为Hadoop操作最重要的UI的Ambari仪表盘
- “用户+组管理” 允许你增加&删除Ambari用户和组
- “群组” 允许你为Ambari用户和组授权
- “Ambari用户界面” 列出了部分集群的Ambari用户视图
- “部署界面” 提供了对添加和删除Ambari用户界面的管理
2.4 浏览Ambari仪表盘链接
进入Ambari仪表盘URL,然后你可以看到类似的界面:
点击
- 指标(Metrics),热力图(Heatmap),配置(Configuration) 接着点击
- 仪表盘(Dashboard),服务(Services),主机(Hosts),提醒(Alerts),管理(Admin)和用户界面图标(3*3的方格图标),以此来了解Ambari为我们提供的可用资源。
第3步:问题汇总
点击Hortonworks Coummunity Connectuion(HCC)去寻找问题的答案,在你的Hdoop之旅中遇到的时候。
3.1 在HCC寻找答案的技巧
- 插入关于问题相关的课程的引用
- 通过包含关键词(错误,课程名称,等)使问题尽量详尽
更多阅读
- 学习更多Hadoop,请参考HDP入门文档
- 开始使用Hortonworks Data Platform,请浏览HDP之Hadoop入门课程
- 如果有问题,反馈或者在搭建环境是需要帮助,请访问developer.hortonworks.com
- 请同时参考HDP文档
课程名称: Learning the Ropes of the Hortonworks Sandbox
HCC课程标签: tutorial-160、HDP-2.4