学习Hortonworks Sandbox的线索

简介

本文档帮助那些对Sandbox没有很多经验的用户。我们将在虚拟机和云环境中安装和浏览Sandbox。我们也会过Ambari用户接口。 让我们开始我们的Hadoop之旅。

准备

Sandbox是什么

Sandbox是一个简易的、预配置的学习环境,包含最新版Apache Hadoop Enterprise, 特别的Hortonworks Data Platform(HDP)版本. Sandbox已经被打包到虚拟环境中,能够在云端或者个人虚拟机上运行。Sandbox可以帮助你自助学习或者浏览HDP。

第1步: 在虚拟机中浏览Sandbox

1.1 安装Sandbox

请参考如下安装步骤启动VM,而后启动HDP Sandbox. hortonworks安装

注意:Sandbox系统需求要求内存不少于8G的64位操作系统并且开启BIOS的虚拟化功能。 查看最新特性,和在升级到HDP 2.4中已知并解决的问题请参考版本说明 含有Azure的Sandbox正在构建,很快就会更新到HDP2.4。

1.2 查看版本号

sandbox-version

1.3 查看主机地址

一旦安装Sandbox,它会解析环境主机地址,这个地址可能根据你用的虚拟机(Vmware, VirtualBox等)不同而不同。按照经验来说,安装结束后,确认页面会提示你的Sandbox的主机地址。 主机地址

注意:如果有Azure,你的主机可以在仪表盘的公共IP地址(Public IP Address)找到。 更多说明,可以获取在Azure上部署Hortonworks Sandbox说明文档

如果你正在使用私有齐群或者云端运行Sandbox,请出到你的Sandbox解析到的主机。

1.4 连接到欢迎界面

在你的主机地址后添加端口号:8888,打开浏览器,然后进入Sandbox欢迎界面http://_host_:8888欢迎界面

1.5 多种方式执行终端命令

注意:下面所有的方法,登陆凭证指令在登陆到Sandbox终端时都相同。

-使用root作为用户名并且使用hadoop作为密码。

-首次登陆后,你将会被提醒重新输入密码,然后修改密码。

Secure Shell(SSH)方法

打开终端(mac或者Linux)或者putty(windows)。输入如下命令通过SSH登陆Sandbox:

# Usage:
      ssh <username>@<hostname> -p <port>;
# Example:
      ssh [email protected] -p 2222;

Mac操作系统终端

Shell网页客户端方法

打开浏览器。输入如下文本到你的浏览器中登陆到Sandbox:

# Usage:
    #  _host_:4200
Example:
    127.0.0.1:4200

Web Shell外观

虚拟机终端方法

通过Virtualbox或者VMware打开Sandbox。出现Sandbox虚拟机欢迎界面。Linux或者Windows用户,输入ALT+F5并且Mac用户,输入Fn+Alt+F5登录到Sandbox虚拟机终端。 VirtualBox虚拟机终端

第2步:浏览Ambari

使用Sandbox欢迎界面的url导航到Ambari欢迎界面。

注意:登陆用户名和密码都是maria_dev

2.1 使用终端找出正在运行的Sandbox的主机IP

如果你想要找到正在运行的Sandbox的主机地址,ssh到成功安装的sandbox终端并且按照如下步骤:

  • 使用root作为用户名和hadoop作为密码登陆。
  • 输入ifconfig并且找到eth0下的inet addr:
  • 使用inet addr, 端口号:8080,在浏览器中打开。这样就能跳转到Ambari登陆页面。
  • 这个inet addr对每个会话是随机生成的并且不同的会话之间也不同。 inet addr

Sandbox提供的服务

Service URL
Sandbox欢迎页面 http://host:8888
Ambari仪表板 http://host:8080
Ambari欢迎页面 http://host:8080/views/ADMIN_VIEW/2.2.1.0/INSTANCE/#/
Hive用户界面 http://host/#/main/views/HIVE/1.0.0/AUTO_HIVE_INSTANCE
Pig用户界面 http://host:8080/#/main/views/PIG/1.0.0/Pig
File用户界面 http://host:8080/#/main/views/FILES/1.0.0/Files
SSH网页客户端 http://host:4200
Hadoop配置 http://host:50070/dfshealth.html http://host:50070/explorer.html

登陆凭证

服务 用户名 密码
Ambari maria_dev maria_dev
Ambari admin 2.2节
Linux OS root hadoop

2.2 手动设置Ambari管理员密码

  • 启动你的sandbox并且打开终端(mac或者Linux)或者putty(windows)
  • SSH使用root登陆到sandboxssh [email protected] -p 2222。Azure和VMware用户,_host__port_会有所不同。
  • 输入如下命名:
    # Updates password
    ambari-admin-password-reset
    
    注意:现在你可以以管理员身份登陆到ambari执行操作,比如启动或者停止服务。

修改密码

2.3 浏览Ambari欢迎界面的5个主要功能

进入Ambari欢迎界面URL,然后你可以看到类似的界面: Ambari欢迎界面

  • “管理集群” 带你进入作为Hadoop操作最重要的UI的Ambari仪表盘
  • “用户+组管理” 允许你增加&删除Ambari用户和组
  • “群组” 允许你为Ambari用户和组授权
  • “Ambari用户界面” 列出了部分集群的Ambari用户视图
  • “部署界面” 提供了对添加和删除Ambari用户界面的管理

2.4 浏览Ambari仪表盘链接

进入Ambari仪表盘URL,然后你可以看到类似的界面: Ambari仪表盘 点击

  • 指标(Metrics)热力图(Heatmap),配置(Configuration) 接着点击
  • 仪表盘(Dashboard)服务(Services)主机(Hosts)提醒(Alerts)管理(Admin)和用户界面图标(3*3的方格图标),以此来了解Ambari为我们提供的可用资源。

第3步:问题汇总

点击Hortonworks Coummunity Connectuion(HCC)去寻找问题的答案,在你的Hdoop之旅中遇到的时候。 HCC

3.1 在HCC寻找答案的技巧

  • 插入关于问题相关的课程的引用
  • 通过包含关键词(错误,课程名称,等)使问题尽量详尽

更多阅读


课程名称: Learning the Ropes of the Hortonworks Sandbox

HCC课程标签: tutorial-160、HDP-2.4