HUE. Быстрый старт

HUE (Hadoop User Experience) – это веб-интерфейс для анализа данных на Hadoop.
Hue позволяет взаимодействовать с кластером Hadoop из веб-консоли и выполнять задачи по анализу и обработке данных: выполнение задач MapReduce, выполнение запросов HiveQL, просмотр баз данных HBase и т.д.

Подключение к Hue

  1. Для доступа в HUE из Ambari передите на соответствующую вкладку в меню слева и выберите Hue WEB-UI.

    Увеличить

  2. Авторизуйтесь в системе, введя логин и пароль пользователя.

    Увеличить

Создание домашней директории

Для создания домашней директории на кластере выполните следующее:
  1. Нажмите на имя пользователя в меню слева и перейдите в раздел My profile.

    Увеличить

  2. Включите чекбокс Create home directory и нажмите Update user.

    Увеличить

После выполненных действий станет доступна домашняя директория пользователя в HDFS.

Утилиты HUE

На вкладке Editor представлен список утилит, с которыми можно взаимодействовать из HUE.

Увеличить

Рассмотрим несколько примеров использования HUE:

Hive Editor

Ниже приведен пример взаимодействия с утилитой Hive Editor. Она позволяет писать запросы к базам данных Hive и отображать результаты в едином интерфейсе, что упрощает их анализ.
Перейдите в Hive Editor по пути Editor - Hive и введите запрос для создания тестовой таблицы. Запрос можно исполнять с помощью комбинации клавиш Ctrl+Enter или пиктограммы "play".

Увеличить

Данный запрос можно сохранить, кликнув на соответствующую иконку.

Увеличить

Oozie Workflow

Составленный запрос Hive можно выполнить через Oozie - это еще один набор интерфейсов, предоставляемых Hue.
Oozie состоит из следующих основных частей:
  • Workflow (рабочий процесс) хранит и запускает потоки операций, состоящие из разных типов заданий Hadoop (MapReduce, Pig, Hive и т. д.);
  • Coordinator (координатор) - программа, которая запускает действия (обычно задания рабочего процесса) при выполнении набора условий. Условиями могут быть частота времени или другие внешние события;
  • Bundle - высший уровень абстракции в Oozie. Предоставляет способ упаковать несколько заданий Coordinator и Workflow, а также управлять жизненным циклом этих заданий. Можно указать время начала работы Bundle.
Создадим workflow job на основе тестового скрипта Hive:
  1. Перейдите на вкладку Editor/Hive и сохраните тестовый скрипт (см. выше).

Увеличить

  1. Перейдите на вкладку Scheduler/Workflow и перетяните иконку Hive Query в область Drop your action here.

    Увеличить

  2. Выберите скрипт из списка доступных и сохраните Workflow с помощью кнопки Save.

    Увеличить

  3. Запусте задание (job) на исполнение, нажав на пиктограмму запуска ("play"). При успешном выполнении вкладка Job Browser будет выглядеть так:

    Увеличить

HDFS в HUE

В HUE также реализован браузер файловой системы HDFS, который доступен на вкладке Files. Через данный интерфейс можно создавать папки и файлы в HDFS, а также загружать данные из локальной файловой системы.
Создадим новую папку test_guide и добавим туда базу данных в формате sql:
  1. Создайте папку, выбрав New - Directory.

    Увеличить

  2. Перейдите в созданную папку и загрузите файл, нажав Upload и указав его расположение в локальной файловой системе.

    Увеличить

  3. Выбранный файл загрузится в HDFS.

    Увеличить

Для просмотра файлов в HDFS можно также использовать собственный веб-интерфейс данного компонента.

Интеграции HUE с компонентами Hadoop

КомпонентИнтерфейс взаимодействияОписание
HDFS
WebHDFSHue использует WebHDFS Rest API для взаимодействия с HDFS. При указании NameNode будет использоваться именно она. Для работы в режиме HA - вместо NameNode надо указывать HttpFs. Для этого надо убедиться, что в HDFS включен dfs.webhdfs.enable в hdfs-site.xml
Hive
HiveServer2 Thrift serverДля работы с Hive - используется HiveServer2 Thrift server
Spark2
Livy REST APILivy - это служба, которая обеспечивает простое взаимодействие со Spark2 через интерфейс REST
Yarn
Resource Manager REST API; History server APIКак и для HDFS, Hue поддерживает один или два сервиса resourcemanager (два для HA). Нужно указать адреса сервисов YARN в двух секциях [[[default]] и [[[ha]]]
Oozie
Oozie RESTДля взаимодействия с Oozie требуется сам Oozie
HBase
HBase ThriftПриложение Hue обменивается данными через прокси- сервер, называемый HBase Thrift Server, который затем пересылает запросы в HBase.
Предыдущий раздел
Быстрый старт
Следующий раздел
Быстрый старт
Была ли страница полезной?