Apache Superset - Создание Вашего первого дашборда
- Подключение к новой базе данных
- Добавление новой таблицы
- Изучение Ваших данных
- Создание фрагмента и дашборда
Данное руководство предназначено для тех, кто хотел бы создавать графики и дашборды в Superset. Мы покажем, как подключить Superset к новой базе данных и настроить в ней таблицу для последующего анализа. Вы также сможете изучить данные, которые предоставили, и добавите визуализацию в дашборд.
Подключение к новой базе данных
Подразумевается, что у Вас уже есть база данных и Вы можете подключить ее с того же компьютера, на котором установлен Superset. Если Вы еще только тестируете Superset и хотите изучить данные, предоставленные в качестве образца, Вы можете скачать примеры наборы данных PostgreSQL в новую базу данных либо настроить примеры данных о погоде , которые мы используем в данной статье.
В меню Источники выберите «Базы данных»:
Затем кликните по зеленому значку плюса, расположенному в верхнем правом углу:
На этой странице Вы можете настроить несколько дополнительных опций, но для данного руководства Вам понадобятся только две вещи:
- Назовите Ваше подключение к базе данных:
- Укажите URI подключения SQLAlchemy и проверьте подключение:
В этом примере показана строка подключения для нашей тестовой базы данных погоды. Как указано в тексте под URI, Вам следует обратиться к документации SQLAlchemy по созданию новых URI подключения для Вашей целевой базы данных.
Нажмите кнопку «Проверить соединение», чтобы убедиться, что все работает должным образом. Как только Superset сможет успешно подключиться и пройти аутентификацию, Вы должны увидеть всплывающее окно, подобное этому:
Кроме того, Вы также должны увидеть список таблиц, которые Superset может считывать, из схемы, к которой Вы подключены, внизу страницы:
Если с подключением все в порядке, сохраните конфигурацию, нажав кнопку «Сохранить» внизу страницы:
Добавление новой таблицы
Сейчас, когда Вы настроили базу данных, Вам нужно добавить определенные таблицы в Superset, где Вы будете добавлять запросы.
В меню Источники выберите Таблицы:
Нажмите на зеленый значок плюса рядом с верхним левым углом:
Вам необходимо добавить следующие данные:
- Название таблицы
- Целевую базу данных из раскрывающегося меню «База данных» (т. е. ту, которую Вы добавили выше).
- Опционально, схема базы данных. Если таблица существует в схеме «по умолчанию» (например, общедоступная схема в PostgreSQL или Redshift), Вы можете оставить поле схемы пустым.
Нажмите на кнопку Сохранить для сохранения настройки:
При перенаправлении обратно к списку таблиц вы должны увидеть сообщение о том, что ваша таблица создана:
Это сообщение также указывает на необходимость редактирования конфигурации таблицы. Сейчас мы отредактируем только некоторую часть конфигурации — просто для того, чтобы Вы поняли, как это делается и начали работу— остальное оставим для более продвинутого руководства.
Нажмите кнопку редактирования рядом с созданной Вами таблицей:
Нажмите Список столбцов таблицы. Здесь Вы определите, как можно использовать определенные столбцы Вашей таблицы для изученияи данных. Мы рассмотрим следующие параметры:
- Если Вы хотите, чтобы пользователи группировали метрики по определенному полю, отметьте его как «Группируемое».
- Если Вам нужно отфильтровать определенное поле, отметьте его как Фильтруемое.
- Является ли это поле чем-то, что Вы хотели бы подсчитать? Установите флажок Count Distinct.
- Вы хотите суммировать эту метрику или получить сводную статистику? Помогут столбцы Sum, Min и Max.
- Поле времени должно быть задействовано для добавления даты или времени. Чуть позже мы расскажем, как это выглядит при проведении анализа.
Вот, как мы настроили поля для данных о погоде. Даже для таких показателей, как измерения погоды (осадки, снегопад и т. д.), идеально группировать и фильтровать по следующим значениям:
Нажмите Сохранить для сохранения данных.
Изучение Ваших данных
Для начала изучения Ваших данных просто нажмите на название таблицы которую Вы только что создали, в списке доступных таблиц:
По умолчанию Вы увидите Вид Таблицы:
Давайте рассмотрим базовый запрос, чтобы получить количество всех записей в нашей таблице. Во-первых, нам нужно изменить фильтр «С …», чтобы захватить диапазон наших данных. Вы можете использовать простые фразы для применения этих фильтров, например «3 года назад»:
Верхний предел времени, фильтр «До» по умолчанию равен «сейчас», что может быть (а может и не быть) тем, что Вам нужно.
Найдите раздел Метрики под заголовком Группировать по и начните вводить «Count» — Вы увидите список показателей, соответствующих тому, что Вы вводите:
Выберите метрику Посчитать(*) , затем нажмите кнопку Запрос:
Вы увидите результаты в таблице:
Давайте сгруппируем это по полю описание_погоды, чтобы получить количество записей по типу зафиксированной погоды, добавив его в раздел «Группировать по»:
и запустите запрос:
Давайте найдем более полезную информацию: первые 10 случаев и мест, где была зафиксирована самая высокая температура в 2015 году.
Заменим описание_погоды на широта, долгота и измерение_дата в разделе Группировать по:
И заменим Посчитать (*) на max__измерение_флажок:
Метрика max__измерение_фложок была создана, когда мы установили флажок под Max и рядом с полем измерение_флажок, указывая, что это поле было числовым, и что мы хотели найти его максимальное значение при группировании по определенным полям.
В нашем случае измерение_флажок — это значение проведенного измерения, которое явно зависит от типа измерения (исследователи зафиксировали разные значения для осадков и температуры). Поэтому мы должны отфильтровать наш запрос только по записям, где описание_погоды равно «Максимальной температуре», что необходимо сделать в разделе «Фильтры»:
Наконец, поскольку нас интересуют только первые 10 измерений, мы ограничиваем наши результаты 10 записями, используя параметр «Ограничение строк» в заголовке «Параметры»:
Нажимаем Запрос и получаем следующие результаты:
Максимальное значение 1370, зафиксированное где-то в Неваде, равняется 137 C или примерно 278 F. Вряд ли данное значение было правильно записано. Ранее мы уже находили подобные исключительные случаи с помощью Superset.
Вы можете сделать еще пару вещей с этим измерением:
- Форматирование по умолчанию показывает такие значения, как 1,37k, которые могут быть трудны для чтения некоторыми пользователями. Вероятно, Вы захотите увидеть полное значение, разделенное запятыми. Вы можете изменить форматирование любой меры, отредактировав ее конфигурацию («Редактировать конфигурацию таблицы» > «Список метрик Sql» > «Редактировать метрику» > «D3Format»).
- Кроме того, Вы можете захотеть видеть измерения температуры в градусах Цельсия, а не в десятых долях градуса. Или Вы можете преобразовать температуру в градусы по Фаренгейту (Изменить конфигурацию таблицы > Список метрик Sql > Редактировать метрику > Формулировка SQL).
А пока давайте создадим наилучший вариант визуализации этих данных и добавим их в дашборд.
Меняем Тип диаграммы на «Распределение - гистограмма»
Наш фильтр по измерениям максимальной температуры был сохранен, но параметры запроса и форматирования зависят от типа диаграммы, поэтому придется снова установить значения:
Обратите внимание на расширенные параметры форматирования для этой диаграммы: возможность устанавливать метки осей, поля, деления и т. д.Ю которые позволят сделать данные более презентабельными для широкой аудитории. В данном случае мы запускаем наш запрос и получаем следующую диаграмму:
Создание фрагмента и дашборда
Эта гистограмма может быть интересна пользователям, так что давайте сохраним ее. В Superset сохраненный запрос называется Фрагмент (Slice).
Чтобы создать его, нажмите кнопку «Сохранить как» в левом верхнем углу:
Должно появиться всплывающее окно с просьбой назвать фрагмент и, при желании, добавить его в дашборд. Поскольку мы еще не создали ни одного дашборда, мы можем его создать и сразу же добавить наш фрагмент. Давайте так и поступим:
Нажмите «Сохранить», чтобы вернуться к исходному запросу. Мы видим, что наш фрагмент и дашборд успешно созданы:
Давайте проверим наш новый дашборд. Нажимаем на меню Дашбордов (Dashboards):
Находим дашборд, который только что создали:
Кажется, все сработало – наш фрагмент здесь!
Но он немного меньше, чем хотелось бы. К счастью, Вы можете настроить размер на панели инструментов, щелкнув, удерживая и перетаскивая правый нижний угол до нужных размеров:
После настройки размера Вам будет предложено щелкнуть значок в правом верхнем углу панели инструментов, чтобы сохранить новую конфигурацию.
Поздравляю! Вы успешно связали, проанализировали и визуализировали данные в Superset. Существует множество других конфигураций таблиц и вариантов визуализации, поэтому, пожалуйста, продолжите самостоятельно изучать и создавать собственные фрагменты и дашборды.