Учебный курс по Open-source BI - Apache Superset, Metabase, Redash
Общее
Metabase
Metabase – инструмент бизнес-аналитики с открытым исходным кодом. Он не требует знания SQL и имеет приятный интерфейс, позволяющий создавать аналитические графики всего несколькими щелчками мыши.
- Знакомство с Metabase
- Начало работы с Metabase
- Metabase. Руководство пользователя 01. Что такое Metabase?
Apache Superset
Интуитивно понятный интерфейс для визуализации наборов данных и создания интерактивных информационных панелей, а также возможность подключения к более чем 40 базам данных делают Apache Superset одним из популярных решения для создания полноценных BI-систем во всем мире.
Apache Superset — Open-Source-инструмент для сбора, обработки и визуализации данных. Он содержит необходимую базовую функциональность для разработки BI-решений.
В числе достоинств Apache Superset:
- Большой набор типов визуализации данных, возможность создавать дашборды и отчёты с использованием преднастроенных шаблонов.
- Возможность добавления пользовательских плагинов для создания дашбордов.
- Расширяемая модель безопасности, которая позволяет гибко настраивать права доступа к функциональности продукта и данным.
- Встроенное асинхронное выполнение запросов и кеширование.
- Возможность настройки Single Sign-On (технология единого входа) для разных приложений с Superset.
- Гибкое масштабирование и возможность обработки больших объёмов данных без снижения производительности.
- Расширенная совместимость с базами данных: ClickHouse, Greenplum, PostgreSQL и не только.
Но Superset не панацея. У инструмента есть и недостатки:
- Высокие требования к компетенции специалистов — для подготовки данных и администрирования Superset нужен релевантный опыт.
- Для работы с Apache Superset потребуется отдельно разворачивать, настраивать и поддерживать сторонние БД, а также использовать ПО для подготовки сырых данных и построения витрин данных.
- Отсутствие технической поддержки, подробной документации. Здесь нет привычной поддержки вендора, задачи по доработке и расширению функциональности решает пользователь.
- Сложность создания кастомных плагинов и поддержки их стабильной работы при обновлении ПО.
Вместе с тем Apache Superset адаптирован для работы в облаке, масштабирования в больших распределённых средах и хорошо работает внутри контейнеров. Это гибкий в настройке инструмент, который позволяет выбирать:
- веб-сервер (Gunicorn, Nginx, Apache);
- механизм базы данных с метаданными (MySQL, Postgres, MariaDB);
- очередь сообщений (Redis, RabbitMQ, SQS);
- серверную часть результатов (S3, Redis, Memcached);
- уровень кеширования (Memcached, Redis).
Есть разные способы развертывания Apache Superset в облаке: в Docker, Kubernetes (k8s), на виртуальных машинах.
- Что такое Apache Superset? Установка Docker. Примеры дашбордов
- Tableau vs Apache Superset
- Поднимаем Apache Superset
- Как установить на Ubuntu Apache Superset
- Apache Superset. Первый взгляд на BI инструмент
- Руководство по Apache Superset
- Обзор Apache Superset: функции, архитектура и установка
Полный мануал по Apache Superset
- Apache Superset - Вступление
- Apache Superset - Установка и настройка
- Apache Superset - Создание Вашего первого дашборда
- Apache Superset - Безопасность
- Apache Superset - SQL lab
- Apache Superset - Галерея визуализаций
- Apache Superset - Druid
- Apache Superset - Разное
- Apache Superset - FAQ
Главное по теме
- Apache Superset — инструмент бизнес-аналитики, который решает задачи сбора, обработки и визуализации данных. Это хороший выбор для компаний, которые привыкли работать с Open-Source-инструментами: знают «подводные камни», готовы при необходимости дорабатывать функциональность самостоятельно.
- Apache Superset можно развернуть в Docker, Kubernetes (k8s), на виртуальных машинах. Вариант развертывания Apache Superset не влияет на общую архитектуру, но каждая платформа подходит для разных задач. Например, развёртывание в Docker — вариант для простых тестов, в Kubernetes — для Production-Ready-решения.
- Apache Superset — не коробочное решение и не покрывает задачи полного цикла. Для работы с ним потребуется отдельно разворачивать, настраивать и поддерживать сторонние БД, а также использовать ПО для подготовки сырых данных и построения витрин данных.