Tableau vs Apache Superset
Apache Superset и Tableau – это системы бизнес-аналитики, используемые организациями для визуализации и анализа данных.
Apache Superset – это Open source BI система, то есть, приложение с открытым исходным кодом, которое может обрабатывать данные в масштабе петабайт.
Tableau известен в аналитическом сообществе как лидер в области систем бизнес-аналитики с простой в использовании платформой и множеством интеграций.
Эта статья даст вам представление об Apache Superset и Tableau по 5 различным направлениям: функции платформы и гибкость, поддерживаемые источники данных, аутентификация и авторизация, визуализация, цены.
Оглавление
- Введение в Apache Superset
- Введение в Tableau
- Понимание ключевых различий между Apache Superset и Tableau
- Недостатки Apache Superset
- Недостатки Tableau
- Заключение
Введение в Apache Superset
Apache Superset – это лёгкое веб-приложение для BI-аналитики с открытым исходным кодом. Оно используется для исследования и визуализации данных, предоставляя широкий спектр возможностей для визуализации: от круговых до высокодетализированных геопространственных диаграмм.
Приложение возникло в виде проекта Максима Бошемена на форуме разработчиков, когда тот работал в Airbnb, а позже, в 2017 г, было встроено в инкубационную программу apache. В организации Apache Software Foundation оно превратилось из инкубационной программы в проект высшего уровня.
Особенности Apache Superset:
- Предоставляет богатый набор визуализаций.
- Даёт возможность создания собственных визуализаций с помощью подключаемых модулей, что значительно расширяет возможности продукта.
- Поддерживает большинство баз данных на основе SQL: MS SQL Server, MySQL, PostgreSQL, Oracle, SQLite, MariaDB, Redshift; и многие другие благодаря использованию SQLAlchemy.
- Может интегрироваться с Apache Druid. Apache Druid – это база данных, используемая в приложениях для обеспечения высокой производительности запросов и ответов в режиме реального времени. Продолжительное время безотказной работы, обеспечиваемое Apache Druid, имеет первостепенное значение при работе с данными.
- Содержит встроенную SQL IDE, с помощью которой аналитик может выполнять SQL-запросы.
- Apache Superset использует расширяемую модель безопасности для определения доступа к своим функциям и интегрируется с основными поставщиками аутентификации (OAuth, OpenID, LDAP и т. д.).
Введение в Tableau
Tableau – BI-система, созданная в 2003 году тремя студентами Стэнфордского университета. Tableau имеет низкий порог вхождения, так что позволяет создавать визуализации и дашборды нетехническим специалистам любого уровня. Другое важное преимущество инструмента – большое количество поддерживаемых источников данных.
Особенности Tableau:
- Позволяет пользователю использовать естественный язык для получения ответов из данных.
- Предлагается в различных вариантах: как локально, так и в облаке.
- Подключается к облачной базе данных любого типа и к базам данных на основе SQL.
- Предлагает пользователю простую в использовании и удобную функцию перетаскивания элементов при работе с дашбордом.
- Позволяет без ошибок собирать и агрегировать данные из разных источников.
- Предоставляет различные виды визуализаций для выявления тенденций.
- Позволяет передавать созданные дашборды как между сотрудниками организации, так и за её пределы.
Понимание ключевых различий между Apache Superset и Tableau
Теперь, когда вы ознакомились с основами Apache Superset и Tableau, рассмотрим 5 критических факторов, важных для осуществления разумного выбора BI-инструмента, который лучше всего будет соответствовать вашим нуждам:
- Apache Superset в сравнении с Tableau: Поддерживаемые источники данных
- Apache Superset в сравнении с Tableau: Визуализация
- Apache Superset в сравнении с Tableau: Аутентификация и авторизация
- Apache Superset в сравнении с Tableau: Платформа
- Apache Superset в сравнении с Tableau: Цены
1. Apache Superset в сравнении с Tableau: Поддерживаемые источники данных
Для загрузки, очистки и объединения данных перед проведением анализа совместно с Tableau можно использовать продвинутый ETL-инструмент Tableau Prep, который обладает большим количеством функций для проведения ETL-процедуры, среди которых: объединение разрозненных источников, соединение множества источников по маске, агрегация, замена значений. Все шаги преобразований с данными показаны на графической схеме с возможностью просмотреть данные на каждом шаге. В Tableau есть собственные механизмы для очистки и трансформации данных, так что Tableau Prep стоит использовать, если стандартного функционала недостаточно.
Tableau поддерживает широкий спектр источников данных: файлы CSV, JSON, PDF, Microsoft Excel и Access; коннекторы баз данных от компаний, предлагающих SaaS – Amazon Redshift, Google BigQuery, Microsoft Azure, и другие; коннекторы ODBC и JDBC.
Apache Superset поддерживает большое число баз данных:
- Microsoft SQL Server, Amazon Redshift, Big Query, MySQL, Snowflake, Apache Druid, Firebird, MariaDB, SQLite, Oracle, Postgres, Elasticsearch, Vertica, и любые базы данных, которые поддерживают SQLAlchemy.
В сравнении Tableau и Apache Superset по возможностям работы с источниками данных выигрывает Tableau, так как список источников для подключения у данного инструмента более широкий.
2. Apache Superset в сравнении с Tableau: Визуализация
Apache Superset содержит богатый набор стандартных визуализаций и, кроме того, поставляется с SQL Lab (средой SQL разработки), которая позволяет пользователям создавать уникальные запросы к данным и строить визуализации на их основе с помощью SQL-запросов.
В возможности Tableau по работе с визуализациями входят: работа пользователей по принципу drag-and-drop, то есть перетаскиванием визуальных элементов на дашборде мышью; создание иерархий в данных; применение фильтров; и др.
3. Apache Superset в сравнении с Tableau: Аутентификация и авторизация
Безопасность Apache Superset обеспечивается с помощью созданной поверх Flask платформы разработки приложений Flask App Builder (FAB).
К основным обеспечиваемым FAB типам аутентификации относятся:
- LDAP
- OpenID
- Databases
- OAuth
- REMOTE_USER
Tableau же обладает особенностью, которая отсутствует в Apache Superset – обеспечением аутентификации на разных уровнях, например, на уровне проекта или конкретного дашборда. Это означает, что даже если у вас есть доступ к серверу, вы не сможете получить доступ к некоторым функциям, если не прошли аутентификацию.
Основные поддерживаемые Tableau типы аутентификации это:
- Active Directory
- OpenID
- SAML
- OAuth
4. Apache Superset в сравнении с Tableau: Платформа
Tableau работает на разных платформах, таких как:
- Desktop
- Mobile
- Web
- Embedded
Наличие различных вариантов реализации Tableau даёт пользователям большое преимущество – доступ к данным отовсюду в любое время.
В отличие от Tableau Apache Superset может быть развёрнута только на онлайн-сервере или на локальном хостинге. Apache Superset пока не поддерживает мобильные, облачные и встроенные приложения, как это делает Tableau. Конечно, при желании опытные разработчики могут найти способ обойти эту особенность архитектуры и запустить Apache Superset на рабочем столе. Поскольку Apache Superset более новый, чем Tableau, инструмент на рынке BI, скорее всего, в будущем появятся перечисленные варианты реализации, недоступные на данный момент.
5. Apache Superset в сравнении с Tableau: Цены
Ценообразование Tableau зависит от нужных вам аналитических возможностей , и от выбранного организацией варианта развертывания (локально или в облаке). Также есть возможность докупать необходимые вспомогательные лицензии к существующему плану.
Тарифные планы Tableau представлены в таблице.
|
Вариант |
Tableau Creator — Находите инсайты в данных благодаря мощному набору продуктов, поддерживающих ваши сквозные аналитические процессы |
Tableau Explorer — Изучайте проверенные данные и отвечайте на собственные вопросы быстрее с помощью self-service аналитики |
Tableau Viewer — Взаимодействуйте с дашбордами и визуализациями на безопасной и простой в использовании платформе |
Для физ. лиц: |
— |
$70 пользователь/мес | ежегодно |
— |
— |
Для компаний: |
Развернуть на сервере: On-premise или публичное облако |
$70 пользователь/мес | ежегодно |
$35 пользователь/мес | ежегодно |
$12 пользователь/мес | ежегодно |
Онлайн: полностью обслуживаемый Tableu |
$70 пользователь/мес | ежегодно |
$42 пользователь/мес | ежегодно |
$15 пользователь/мес | ежегодно |
Apache Superset в данном случае обладает значительным преимуществом, т.к. его можно использовать совершенно бесплатно! На этом завершим обсуждение сравнения особенностей Apache Superset и Tableau и опишем их недостатки.
Недостатки Apache Superset
- Форматы визуализации: Apache Superset поддерживает максимум 30 форматов визуализации.
- Подключения к источникам данных: Количество источников, к которым подключается Apache Superset не велико.
- Размещение: Apache Superset работает только на онлайн-сервере или на локальном хостинге, но так как она дорабатывается, в ближайшем будущем возможны другие варианты размещения системы.
Недостатки Tableau
- Стоимость: Стоит учитывать, что кроме оплаты пакета, стоимость которого может оказаться неподъёмной для малой организации, придётся оплачивать каждую дополнительную лицензию.
- Сложность программного обеспечения: Несмотря на низкий порог вхождения для пользователей, Tableau обладает большим количеством функций. При дальнейшей работе с инструментом пользователю может понадобиться более глубокий уровень его понимания, а возможно, даже обучение и сертификация.
- Нерегулярность Резервного Копирования: Tableau не выполняет регулярное резервное копирование своего программного обеспечения.
Заключение
При выборе инструмента компании нужно учитывать её масштабы, потребности в визуализации и используемые практики работы. Tableau – отличный выбор, если вам важны безопасность и возможность разграничения прав доступа, при условии, что вы готовы потратить денежные средства на BI. Это также полезный инструмент для компании, которая захочет встраивать аналитику на веб-сайты или порталы и предоставлять доступ к дашбордам отдельным лицам для персональной работы.
Apache Superset подойдёт тем, кто готов самостоятельно разбираться, как её устанавливать, и имеет ресурсы, чтобы её на них разместить. Несмотря на некоторые существующие ограничения, нужно учитывать, что Apache Superset находится на стадии разработки и в дальнейшем они ,возможно, будут устранены. Большие преимущества программы: бесплатность и сообщество, участвующее в её развитии.
Все перечисленные факторы важны, но не стоит забывать, что определяющим фактором при выборе программы должны быть рабочая нагрузка и расширяемость.