Luxms BI - Интеграция и импорт данных
Методы работы с источниками данных
- Онлайн запросы в источник данных, в том числе для получения первичных данных из учётных систем. (Table Lookup)
- Онлайн запросы в источник данных для выборки значений метрик «на лету»
- Массивно-параллельные запросы на источнике
- Подключение к интерфейсным таблицам
- Импорт/прямая загрузка через программный коннектор
- Ручная и автоматическая загрузка Excel файлов
Импорт данных
- Нативная поддержка стека Arenadata Platform: AD.QM (Arenadata QuickMarts) в качестве слоя горячих данных, AD.B (Arenadata DB) в качестве слоя теплых данных и AD.H (Arenadata Hadoop) в качестве слоя холодных данных. Поставка Luxms BI возможна в редакции Luxms BI Arenadata Platform Edition с гарантиями совместимости всего стека и поддержкой оркестратора/инструментария развертывания AD.CM (Arenadata Cluster Manager);
- Внешние источники, доступные по JDBC;
- Хранилища: Teradata DWH и MPP хранилища данных: Greenplum, Teradata, Oracle Exadata;
- Системы бухгалтерского учёта (ПАРУС, 1С). 1С — посредством партнерского коннектора к объектной модели;
- Файлы: txt, csv, xls/xlsx, xml, json, html;
- Очереди сообщений: Kafka, Redis, RabbitMQ;
- Протоколы низкого уровня: websocket, mqtt, tcp, udp;
- REST API, SOAP;
- Специализированные системы мониторинга и учёта;
- Неструктурированные источники, архивы документов;
- Системы, работающие по протоколам (MQTT, Syslog, SNMP);
- «Живая» стыковка с графовой базой AgensGraph с использованием интегрированного языка запросов SQL+Cypher;
- Интеграция с системой FICO Score;
- Нативный коннектор к утилите RVTools для мониторинга мощностей в кластере VMware;
- Коннекторы к сервисам веб-аналитики и рекламным кабинетам Яндекс и Google.
Данные из информационных источников могут быть получены с помощью специализированных адаптеров или же при подключении по JDBC к интерфейсным таблицам заказчика.
Адаптеры получают разнородные данные из внешних источников, нормализуют их и передают в подсистему обработки первичных данных. После обработки данные сохраняются во внутреннем формате Luxms BI и оптимизируются для визуализации. Luxms BI содержит широкий ряд коннекторов для импорта данных. При этом, в процессе внедрения могут быть разработаны и переданы Заказчику специально разработанные коннекторы для доступа к специфическим источникам данных.
При схеме, когда выполнение аналитических запросов происходит на стороне хранилища, Luxms BI только отображает результаты этих запросов на панелях и графиках. В этом случае данные в отчётах Luxms BI всегда правильные, нет проблемы кэширования, нет необходимости регулярной верификации данных.
Luxms BI не накладывает никаких ограничений на визуализацию значений метрик, полученных с помощью онлайн запросов. Их можно использовать во всех типах визуализации вместе с метриками, значения которых хранятся в базе данных Luxms BI.
Luxms BI может работать в режиме кэширования «медленных» (редко меняющихся) данных, когда это оправдано, например, даёт выигрыш в скорости отображения. Для кэширования данных и увеличения скорости работы в поставку может быть включён модуль кэширования данных на базе Dremio или ClickHouse.
В случае использования СУБД Greenplum для хранения больших данных есть возможность запуска алгоритмов обработки данных на различных языках программирования в MPP режиме с помощью Docker контейнеров. Для этого требуется СУБД Greenplum версии 6 и выше и расширение PL/Container.
Этапы загрузки данных из различных источников и расчет агрегатов в необходимой последовательности группируются в задачи загрузки, которые можно менять при необходимости. Имеется возможность настройки загрузки данных по расписанию.
Возможна загрузка данных блоками (например, как результат выполнения SQL запроса), так и в потоковом режиме с помощью очередей сообщений. Потоковый режим способен работать в конфигурациях High-Load с высокой интенсивностью потоков данных (выдерживает реальные нагрузки до 7000 событий в секунду). Пакетный режим способен работать с Big Data источниками.