Arenadata DB
Arenadata DB (ADB) — аналитическая, распределённая СУБД, построенная на MPP-системе с открытым исходным кодом Greenplum. Она предназначена для хранения и обработки больших объёмов информации — до десятков петабайт. С Arenadata DB вы построите надёжное, масштабируемое корпоративное хранилище данных, которое будет расти вместе с вашими потребностями.
Распределённая СУБД для амбициозных задач
Arenadata DB реализована на кластере из множества (от двух до сотен) серверов и равномерно распределяет нагрузку и данные между ними. Пользователю даже не обязательно знать, сколько именно и каких серверов используется. Достаточно работать с ADB как с обычной не кластерной системой.
Arenadata DB позаботится о вашем бизнесе
ADB прекрасно справляется с задачами построения корпоративного хранилища данных (КХД), аналитики с помощью BI-инструментов, AD-HOC запросов и data science уровня предприятия. По мере роста объёма данных вы просто добавляете новые сервера в кластер — обо всём остальном ADB позаботится сама.
Наиболее эффективные области применения нашей СУБД — это:
- Сложные запросы, обрабатывающие большие объёмы данных, в том числе сложные аналитические функции (включая аналитику поведения пользователей);
- Любые типы отчётности (операционная, управленческая, обязательная регуляторная);
- Глубокий AD-HOC анализ;
- Эффективное соединение больших таблиц;
- Работа систем маркетинговых кампаний и систем лояльности;
- Различный скоринг;
- Предсказательная аналитика (спрос, остатки).
Решаемые задачи с Arenadata DB
- Корпоративные хранилища больших данных
- Классические КХД и хранилища больших данных с обновлением в реальном и околореальном времени.
- Виртуализация и федерация данных, доступ ко всем данным через единое окно с помощью SQL-запросов.
- Разгрузка инженерных систем
- Импортозамещающие ПАК на базе Arenadata DB и Arenadata QuickMarts.
- Возможно добиться снижения сложности эксплуатации озера данных путем миграции с Hadoop на Arenadata DB.
- Прозрачная методика перехода, минимум рисков и сохранение всех преимуществ.
- Аналитика от BI до AI
- Интеграция с любыми BI-системами, cовместимыми с JDBC/ODBC.
- Возможность быстрого развёртывания и сворачивания зон «песочниц» для пилотных проектов и проверки статистических гипотез.
- Работа со всеми аналитическими инструментами.
Ключевые преимущества Arenadata DB
- Совместимость
ADB на 100% совместима со всем ПО, которое работает с PostgreSQL. Ваш любимый BI, средства разработки, ETL — всё это уже поддерживает ADB прямо из коробки. А стандарт SQL ANSI 2008 хорошо знаком огромному числу разработчиков по всему миру. Data Science уровня предприятие
- Data Science уровня предприятие
Для того чтобы использовать возможности Data Science при решении задач вашей компании, мало просто писать хороший код и строить правильные модели. Их необходимо прозрачно и безопасно встроить в процессы загрузки и преобразования данных. ADB даёт вам все необходимые для этого инструменты — библиотека MADLIB позволяет включить расчёт и выполнение моделей прямо в существующий ETL/ELT процесс.
- Мониторинг
Мы знаем, насколько важно полагаться на доступность своих данных 24/7, поэтому включили в пакет с нашей СУБД ПО мониторинга — Graphite и Grafana. В любой момент вы сможете узнать, что происходит с кластером. А благодаря развитой системе алертов получите возможность избежать большинства инцидентов.
- Инфраструктура
Может быть размещена в вашем ЦОДе, на виртуальных машинах, в частных и публичных облаках. Никакого vendor lock-in: нет привязки к вендору или специфическому оборудованию.
- Консистентность
Полное соответствие принципам строгой изоляции транзакции (принципы ACID). Одни и те же таблицы могут быть использованы для записи и чтения, без страха потерять данные.
- Простота управления
Эксплуатация ADB для администраторов не намного сложнее, чем работа с обычной PostgreSQL, а продвинутая консоль управления поможет выполнять текущие задачи быстрей и предсказуемей, а значит, безопасней.
- Интеграция
Для системы обработки данных критична возможность масштабирования не только вычислительных ресурсов, но и каналов загрузки и выгрузки данных. ADB предоставляет набор коннекторов для параллельной загрузки и выгрузки данных из сторонних систем (Kafka, ClickHouse, Hadoop), что существенно упрощает процесс интеграции с источниками данных и аналитическими системами.
Интеграция с внешними источниками данных
Одно из важнейших качеств аналитической СУБД — гибкость и производительность при обмене данными с внешними системами. В ADB реализован протокол параллельного обмена данными со сторонними системами — PXF (Platform eXtension Framework), который обеспечивает взаимодействие с внешней системой одновременно всех сегментов кластера. Если система-источник также представляет собой кластер, то можно использовать кластерное взаимодействие с обеих сторон, что позволяет повысить производительность, причём скорость взаимодействия будет расти по мере расширения кластеров. Поддерживается интеграция с Oracle, Postgres, MS SQL, My SQL, MongoDB, SAP HANA и другими СУБД, а также с решениями другого класса: Hadoop (HDFS, Hive, Hbase), S3.
Данные под надёжной защитой с Arenadata DB
- Безопасность данных
Безопасность в ADB достигается путём шифрования данных и соединений сервер-клиент по протоколу SSL на всех этапах их жизненного цикла. Кроме этого, все внутренние взаимодействия компонентов СУБД ADB (сегменты, зеркала и мастера) также могут быть зашифрованы с помощью протокола SSL, а данные, хранящиеся на дисках кластера, — зашифрованы с помощью ключей PGP (на уровне таблиц, либо колонок в таблицах). Всё это позволяет исключить ситуации нахождения данных в незашифрованном виде.
Разграничения зон видимости данных и прав доступа обеспечивается благодаря ролевой модели доступа (Role Based Access Control, RBAC), позволяющей реализовать гибкие, изменяющиеся динамически в процессе функционирования платформы хранения и обработки данных, правила разграничения доступа. Так, например, можно создать схемы ограничения доступа к таблицам и другим объектам СУБД, а также к строкам и столбцам отдельных таблиц.
- Резервирование
Гибкая система резервирования позволяет установить и настроить кластер с заранее заданным уровнем отказоустойчивости, позволяя СУБД работать даже при выходе из строя половины серверов из кластера. А большой выбор стратегий хранения данных в ADB обеспечивает необходимую производительность на всех этапах жизненного цикла данных — от получения новых онлайн-данных, хранения основных данных с разным уровнем компрессии до экспорта архивных данных в кластер Hadoop.