Reksoft Lakehouse

Платформа управления большими данными

Содержание

Платформа Reksoft Lakehouse — интегрированное решение, обеспечивающее сбор данных в потоковом и пакетном режимах, хранение данных, их предварительную обработку и исполнение приложений обработки данных.

Платформа объединяет средства сбора и нормализации данных от различных источников, среду исполнения ML-моделей, алгоритмов предиктивного анализа и оптимизации и средства формирования визуальных витрин данных для использования с целью управленческого анализа или монетизации.

Архитектура Платформы, состав и конфигурация базовых компонентов обеспечивают высокую производительность, отказоустойчивость и масштабируемость.

Концепция платформы
Ценности платформы
Единый центр правды
  • Единый центр правды
  • Интеграционная среда
  • Среда исполнения моделей

Возможности платформы позволяют адресовать следующие организационные вызовы:

  • Высокие издержки на получение консолидированной отчетности и аналитики в следствие отсутствия консолидированных и качественных данных
  • Разрозненный BI предоставляет информацию по различным направлениям деятельности организации, но не дает возможности видеть картину целиком
  • Различный уровень качества данных в разных хранилищах

Философия и архитектура платформы помогают решить задачи:

  • Высоких издержек на обмен корпоративными данными между организационными единицами в следствии разрозненности хранилищ
  • Отсутствия возможности объединения данных, поступающих от оборудования и/или техники с корпоративными данным для их анализа

Исполнительские функции DINO Data OS применяются для оптимизации:

  • Отсутствия среды исполнения приложений обработки данных с использованием ИИ
  • Отсутствия возможности проведения кросс-доменного анализа данных для выявления неочевидных зависимостей между процессами
  • Высоких затрат на создание среды хранения и обработки
Возможности платформы
Единое хранилище данных
Все виды данных в связке «КХД + озеро данных»
Аналитическая отчетность
На основе нормализованных и очищенных данных
Готовая среда разработки и исполнения
Приложений для обработки данных, ML-моделей, их обучения
Единые подходы
К управлению данными и средства управления данными
Доступ к качественным данным
Для всех организационных единиц в соответствии с правами доступа пользователей
Каталог пользователей
Интеграция с корпоративным каталогом пользователей (AD)
Преимущества решения
Унифицированная платформа данных
Представляет собой репозиторий структурированных и неструктурированных данных, устраняя их разрозненность
Обработка в реальном времени и пакетная обработка
Поддерживает обработку в режиме близком к реальному времени для быстрого и оперативного получения информации и пакетную обработку для крупномасштабного анализа и отчетности
Снижение затрат
Содержание отдельных хранилища данных и озера данных может оказаться слишком дорогостоящим. При использовании платформы DINO командам по управлению данными приходится развертывать и управлять только одной платформой данных
Эффективное управление данными
Консолидируются ресурсы и источники данных, обеспечивая больший контроль над безопасностью, метриками, ролевым доступом и другими важными элементами управления
Сокращение дублирования данных
Хранение копии одних и тех же данных в разных системах приводит к несогласованности и недоверию. Платформа DINO предоставляет единый источник данных, который могут использовать сразу все структурные единицы организации
Разделение вычислений и хранения данных
Обеспечивает гибкость развертывания вычислительных сервисов по запросу и их масштабирования
Структура платформы
Принципы построения платформы
Открытость
  • Открытость
  • Масштабируемость
  • Отказоустойчивость
  • Безопасность

Возможность функционального расширения платформы без изменения реализованных технических решений.

  • Подключение новых источников информации
  • Создание новых витрин данных
  • Внедрение новых алгоритмов обработки данных
  • Эволюционное развитие модели данных

Сохранение заданных показателей при увеличении получаемых и обрабатываемых объемов данных.

  • Доказанная производительность
  • Масштабируемое хранилище данных
  • Масштабируемые сервисы обработки данных
  • Возможность работы в распределенном режиме, включая вынос нагрузки в публичное облако

Отсутствие единой точки отказа и концентрации нагрузки.

  • Отказоустойчивая конфигурация всех горизонтально не масштабируемых компонентов
  • Автоматическое обнаружения сбоя и восстановление работы программных компонентов
  • Распределенная обработка данных
  • Возможность выноса нагрузки в публичное облако

Гибкое управление доступом как на уровне доступа к функциям Платформы, так и на уровне доступа к ее ресурсам.

  • Централизованная система управления правами доступа пользователей
  • Интеграция с системами авторизации и аутентификации заказчика
  • Возможность только on-prem инсталляции
  • Проверки уязвимостей всех компонентов
Свяжитесь с нами

Заполните форму обратной связи

Написать нам
Ссылка скопирована в буфер обмена!