DIS Group: Селена Lakehouse-платформа

Продукт
Разработчики: DIS Group - ДИС Групп - Дата Интегрейшн Софтвер - Data Integration Software
Дата премьеры системы: 2025/07/07
Технологии: Big Data,  Data Mining

Основные статьи:

2025: Представление платформы «Селена»

Компания DIS Group 7 июля 2025 года представила платформу данных Селена — российское решение класса Data Lakehouse, предназначенное для высокоскоростной обработки и анализа больших объемов структурированных и неструктурированных данных. Платформа позволяет обрабатывать запросы в 10 раз быстрее аналогов благодаря использованию векторных вычислений и MPP-архитектуры.

Платформа Селена сочетает в себе преимущества традиционных [[хранилище данных|хранилищ данных]] и Data Lakehouse, обеспечивая большую скорость аналитической обработки информации. Благодаря использованию технологий векторных вычислений и массово-параллельной архитектуры (MPP), система демонстрирует десятикратное превосходство в скорости выполнения запросов по сравнению с аналогичными предложениями на рынке.TAdviser Security 100: Крупнейшие ИБ-компании в России + 100 претендентов 124.1 т

Платформа предназначена для обработки как небольших, так и экстремально больших объемов информации, включая хранение и анализ информации свыше 100 петабайт. Архитектурное решение позволяет развертывать систему как в облачной инфраструктуре, так и в рамках локальных дата-центров, что обеспечивает гибкость при внедрении в различных отраслях.

Особое внимание разработчики уделили совместимости с современными стандартами хранения данных. Платформа поддерживает работу с любыми объектными хранилищами, совместимыми с S3-протоколом, включая популярные решения MinIO и Ceph, а также отечественную платформу «Закрома». Наряду с этим сохраняется возможность интеграции с распределенной файловой системой HDFS, что позволяет использовать Селену в уже существующих Hadoop-инфраструктурах.

В основе платформы лежит высокопроизводительный движок StarRocks, который обеспечивает стабильную работу даже при экстремальных нагрузках. Система демонстрирует особую эффективность при выполнении сложных аналитических запросов в условиях высокой конкуренции за вычислительные ресурсы. Это делает решение особенно востребованным в таких сферах, как финансовая аналитика, промышленный интернет вещей (IIoT), телекоммуникации и государственный сектор.

Для обеспечения максимальной скорости доступа к данным в Селене реализована комбинация технологий обработки информации. Колоночная организация хранения данных в сочетании с многоуровневой системой кэширования (включая кэширование запросов, промежуточных результатов и готовых отчетов) позволяет минимизировать время отклика системы. Дополнительное ускорение достигается за счет использования cost-based оптимизатора запросов, материализованных представлений и специализированных агрегационных таблиц.

Интеграция искусственного интеллекта посредством реализации MCP-сервера позволяет пользователям формулировать запросы к базе данных на естественном языке, автоматизировать создание блокнотов и взаимодействовать с хранилищем в формате чата.

Селена совместима с популярными BI-инструментами и аналитическими платформами. В 2025 году планируется начать процесс сертификации платформы в ФСТЭК России, что откроет новые возможности для внедрения решения в государственных структурах и организациях с повышенными требованиями к информационной безопасности.

Разработчиком одноименной платформы является российская компания «Платформа данных Селена», созданная в 2024
году. Мастер-дистрибьютором продукта Селена является компания DIS Group.

«
Современный рынок больших данных требует решений, способных обеспечивать аналитику в реальном времени на постоянно растущих объемах информации. Селена создавалась именно как ответ на этот вызов. Мы не просто увеличили скорость обработки данных, но и обеспечили необходимую гибкость развертывания, что особенно важно для крупных предприятий с распределенной инфраструктурой,
сказал Дмитрий Замула, технический директор Селена.
»

«

Data Lakehouse — логичное развитие Data Lake и традиционных хранилищ: с одной стороны, сохраняется способность обрабатывать большие объемы разнородных данных, с другой — добавляется высокая скорость, благодаря улучшенной работе с метаданными и индексацией. Это кардинально повышает эффективность работы аналитиков и дата-сайентистов. Интеграция искусственного интеллекта в Data Lakehouse обеспечивает удобный доступ к данным и возможность взаимодействия с ними на естественном языке. Все это сделает Data Lakehouse стандартом для аналитики в ближайшем будущем. На российском рынке практически нет решений по контролю качества данных, способных полноценно работать с Lakehouse. DIS Group и Селена — среди первых, кто решает эту проблему,

отметил Олег Гиацинтов, технический директор DIS Group.
»



Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Loginom Company (Аналитические технологии) (128)
  БизнесАвтоматика НПЦ (123)
  Инфосистемы Джет (13)
  Сбербанк (12)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (11)
  Другие (763)

  БизнесАвтоматика НПЦ (4)
  Полиматика (Polymatica) (2)
  Группа компаний ЦРТ (Центр речевых технологий) (2)
  Axenix (ранее Аксенчер Россия) Аксеникс (2)
  Сбер Бизнес Софт (2)
  Другие (60)

  БизнесАвтоматика НПЦ (6)
  SL Soft (СЛ Софт) (3)
  Сбер Бизнес Софт (3)
  Наносемантика (Nanosemantics Lab) (2)
  Полиматика (Polymatica) (2)
  Другие (67)

  БизнесАвтоматика НПЦ (7)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (4)
  Ростелеком (3)
  Loginom Company (Аналитические технологии) (3)
  Цифровые технологии и платформы (ЦТиП) (3)
  Другие (95)

  Napoleon IT (Наполеон Айти) (1)
  Группа компаний ЦРТ (Центр речевых технологий) (1)
  Ростелеком Центр (ЦентрТелеком) Макрорегиональный филиал (1)
  Т1 (1)
  Другие (4)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Loginom Company (Аналитические технологии) (2, 240)
  БизнесАвтоматика НПЦ (2, 122)
  SL Soft (СЛ Софт) (4, 15)
  Полиматика (Polymatica) (4, 15)
  Oracle (12, 14)
  Другие (414, 209)

  БизнесАвтоматика НПЦ (1, 4)
  Сбербанк (3, 3)
  Sitronics KT, Ситроникс КТ (ранее Кронштадт Технологии) (2, 2)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 2)
  SL Soft (СЛ Софт) (1, 2)
  Другие (17, 20)

  БизнесАвтоматика НПЦ (1, 5)
  Полиматика (Polymatica) (3, 4)
  SL Soft (СЛ Софт) (3, 4)
  Rubbles (Раблз) (1, 2)
  Retail Rocket (Ритейл Рокет) (1, 2)
  Другие (16, 16)

  БизнесАвтоматика НПЦ (1, 7)
  Loginom Company (Аналитические технологии) (1, 4)
  Гринсайт (Greensight) (1, 1)
  К2 НейроТех (1, 1)
  Медицинские скрининг системы (Цельс) (1, 1)
  Другие (13, 13)

  Группа компаний ЦРТ (Центр речевых технологий) (1, 1)
  Другие (0, 0)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Deductor - 226
  Visary BI Платформа бизнес-аналитики - 122
  Loginom - 14
  Polymatica Analytics Аналитическая платформа - 13
  IBM SPSS Decision Management - 10
  Другие 193

  Visary BI Платформа бизнес-аналитики - 4
  Polymatica Analytics Аналитическая платформа - 2
  ЦРТ: Speech Analytics Lab - 2
  PIX Process Management (PIX Процессы) - 2
  CM.Expert Data Mining платформа - 2
  Другие 16

  Visary BI Платформа бизнес-аналитики - 5
  Retail Rocket: Smart Placement Ads - 2
  Rubbles Customer Insight - 2
  Polymatica Analytics Аналитическая платформа - 2
  Сфера. Интеллектуальный анализ процессов - 1
  Другие 10

  Visary BI Платформа бизнес-аналитики - 7
  Loginom - 4
  Celsus (Цельс) Нейросеть для анализа медицинских изображений - 1
  Ростелеком: Цифровая платформа для мониторинга отрасли гостеприимства - 1
  ITMan Discovery - 1
  Другие 12

  ЦРТ: SpeechXplore ИИ-решение для исследования и развития коммуникаций с клиентами - 1
  Другие 0

Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  БизнесАвтоматика НПЦ (123)
  Большая Тройка (46)
  Сбербанк (16)
  Умная Логистика (14)
  Доверенная среда (13)
  Другие (611)

  БизнесАвтоматика НПЦ (4)
  РИР (Росатом Инфраструктурные решения) (3)
  Marketing Logic (Маркетинг Лоджик) (2)
  Инфосистемы Джет (2)
  Яндекс.Облако (Yandex Cloud) (2)
  Другие (60)

  БизнесАвтоматика НПЦ (6)
  Сбер Бизнес Софт (3)
  Сбербанк (2)
  Синимекс (Cinimex) (2)
  Arenadata (Аренадата Софтвер) (2)
  Другие (75)

  БизнесАвтоматика НПЦ (7)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (6)
  Цифровые технологии и платформы (ЦТиП) (3)
  Ростелеком (3)
  Luxms (2)
  Другие (94)

  Napoleon IT (Наполеон Айти) (1)
  Ростелеком Центр (ЦентрТелеком) Макрорегиональный филиал (1)
  Т1 (1)
  Триафлай (1)
  Другие (4)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  БизнесАвтоматика НПЦ (3, 122)
  Большая Тройка (2, 46)
  Умная Логистика (2, 14)
  Триафлай (1, 14)
  Цифра (2, 12)
  Другие (322, 168)

  РИР (Росатом Инфраструктурные решения) (3, 4)
  БизнесАвтоматика НПЦ (1, 4)
  Сбербанк (2, 2)
  DataCatalog (ДатаКаталог) (1, 2)
  Цифра (1, 2)
  Другие (17, 18)

  БизнесАвтоматика НПЦ (1, 5)
  Сбербанк (3, 3)
  DataCatalog (ДатаКаталог) (1, 3)
  Luxms (1, 3)
  TData (ТДата) (1, 2)
  Другие (19, 22)

  БизнесАвтоматика НПЦ (1, 7)
  РИР (Росатом Инфраструктурные решения) (2, 2)
  Data Sapience (Дата Сапиенс) (1, 2)
  Цифра (1, 2)
  DataCatalog (ДатаКаталог) (1, 2)
  Другие (11, 12)

  Триафлай (1, 1)
  Другие (0, 0)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Visary BI Платформа бизнес-аналитики - 122
  Большая Тройка: АИС Редактор территориальных схем - 39
  Триафлай BI-платформа - 14
  ZIIoT Платформа для работы с промышленными данными - 12
  Luxms BI - 11
  Другие 161

  Visary BI Платформа бизнес-аналитики - 4
  Arenadata Catalog - 2
  Росатом Цифровое теплоснабжение - 2
  ZIIoT Платформа для работы с промышленными данными - 2
  CM.Expert Data Mining платформа - 2
  Другие 17

  Visary BI Платформа бизнес-аналитики - 5
  Arenadata Catalog - 3
  Luxms BI - 3
  Retail Rocket: Smart Placement Ads - 2
  ZIIoT Платформа для работы с промышленными данными - 2
  Другие 16

  Visary BI Платформа бизнес-аналитики - 7
  Luxms BI - 2
  Arenadata Catalog - 2
  Data Ocean Nova Платформа данных - 2
  ZIIoT Платформа для работы с промышленными данными - 2
  Другие 11

  Триафлай BI-платформа - 1
  Другие 0