Управление данными как ценным бизнес-активом. Опыт ВТБ Лизинг
С начала 2021 года ВТБ Лизинг начал активно вести работу в области управления данными. TAdviser пообщался с Константином Есюниным, главным архитектором ВТБ Лизинг, и узнал, с чего всё началось и что уже сделано в лизинговой компании для развития стратегически важного направления Data Governance.
От «зоопарка систем» к системному управлению данными
За всю историю ВТБ Лизинг, а это почти 20 лет, в компании было внедрено порядка 60 систем, которые работают с данными. Так как они разрабатывались в разное время, автономно на основе различных решений, реализовать бесшовную передачу информации из одной системы в другую оказалось непросто. Массивы данных зачастую конфликтуют, это создает ошибки и приводит к потере тех или иных сведений. Оптимизация управления этим активом - одна из важных задач для ВТБ Лизинг.
Для внедрения единого системного подхода к управлению всеми корпоративными данными необходим концептуальный сдвиг в деятельности ИТ-подразделения в сторону Data Governance. Это означает, что нужна модернизация как технологического уровня обработки данных, так и организационных механизмов. Для решения этой задачи в ВТБ Лизинг был создан комитет по управлению данными, куда вошли как представители ИТ, так и бизнес-подразделений.
Эффективное управление данными – это общая задача для ИТ и бизнеса, - комментирует Константин Есюнин. |
Ключевой момент такого подхода - персональная ответственность за данные: их качество, готовность к обработке и участие в работе информационных систем. В первую очередь, важны актуальность и достоверность сведений. Как рассказал Константин Есюнин, этот круг вопросов решают владельцы и офицеры данных. Как с помощью EvaProject и EvaWiki построить прозрачную бесшовную среду для успешной работы крупного холдинга
Роль владельцев данных (Data owner) выполняют руководители бизнес-подразделений, в которых они создаются, или какой-то корпоративной системы, в которой они обрабатываются. Например, руководитель отдела страхования отвечает за все данные, использующиеся в бизнес-процессах автострахования, а распорядитель CRM одновременно является и владельцем всех данных, находящихся в системе. В свою очередь офицеры данных (Data Officer) решают практические задачи по обеспечению качества сведений. Именно они отвечают за безошибочный ввод информации в систему, отслеживают корректность описаний атрибутов бизнес-сущностей и их размещение в общекорпоративном бизнес-справочнике.
На начальном этапе построения Data Governance, для того чтобы протестировать новые принципы управления корпоративными данными, были выбраны два ключевых для ВТБ Лизинг направления обработки информации: сбор сведений о контрагентах для исполнения требований финансового регулятора Know Your Customer (KYC, «Знай своего клиента»), а также формирование отчетности для Центробанка и материнского банка ВТБ.
Соответствие требованиям регулятора, то есть мероприятия комплаенс, – это отличная площадка для отработки соответствующих ИТ-решений, - рассказывает Константин Есюнин. - Направление KYC выдвигает весьма жесткие требования к управлению качеством данных, их достоверности, полноте, способности к корректной агрегации и формированию результирующих аналитических и отчетных показателей». |
Развитие корпоративных хранилищ данных
Новый подход Data Governance отражается и на принципах работы корпоративного хранилища данных, а кроме того, требует его модернизации.
Дело в том, что ранее созданное на базе технологий Oracle корпоративное хранилище было ориентировано главным образом на задачи финансовой отчетности, - поясняет Константин Есюнин. - А сегодня оно должно обеспечивать бесперебойную работу всех информационных систем компании на всех уровнях – от front- до back-офиса. |
Соответственно, возникает необходимость в создании Data Lake – озера исходных данных, где хранятся корректные сведения, полностью готовые для преобразования и загрузки в различные OLAP-кубы и витрины хранилища для последующего использования в BI-отчетах.
Например, маркетологи могут использовать их для оценки спроса на новые продукты, верификаторы и андеррайтеры – для скоринга потенциального клиента, руководители бизнеса - для анализа бизнес-показателей и их прогнозирования, - рассказывает Константин Есюнин. |
На переходном этапе к новой модели управления данными в компании одновременно работают два хранилища: одно поддерживает традиционные задачи бизнес-аналитики и финансовой отчетности, второе реализует идею Data Lake. Причем создание полноценного озера данных – задача, которая решается постепенно. Последовательно создаются отдельные слои корпоративного хранилища: сырые данные, процессы обработки сырых данных и т.д.
В настоящий момент, рассказывает Константин Есюнин, формируется «цифровой фундамент» - базовый слой исходных данных.
Это требует тщательной отладки работы с источниками, - подчеркивает он. |
Сегодня в работе информационных систем ВТБ Лизинг используется 28 источников данных. В первую очередь, это сведения из CRM и других бизнес-систем. Далее постепенно будут добавлять новые источники, например, Федресурс (Единый федеральный реестр сведений о фактах деятельности юридических лиц), сервис аналитики рекламы и отслеживания соответствующих звонков CallTouch и другие.
Кроме того, ВТБ Лизинг планирует на базе корректных исходных данных Data Lake модернизировать поддержку мастер-данных корпоративной MDM-системы (Master Data Management).
Конечно, амбициозные задачи технологической модернизации корпоративного хранилища данных требуют обновления и расширения штата сотрудников. В добавление к традиционным специалистам в области СУБД Oracle, компании нужны сотрудники с опытом работы с СУБД Postgres, а также профессиональные дата-сайентисты – люди, умеющие создавать модели данных и процессов и анализировать их.
ВТБ Лизинг планирует активно развивать направление моделирования данных. Например, большой потенциал компания видит в области машинного обучения, в том числе, для оперативной и эффективной поддержки бизнес-решений. Ресурсы для технологического рывка создаются уже сегодня – мощный слой актуальных и достоверных данных, детально описывающих все аспекты бизнес-процессов компании, и гибкие технологии обработки в соответствии с меняющимися задачами и целями бизнеса.
Так обычные данные превращаются в цифровой актив организации. Они полностью готовы к использованию в нужных бизнес-процессах, а значит, становятся ценностью для бизнеса, - подчеркивает Константин Есюнин. |