Данные нужны всем. Одним — «для коллекции» (авось, пригодится). Другим — для качественного управления бизнесом здесь и сейчас. Анализ «Б.О» показывает, что вторых становится больше
Последние лет десять после того, как был озвучен тезис: «Данные — это новая нефть», в бизнес-среде возник вопрос: «Почему одни организации получают деньги из данных, а у других это не получается?» Ведь предприниматели неоднократно использовали информацию для принятия решений в целях управления своими компаниями и развития своего бизнеса. По логике, получаться должно у всех. Но нет…
Секреты мастерства
«Когда данных становится очень много, ими очень сложно управлять. Процесс выбора того, какой именно информацией воспользоваться, как именно данные лучше всего применить, с какой стороны подойти к тому или иному кейсу, а также как всем этим управлять, в этой ситуации становится весьма и весьма непростым делом», — высказал свое мнение в телеграм-канале компании DIS Group ее технический директор Олег Гиацинтов.
Рыночные эксперты на основе анализа множества кейсов считают, что задачу управления данными можно быстро и эффективно решить, сохранив при этом доверие к данным, только изменив сам бизнес, а для этого требуется выстроить процессы монетизации, которые обычно делятся на три составляющие.
Во-первых, внешний по отношению к бизнесу контур по продаже данных или организации их безопасного перемещения между участниками рынка с последующим использованием. Во-вторых, внутренний контур — все, что касается снижения издержек на сбор, хранение и обработку. В-третьих, обеспечение соответствия требованиям регуляторов благодаря предложению собственной экспертизы и консалтинговых услуг.
«Чтобы сделать из данных деньги, необходимо понимать, что представляют из себя ваши данные! Организации необходимо создать непрерывный бизнес-процесс, который даст понимание о расположении данных, их ценности, сути и качестве. Это означает, что должны существовать модель данных, аналитические инструменты для их обработки и методики применения полученных результатов, а также механизмы безопасной корректировки исходной информации на базе непрерывного конвейера обработки информации. Все вместе это называется процессом управления данными (Data Governance), главная задача которого — вовремя обеспечить потребителя качественными и достоверными данными для управления бизнесом и его развития», — добавил эксперт.
Сначала инфраструктура
Внедрение классических инструментов Data Governance в наше время начинается с импортозамещения ряда core-систем: без хранилищ и озер данных, включая высоконагруженные базы данных, дальше двигаться невозможно.
В мае 2024 года большой поток новостей пришел из города на Неве. Осуществленные там проекты можно считать референсными в этой сфере для банков ниже уровня топ-10. Поэтому расскажем о кейсе подробнее.
Банк «Санкт-Петербург» совместно с IT-партнером GlowByte реализовал проект по созданию отказоустойчивого решения для платформы управления данными на стеке Hadoop с помощью инструмента Data Ocean Flex Loader.
Ян Гузов, CDO банка «Санкт-Петербург», отметил: «Платформа управления данными является источником для критичных отчетов, в том числе регуляторных. Платформа отличается повышенными показателями отказоустойчивости и относится к классу business critical, что делает ее уникальной на российском рынке. Для систем такого класса требуется создание резервного контура, что само по себе является трудной задачей в окружении Hadoop “из коробки”».
Помимо этого в рамках развития IT-инфраструктуры осуществлена миграция функционала корпоративного хранилища данных на продукт Arenadata Hadoop (ADH) от российского производителя программного обеспечения Arenadata. «Решение о внедрении новой платформы управления данными одновременно с запуском серии проектов по централизации разрозненных хранилищ на ее базе позволило упростить IT-ландшафт наряду с повышением его эффективности. Также это помогло создать масштабируемое решение для активно модернизируемой IT-архитектуры БСПБ», — отметил старший вице-президент банка «Санкт-Петербург» Александр Рыбаков.
В банке исторически существовало корпоративное хранилище данных, построенное на решениях компании Oracle. На тот момент оно покрывало необходимый объем задач, но команда организации понимала, что платформа достигла максимума своих функциональных возможностей и перестала удовлетворять потребностям бизнес-заказчиков. В дополнение к этому в феврале 2024 года состоялось открытие «Дата-центра № 1». Стратегическим партнером проекта выступил якорный клиент Центра обработки данных, банк «Санкт-Петербург», а ключевым инвестором — оператор IT-решений «ОБИТ».
А вот теперь — настоящий Data Governance
Такая важная часть Data Governance, как Data Quality и Master Data Management, понадобилась банку «Синара», который к июлю 2024-го внедрил решение «Единый клиент» от HFLabs, чтобы следить за достоверностью, полнотой и актуальностью сведений, содержащихся в информационных системах.
«Ошибки в данных приводят, например, к подаче некорректной отчетности регуляторам. Из-за этого организация может получить штрафы. А если из базы не убраны записи-дубли, организация не знает точного количества своих клиентов. С такими проблемами часто сталкиваются банки, независимо от их масштаба», — прокомментировала вопрос Роза Литвинова, руководитель проекта со стороны HFLabs.
В 2024 году ОТП Банк вошел с реализованной концепцией новой мультикомпонентной Data Platform, состоящей из озера данных, реляционного хранилища на базе MPP-архитектуры, ETL-платформы и BI-инструментов. Один из бизнес-эффектов налицо: уменьшено отставание данных в реляционном хранилище от систем-источников с одного дня до двух часов. Помимо этого реализована возможность хранить и обрабатывать любые виды данных, в том числе неструктурированные, а также увеличена глубина хранения данных — до бессрочного для ряда источников.
Еще один проект с доказанным экономическим эффектом завершил к началу 2024 года МКБ, перейдя на отечественное ETL-решение «Плюс7 формИТ», которое обеспечивает оптимальное наполнение корпоративного хранилища данных. Решение позволяет интегрировать данные в разных форматах и из различных источников, включая как внутренние корпоративные, так и внешние системы. Производительность системы позволяет бизнес-пользователям получать данные уже утром следующего дня. Особенно важные данные будут предоставляться с частотой не реже одного раза в час.
Что будет двигать рынком дальше?
Толчок к резкому росту данного сегмента IT дал новый национальный проект «Экономика данных», который по объему инвестиций оценивается в 1,6 трлн рублей до конца 2030 года. Банк России, в свою очередь, в 2023 году опубликовал консультативный доклад, посвященный управлению данными в финансовых организациях. Оба этих документа помимо прочего, дополняя друг друга, формируют ту самую культуру данных в бизнесе, о которой говорилось выше.
Кроме того, дан зеленый свет применению стандартов открытого банкинга и начаты пилотные проекты на базе АФТ с участием ВТБ и Альфа-Банка, а также Сбера и Т-Банка. Участники» «пилота» выстраивают архитектуру системы хранения и передачи данных, чтобы обеспечить 100%-ную защиту данных при информационном обмене. В октябре в тестовом режиме участники фокус-группы смогут получить взаимную информацию о своих дебетовых счетах и картах, а также увидеть истории операций по ним. Все данные между банками передаются в соответствии с разработанным Стандартом информационной безопасности, который предусматривает их криптографическую защиту.