Заказчики: Счетная Палата РФ Москва; Государственные и социальные структуры Подрядчики: Мегапьютер Интелидженс (Megaputer Intelligence) Продукт: PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстовДата проекта: 2022/02 — 2022/09
|
Технология: Data Mining
Технология: Речевые технологии
|
Многие организации располагают значительным объемом данных, не используемых для принятия управленческих и бизнес-решений. Как правило, это объясняется отсутствием у компаний или государственных структур инструмента для всестороннего анализа и обработки таких данных.
Благодаря применению российской аналитической платформы PolyAnalyst, сотрудникам Счетной палаты Российской Федерации удалось значительно увеличить объем и глубину обработки данных, которые используются при экспертно-аналитических мероприятиях. Также появилась возможность автоматически обрабатывать новые виды данных - неструктурированные текстовые документы, которые составляют существенную долю информации, поступающей в Счетную палату. Кроме того, применение методов Data Science, входящих в функциональность PolyAnalyst, повысило точность анализа. Одновременно с ростом качества результатов существенно сократились затраты времени и труда на проведение аналитических процедур.
Внедрение PolyAnalyst в Счетной палате РФ проведено компанией Мегапьютер Интеллидженс. В информационном контуре государственного заказчика был развернут программно-вычислительный сервер, к которому обеспечен доступ для нескольких десятков рабочих мест — так называемых «аналитических клиентов».
Одновременно с внедрением платформы специалисты Мегапьютер совместно с Департаментом цифровой трансформации Счетной палаты разработали и ведут для сотрудников ведомства учебный курс по работе с системой PolyAnalyst.
В Счетной палате в течение последних трех лет реализуется стратегический проект Департамента цифровой трансформации — программа цифрового развития сотрудников Счетной палаты. Учебный курс по PolyAnalys, ставший частью этой программы, состоит из следующих четырех блоков:
- Методы обработки структурированных данных и предиктивной аналитики;
- Методы анализа текстовых данных на естественном языке;
- Визуализация данных и построение аналитических веб-отчетов;
- Настройка и администрирование платформы.
Слушатели курса не только обучились работе с PolyAnalyst, но и приобрели практические навыки анализа больших объемов структурированных числовых и неструктурированных текстовых данных. Интуитивный графический low-code-интерфейс PolyAnalyst позволил сотрудникам государственного ведомства самостоятельно, не привлекая профессиональных программистов разрабатывать аналитические решения с применением алгоритмов интеллектуальной обработки данных и естественного языка, организовывать коллективную работу над проектами, готовить графические интерактивные отчеты и другую отчетность для руководства Счетной палаты.Как DevOps-сервис помогает «разгрузить» высоконагруженные системы BPMSoft
Процесс внедрения преследовал следующие цели:
- Сократить время сбора данных из множества разнообразных распределенных источников;
- Упростить процедуру унификации форматов представления данных;
- Устранить необходимость привлечения дополнительных специалистов для предварительной подготовки и очистки больших объемов данных;
- Снизить количество ошибок в результатах анализа;
- Сократить затраты на интеграцию и поддержку множества разнородных информационных систем для проведения этапов загрузки, предобработки и анализа;
- Повысить точность и глубину анализа данных.
В течение двух лет после внедрения платформы сотрудники Счетной палаты собственными силами решили более сотни аналитических задач. Среди них — аудит отчетов о реализации национальных проектов; анализ нормативных правовых актов (НПА) на предмет их соответствия текущим целям развития на федеральном и региональном уровне; обработка обращений граждан в общественную приемную; анализ результатов опросов, проводимых Счетной Палатой, и многие другие. Опытом применения PolyAnalyst поделился Михаил Петров, директор Департамента цифровой трансформации Счетной палаты Российской Федерации:
Одним из наиболее показательных является проект по автоматизации выявления утративших силу нормативных правовых актов (НПА). В PolyAnalyst были загружены реестры расходных обязательств органов государственной власти Российской Федерации, представляющие из себя таблицы с более чем десятью тысячами строк. Реестры содержат ссылки на НПА, являющиеся основанием для принятия расходных обязательств. Также в PolyAnalyst был импортирован неструктурированный текстовый перечень всех 95 000 утративших силу российских НПА. Далее инспекторы Счетной палаты, используя алгоритмы обработки естественного языка, извлекли и сравнили атрибуты НПА из перечня актов, утративших силу, и реестра расходных обязательств. Найденные совпадения, то есть фактические процедурные нарушения, затем отразили в разработанном специально для этого проекта графическом отчете. У инспектора Счетной палаты данная работа заняла 3 часа, вместо 20 человеко-дней. Другой проект, демонстрирующий эффективность применения дата-аналитики в аудите, — автоматизированный анализ банковских гарантий по госконтрактам. При помощи PolyAnalyst инспекторы Счетной палаты выгрузили из нескольких источников перекрестные данные по банковским гарантиям для 150 подведомственных учреждений Минприроды России, а затем подвергли эти данные глубокому алгоритмическому анализу. В результате обнаружено финансовых нарушений на 56 млн руб,. а рисков — на 300 млн руб. И это только по одному подконтрольному ведомству. А ведь подобные решения можно масштабировать на множество других направлений аудита Счетной палаты, и тогда экономический эффект будет исчисляться миллиардами. |
Результаты внедрения:
- Наличие широкого набора коннекторов в PolyAnalyst позволило с высокой скоростью осуществлять сбор данных для анализа из большинства имеющихся в организации информационных систем;
- «Всеядность» системы обеспечила работу с данными, хранимыми и передаваемыми во всех традиционных форматах, без конвертации;
- Возможность одновременной обработки, очистки и структурирования десятков тысяч документов самим владельцем данных исключила необходимость привлечения профессиональных программистов, что сократило затраты, ускорило процесс и снизило количество ошибок;
- Сокращение ручного труда при анализе и значительный рост объема выборки привели к повышению точности и репрезентативности результатов;
- Сокращение издержек стало возможно благодаря тому, что загрузку, подготовку, анализ данных и разработку итоговых интерактивных отчетов и другие работы теперь можно проводить в одной системе - на платформе PolyAnalyst.
За время работы системы реализовано уже более 120 кейсов, аналогичных описанным выше. Это позволяет экономить сотни человеко-часов на обработку данных, на порядки увеличивая их объем и повышая удобство и качество анализа.
К настоящему моменту Мегапьютер провел обучение более 200 сотрудников Счетной палаты и завершил третий учебный этап. В результате сотрудники государственного органа овладели навыками и получили инструмент для применения интеллектуальных алгоритмов к своим данным для эффективного решения аналитических задач.