2022/08/06 16:46:01

Куда катится мир практических реализаций ИИ?

Статья входит в обзор TAdviser "Технологии искусственного интеллекта"

Содержание

Когнитивный прорыв
Фундаментальные амбиции нейронных сетей
Наброски будущих метавселенных
Другие материалы обзора
Другие материалы по теме ИИ

Мы видим, что мир практических внедрений ИИ-продуктов за счет мощного развития технологий шагнул далеко вперед от специализированных решений, реализующих отдельные деловые операции, на уровень сложных комплексных систем поддержки принятия решений в непростых бизнес-процессах. Соответственно меняются технологии ИИ, применяемые для решения бизнес-задач с помощью ИТ. Они развиваются в сторону гибридных моделей.

Например, система оценки заемщика, которая реализована в «Хоум Кредит Банке», использует предиктивное моделирование, каузальное моделирование (что предполагает некоторое воздействие на клиента), обучение с подкреплением и алгоритмы линейного дискретного программирования. Кроме того, используются эвристики в области ценообразования и лимитной политики. Такой подход, как рассказывает Сергей Герасимов, начальник отдела исследований и инноваций «Хоум Кредит Банка», дает возможность автоматизировать процесс оценки таким образом, чтобы добиться еще и максимальной прибыльности.

Источник: Хоум Кредит Банк, сентябрь, 2021 г.

В целом, результирующая модель становится результатом работы других моделей, причем, реализуется сложный вариант оптимизации на основе агрегированных (глобальных) показателей по всем клиентам. По сути, решается задача линейного дискретного программирования, замечает Сергей Герасимов.

Артем Гришковский, коммерческий директор компании «Доверенная среда», разработчика BI-платформы «Триафлай», также говорит о том, что на практике компании используют на разных участках бизнеса модели различных типов: имитационные, эконометрические («что нужно для», «что будет, если»), прогнозные, оптимизационные. Соответственно, возникает необходимость в средах, в которых эти модели можно настраивать и использовать. Так, платформа «Триафлай» содержит собственную среду настройки эконометрических моделей, ориентированную, главным образом, на создание вычисляемых показателей. А для того чтобы обеспечить компании возможность использования библиотеки прогнозных, оптимизационных многофакторных моделей «Триафлай» интегрирована с Jupyter Notebook, а для создания имитационных моделей – с ПО AnyLogic.TAdviser выпустил Гид по российским операционным системам 10.3 т

Что в ближайшем будущем можно ожидать в области практического использования механизмов ИИ?

Дмитрий Николаев, к.ф.-м.н., технический директор Smart Engines, говорит о беспилотном транспорте:

Механизмы компьютерного зрения показывают вполне убедительные результаты, много беспилотных такси в тестовом режиме уже курсирует в Москве. Но для чтобы убедиться, что эта технология уже действительно вошла в нашу повседневную жизнь, нужно перевезти не менее 10 тыс. первых пассажиров, должны, к сожалению, произойти первые аварии. Наверняка эта технология все еще нуждается в большем техническом совершенствовании.

А вот здравоохранению предстоит пройти путь превращения множества разрозненных ИИ-решений в «интеллектуальное покрытие» медицинских услуг, предоставляемых населению. «Объемы необходимой медицинской диагностики в современном мире - гигантские, и только продолжают расти, а докторов катастрофически не хватает, поэтому здесь мы видим огромные перспективы для автоматизации,- говорит Дмитрий Николаев. Smart Engines, в частности, предоставляет ПО для томографии. Алгоритмы ИИ для трехмерной томографической реконструкции имеет очень большое будущее, считают специалисты компании.

Решение компании «Наносемантика» помогает врачу ставить диагноз по снимкам МРТ. Технологии компании на базе ML выполняют сегментацию всех частей тела и определяют их контуры (например, для спины это могут быть позвонки, спинные диски, спинной канал и т.д.). Далее выполняются точные математические вычисления (площади внутри контуров, кратчайшие расстояния между точками), по которым ставится точный диагноз.

В начале июня Анастасия Ракова, заместитель мэра Москвы по вопросам социального развития, объявила, что в столице создана уникальная цифровая библиотека обезличенных наборов данных для оценки и обучения нейросетей. Разработчики сервисов ИИ получат доступ к девяти датасетам обезличенных рентгенологических снимков, которые необходимы для тестирования и дообучения искусственного интеллекта. При этом самый большой открытый датасет состоит из более чем тысячи уникальных исследований пациентов с признаками COVID-19. Качественные данные для обучения медицинских сервисов становятся доступнее разработчикам.

Появление технологий и методологий, ведущих к демократизации использования ИИ для разных задач, значит, их дальнейшему распространению, представляется перспективным направлением развития ИИ Александру Хледеневу, директору по цифровым решениям компании «ВС Лаб». В их числе, например, направление AutoML, которое позволяет упростить и автоматизировать процесс разработки, внедрения и управления машинно-обучаемых моделей.

Продукты и компоненты данного направления дают возможность снизить требования к специалистам, ведущим разработку моделей, произвести автоматизированный фичеринг и подобрать наиболее подходящие алгоритмы для обучения. Все это должно удешевить и ускорить анализ данных с использованием ИИ,- считает Александр Хледенев.

Он отмечает также в числе перспективных направлений MLOps.

Оно состоит из методологии и инструментария, позволяющих стандартизировать и упростить разработку, деплоймент, мониторинг и управление машинными моделями. Бизнесу это даст повышение безопасности и непрерывности ИТ-процессов, а разработчикам – фреймворк для непрерывной оптимизации результатов в согласовании с его задачами,- уверен эксперт.

Кроме того, распространение и дальнейшее включение ИИ-сервисов в орбиту облачных продуктов в перспективе приведет к снижению капитальных затрат на решение более стандартизированных задач.

Сегодня уже доступны, например, сервисы по распознаванию изображений, синтезированию речи, автоматизированной подготовки и аугументированию данных и созданию моделей. Следует ожидать развития игроков с более специализированными решениями для бизнесов и отраслей,- полгалает Александр Хледенев.

Аналитики компании Statista прогнозируют активное продвижение платформ с открытым кодом, что делает возможным совместное обучение. Начало этому тренду положила в 2015 г. компания Google, выпустившая фреймворк TensorFlow с открытым исходным кодом для обучения ИИ моделей с использованием потоковых графов. Далее последовала платформа DeepMind Lab, созданная для экспериментов с универсальными системами ИИ, которые могут решать сложные задачи без предварительного обучения тому, как именно решать эту задачу. Библиотека Theano может обеспечить модели ИИ высокой точности вычислительных операций с большими массивами данных. Caffee –фреймворк, который способен обработать более 60 млн. изображений за один день, используя всего одну видеокарту NVIDIA K4010. Torch вычислительная среда с открытым исходным кодом для алгоритмов машинного обучения, которая предлагает графический процессор для числовой оптимизации и линейной алгебры. Deeplearning4j библиотека глубокого обучения с открытым исходным кодом для Java (JVM). MLlib инструмент машинного обучения, который включает в себя различные алгоритмы машинного обучения для классификации, регрессии, деревьев решений, рекомендаций, кластеризации, тематического моделирования и пр.

Игорь Пивоваров, главный аналитик Центра искусственного интеллекта МФТИ, говорит, что в нынешнем году может начаться производство российского процессора для инференса (работы нейронной сети на конечном устройстве), разработанного компанией IVA Technologies (ИВКС). Это будет реальным прорывом в сфере аппаратного обеспечения российского искусственного интеллекта.

Когнитивный прорыв

В числе прорывных технологий последнего времени стоит упомянуть о совместной разработке российских ученых из Институт Искусственного Интеллекта (AIRI) и МФТИ. В мае они объявили о создании биологически правдоподобной модели памяти для систем ИИ с внутренней мотивацией. Соответствущая статья опубликована в научном журнале Brain Informatics.

Разработанный коллективом когнитивный агент — это программа, которая учится самостоятельно взаимодействовать с миром и обучаться на своих ошибках, выполняя конкретную задачу. Основой агента служит структура алгоритмов, в том числе, нейросетевых, которая помогает ему выполнять инструкции разработчика. Из всего многообразия искусственных нейронных сетей исследователи выбрали спайковые нейронные сети (Spiking Neural Networks, SNN), построенные на основе модели спайкового (пирамидального) нейрона, обучается быстрее, чем традиционный искусственный нейрон.

Спайковые нейросети, как рассказывают разработчики, задействуют только активные в конкретный момент времени нейроны, что обеспечивает значительную экономию ресурсов при их обучении и практическом использовании.

Когнитивные возможности разработанного когнитивного агента предполагают возможность оперирования абстракциями состояний и действий. Это значит, что этот агент способен совершать сложные действия на базе уже известных ему простых операций, рассказывают ученые. Причем, помимо внешней мотивации (награды за успешно совершенное действие), у него имеется внутренняя мотивация, которая обеспечивает осмысленное поведение агента в отсутствие внешнего подкрепляющего сигнала. Ученые говорят, что такой агент сможет не только искать решение задачи, как большинство стандартных программ, но и изучать мир вокруг себя.

Фундаментальные амбиции нейронных сетей

В последние годы искусственные нейронные сети стремятся к гигантизму: модель GPT-3 (третье поколение алгоритма обработки естественного языка компании OpenAI), а затем модель визуальных трансформеров DALL-E, которая генерирует изображения по описанию, используют миллионы и миллиарды признаков. Некоторые специалисты полагают, что наступает новая эра Machine Learning. «Манифестом» этого направления стала статья «On the Opportunities and Risks of Foundation Models», подготовленная большим коллективом ученых, работающих в центре исследований фундаментальных моделей (Center for Research on Foundation Models, CRFM) Стэнфордского университета (Human-Centered Artificial Intelligence университета).

ИИ переживает смену парадигмы с ростом интереса к моделям (например, BERT, DALL-E, GPT-3), которые тренируются на основе широких данных, способных масштабироваться и адаптироваться к широкому спектру различных задач. Ограниченный набор таких громадных моделей, основанных на стандартном глубоком обучении и передаче знаний, исследователи назвали фундаментальными моделями (Foundation Model). Они предположили, что эти модели станут элементами «суперархитектуры» ИИ, на базе которой будут работать разнообразные прикладные продукты, использующие ML для решения своих задач.

Эволюция машинного обучения

Источник: On the Opportunities and Risks of Foundation Models. Center for Research on Foundation Models (CRFM) Stanford Institute for Human-Centered Artificial Intelligence (HAI) Stanford University, август, 2021 г.

Данное представление базируется на следующей представлении: при реализации глубокого обучения появляются высокоуровневые функции, используемые для прогнозирования, а с фундаментальными моделями появляются такие передовые функциональные возможности, как, например, контекстное обучение. Так, машинное обучение гомогенизирует (то есть снижает степень неоднородности) алгоритмов обучения нейронных сетей. Пример - логистическая регрессия, то есть контролируемый алгоритм классификации обучения, используемый для прогнозирования вероятности целевой переменной. Глубокое обучение гомогенизирует архитектуры моделей (например, сверточные нейронные сети). А фундаментальные модели гомогенизирует саму модель (например, GPT-3).

Иллюстрация мультимодальности фундаментальной модели ML

В России есть элементы фундаментальных моделей – их могут создавать такие крупные ИТ-компании, «Яндекс» или «Сбер». По мнению Игоря Пивоварова, чем-то подобным Foundation Model для русского языка является библиотека DeepPavlov - библиотека для создания виртуальных ассистентов и анализа текста, построенная на TensorFlow и Keras, которая создана в МФТИ под руководством Михаила Бурцева.

Наброски будущих метавселенных

В январе китайская лаборатория Purple Mountain, расположенная в Нанкине, официально сообщила об установлении мирового рекорда скорости передачи 6G в режиме реального времени для беспроводной связи в терагерцовом диапазоне. Ученым-связистам удалось продемонстрировать скорость передачи данных до 200 Гбит/с. Заявлено, что Китай планирует запустить первую сеть 6G к 2030 г.

Специалисты говорят, что 6G — это не просто еще более высокая скорость связи, а еще и сверхнизкая задержка сигнала, сверхвысокая энергоэффективность связи, сверхвысокая надежность и безопасность, сверхвысокая чувствительность и локализация. Это означает, что появятся принципиально новые сценарии использования связи.

Источник:ieeexplore.ieee.org/document/9335927

В числе таких сценариев, например:

Многомерная дополненная реальность как основа всех бизнес и бытовых приложений.
«Тактильный Интернет чувств»: передача комплексного спектра ощущений (аромат, вкуси т.д.).
Голографические коммуникации.
Ультра-умная телемедицина на основе тактильной связи.
Ультра-умный город, в котором реализована полная транспорта, городской инфраструктуры и человека, «вписанного» в эту инфраструктуру.

Итак, есть предположение, что в недалеком будущем мир станет объединением физической, биологической и цифровой реальности, в которой будут жить и коммуницировать люди и ультра-умные устройства, подключенные к сетям 6G. Все объекты и сущности, находящиеся «поз зонтиком» 6G, будут включены в интеллектуальные процессы на различных уровнях своего существования.

Источник: ieeexplore.ieee.org/document/9335927

В определенном смысле идея всепроникающей интеллектуальной составляющей 6G хорошо согласуется и с идеей фундаментальных моделей глубокого обучения, и с умными чипами в Edge-инфраструктуре, и с тенденцией гибридизации ИИ-механизмов.

Главная страница обзора >>>