Т-Банк: Turbo Alignment Библиотека инструментов для обучения больших языковых моделей

Продукт
Разработчики: Т-Банк (Тинькофф Банк)
Дата премьеры системы: 2024/10/16
Технологии: Речевые технологии,  Средства разработки приложений

2024: Открытие доступа к Turbo Alignment

Центр искусственного интеллекта Т-Банка открыл доступ к бесплатной библиотеке инструментов Turbo Alignment для обучения больших языковых моделей (LLM) под задачи бизнеса. Библиотека позволит компаниям не разрабатывать ИИ-приложения с нуля, а использовать уже готовые инструменты. Об этом было объявлено 16 октября 2024 года.

Turbo Alignment поможет стартапам и крупному бизнесу, который не специализируется на ИИ, создавать инновационные продукты, которые были бы невозможны без LLM. Например, ассистентов поддержки, которые обрабатывают клиентские запросы и мгновенно предоставляют ответы, инструменты для анализа и обобщения крупных объемов текста, таких как отчеты и исследования, интеллектуальные поисковые системы, способные находить информацию с учетом контекста, а также модели для суммаризации текста.

Плюсы Turbo Alignment для бизнеса:

  • Комплексный подход. Компаниям не придется инвестировать в обучение больших языковых моделей с нуля. Кроме прикладных инструментов для создания ИИ-продуктов бизнесу доступна большая языковая модель T-lite, которая показывает лучшие результаты в решении бизнес-задач на русском языке среди открытых моделей размером 7—8 млрд параметров.
  • Снижение затрат на разработку. Turbo Alignment значительно снижает затраты на разработку ИИ-продуктов и количество используемых вычислительных ресурсов за счет использования готовых инструментов и моделей.
  • Экономия времени. По оценке разработчиков Т-Банка, скорость разработки с помощью репозитория — от идеи до продукта — выросла в 4 раза. Это сокращает время на запуск новых ИИ-продуктов и дает бизнесу конкурентное качество.
  • Улучшение клиентского опыта. Продукты на основе LLM делают взаимодействие с пользователями более интерактивным и персонализированным, учитывают их индивидуальные потребности. Это ускоряет обслуживание и повышает удовлетворенность клиентов.

«
Создание библиотеки Turbo Alignment — это часть нашей стратегии по развитию российской ИТ-индустрии. Как один из лидеров опенсорса, мы видим свою миссию в том, чтобы делиться с рынком своими разработками. У большинства компаний не хватает ресурсов для разработки продуктов на основе больших языковых моделей. Поэтому мы выпустили в опенсорс не только модель T-lite, но и библиотеку инструментов для ее прикладного использования. Так мы делаем ИИ более доступным для обычных людей: чем больше компаний создают ИИ-продукты, тем больше пользователей смогут извлечь пользу из этих технологий,
сказал Артем Бондарь, руководитель направления обработки естественного языка (NLP) в Центре искусственного интеллекта Т-Банка.
»

Библиотека создана при участии ученых из лаборатории научных исследований искусственного интеллекта T-Bank AI Research. В ней исследователи разрабатывают и проектируют новые методы, которые становятся основой их научных открытий. Turbo Alignment дает доступ к последним исследованиям в области AI Alignment, направленным на то, чтобы поведение ИИ было предсказуемым и не выходило из-под контроля человека, соответствовало его потребностям и ценностям. В библиотеке собраны все необходимые метрики и инструменты, которые позволяют понять и проанализировать различные подходы к обучению ИИ. Российский рынок облачных ИБ-сервисов только формируется 2.4 т

Преимущества Turbo Alignment для разработчиков:

  • Доступность для небольших и непрофильных команд. Turbo Alignment позволяет даже небольшим командам без значительных ресурсов и глубокой экспертизы в области языковых моделей создавать продукты на основе искусственного интеллекта.
  • Набор готовых инструментов. В репозитории доступен no-code-запуск экспериментов, скрипты для обучения большого количества алгоритмов, модуль для быстрого тестирования моделей и инструменты для мониторинга метрик во время обучения.
  • Инструменты для исследований и разработки. Turbo Alignment предоставляет все необходимые средства для добавления новых методов обучения и их сравнения с уже существующими решениями на конкретных задачах.
  • Поддержка сложных процессов обучения. Turbo Alignment оптимизирован для распределенного обучения на нескольких видеокартах и серверах (Multi-GPU и Multi-Node).

«
Современные эксперименты с большими языковыми моделями (LLM) нуждаются в стабильности, воспроизводимости и объяснимости — это ключевые факторы для создания качественных продуктов. Хотя на рынке уже существуют конкурентные решения, они зачастую фрагментированы и требуют доработки. В отличие от них мы объединили все необходимые компоненты в единой библиотеке, что обеспечивает целостность и удобство использования. Turbo Alignment предлагает расширенную функциональность, готовую последовательность работы с данными и инструменты для обучения LLM. Это позволяет быстро проверять научные и продуктовые гипотезы,
отметил Артем Бондарь, руководитель направления обработки естественного языка (NLP) в Центре искусственного интеллекта Т-Банка.
»

В дальнейшем Т-Банк планирует поддерживать и развивать библиотеку Turbo Alignment, добавляя новые методы и обучающие материалы.



СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Солар (ранее Ростелеком-Солар) (46)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (15)
  Форсайт (11)
  Бипиум (Bpium) (10)
  Axiom JDK (БеллСофт) ранее Bellsoft (10)
  Другие (393)

  Солар (ранее Ростелеком-Солар) (8)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (4)
  Консом групп, Konsom Group (КонсОМ СКС) (2)
  ЛАНИТ - Би Пи Эм (Lanit BPM) (2)
  IFellow (АйФэлл) (2)
  Другие (30)

  Солар (ранее Ростелеком-Солар) (10)
  Форсайт (3)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  КРИТ (KRIT) (2)
  Cloud.ru (Облачные технологии) ранее SberCloud (2)
  Другие (13)

  Солар (ранее Ростелеком-Солар) (6)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  РЖД-Технологии (3)
  Robin (Робин) (3)
  Другие (23)

  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  Солар (ранее Ростелеком-Солар) (3)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
  РеСолют (1)
  Сбербанк-Технологии (СберТех) (1)
  Другие (11)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Солар (ранее Ростелеком-Солар) (2, 48)
  Microsoft (41, 47)
  Oracle (49, 26)
  Hyperledger (Open Ledger Project) (1, 23)
  IBM (33, 18)
  Другие (606, 308)

  Солар (ранее Ростелеком-Солар) (1, 8)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (1, 4)
  Microsoft (4, 3)
  Oracle (2, 3)
  SAP SE (2, 2)
  Другие (16, 19)

  Солар (ранее Ростелеком-Солар) (1, 11)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 3)
  Форсайт (1, 3)
  Сбербанк (1, 2)
  Cloud.ru (Облачные технологии) ранее SberCloud (1, 2)
  Другие (9, 9)

  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 6)
  Солар (ранее Ростелеком-Солар) (1, 6)
  Мобильные ТелеСистемы (МТС) (1, 4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 4)
  Robin (Робин) (1, 3)
  Другие (14, 24)

  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 4)
  Мобильные ТелеСистемы (МТС) (2, 3)
  Солар (ранее Ростелеком-Солар) (1, 3)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 2)
  РеСолют (1, 1)
  Другие (14, 14)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Solar appScreener (ранее Solar inCode) - 48
  Hyperledger Fabric - 23
  Windows Azure - 20
  FIS Platform - 15
  EXpress Защищенный корпоративный мессенджер - 12
  Другие 328

  Solar appScreener (ранее Solar inCode) - 8
  FIS Platform - 4
  Парадокс: MES Builder - 2
  Java - 2
  Siemens Xcelerator - 2
  Другие 22

  Solar appScreener (ранее Solar inCode) - 11
  BSS Digital2Go - 3
  Форсайт. Мобильная платформа (ранее HyperHive) - 3
  Cloud ML Space - 2
  Tarantool Data Grid - 1
  Другие 8

  EXpress Защищенный корпоративный мессенджер - 6
  Solar appScreener (ранее Solar inCode) - 6
  МТС Exolve - 4
  Форсайт. Мобильная платформа (ранее HyperHive) - 3
  РЖД и Робин: Облачная фабрика программных роботов - 3
  Другие 14

  EXpress Защищенный корпоративный мессенджер - 4
  Solar appScreener (ранее Solar inCode) - 3
  МТС Exolve - 2
  Naumen Platform - 1
  YandexART - 1
  Другие 11

Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (45)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (29)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (27)
  SteadyControl (18)
  Naumen (Наумен консалтинг) (15)
  Другие (196)

  Группа компаний ЦРТ (Центр речевых технологий) (5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  SteadyControl (4)
  3iTech (ранее 3i Technologies) (2)
  Naumen (Наумен консалтинг) (2)
  Другие (17)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
  Naumen (Наумен консалтинг) (3)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  SteadyControl (2)
  Другие (14)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  SteadyControl (6)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (5)
  Naumen (Наумен консалтинг) (4)
  Другие (29)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  SteadyControl (5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3)
  Robovoice (Робовойс) (3)
  Другие (31)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (18, 47)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4, 30)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (12, 29)
  SteadyControl HoReCa (1, 23)
  SteadyControl (1, 23)
  Другие (381, 217)

  Группа компаний ЦРТ (Центр речевых технологий) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
  SteadyControl (1, 4)
  SteadyControl HoReCa (1, 4)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  Другие (9, 13)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Naumen (Наумен консалтинг) (1, 3)
  SteadyControl (1, 3)
  SteadyControl HoReCa (1, 3)
  Другие (12, 16)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  SteadyControl (1, 7)
  SteadyControl HoReCa (1, 7)
  Другие (18, 30)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Сбербанк (3, 5)
  SteadyControl HoReCa (1, 5)
  SteadyControl (1, 5)
  СалютДевайсы (ранее SberDevices) (2, 4)
  Другие (25, 39)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  МТТ VoiceBox - 24
  SteadyControl Система контроля и управления персоналом - 23
  BSS Digital2Speech - 21
  Voice2Med Система распознавания речи в медицине - 14
  Naumen Erudite - 13
  Другие 205

  BSS Digital2Speech - 5
  SteadyControl Система контроля и управления персоналом - 4
  Voice2Med Система распознавания речи в медицине - 4
  МТТ VoiceBox - 2
  Neuro.net Голосовой робот - 2
  Другие 11

  МТТ VoiceBox - 11
  BSS Digital2Speech - 6
  SteadyControl Система контроля и управления персоналом - 3
  Naumen Erudite - 3
  VS Robotics: VS Робот-оператор - 3
  Другие 14

  МТТ VoiceBox - 9
  SteadyControl Система контроля и управления персоналом - 7
  BSS Digital2Speech - 6
  EXpress Защищенный корпоративный мессенджер - 6
  SmartLogger II - 4
  Другие 23

  SteadyControl Система контроля и управления персоналом - 5
  BSS Digital2Speech - 4
  EXpress Защищенный корпоративный мессенджер - 4
  Сбер: GigaChat - 3
  Robovoice Пользовательская no-code платформа для разработки ИИ-ботов - 3
  Другие 30