Логотип
Баннер в шапке 1
Баннер в шапке 2

Яндекс: YaFSDP Библиотека для ускорения обучения больших языковых моделей

Продукт
Разработчики: Яндекс (Yandex)
Дата премьеры системы: 2024/06/11
Технологии: ITSM - Системы управления IT-службой

2024: Представление библиотеки YaFSDP

Яндекс разработал библиотеку YaFSDP и выложил ее в опенсорс. Об этом разработчик сообщил 11 июня 2024 года. Она значительно ускоряет обучение больших языковых моделей — как собственной разработки, так и сторонних, с открытым исходным кодом. Библиотека даёт ускорение до 25% — результат зависит от архитектуры и параметров нейросети. С помощью YaFSDP также можно расходовать до 20% меньше ресурсов графических процессоров (GPU), которые требуются для обучения. Теперь YaFSDP могут использовать компании, разработчики и исследователи по всему миру.

Библиотека Яндекса рассчитана в первую очередь на большие языковые модели, хотя она подходит и для других нейросетей — например, таких, которые генерируют изображения. YaFSDP позволяет сократить расходы на оборудование для обучения моделей — это особенно важно для стартапов и, к примеру, научных проектов.

Одна из сложностей в обучении больших языковых моделей — это недостаточная загрузка каналов коммуникации между графическими процессорами. YaFSDP это решает. Библиотека оптимизирует использование ресурсов GPU на всех этапах обучения: pre-training (предварительное), supervised fine-tuning (с учителем), alignment (выравнивание модели). Благодаря этому YaFSDP задействует ровно столько графической памяти, сколько нужно для обучения, при этом коммуникацию между GPU ничто не замедляет.

Яндекс разработал YaFSDP в процессе обучения своей генеративной модели нового поколения YandexGPT 3. Компания уже протестировала библиотеку на сторонних нейросетях с открытым исходным кодом. Например, если бы YaFSDP использовалась применительно к модели LLaMA 2, этап предварительного обучения на 1024 графических процессорах сократился бы с 66 до 53 дней.

Исходный код YaFSDP уже есть на GitHub[1]. Посмотреть подробности замеров можно в репозитории GitHub, а почитать про разработку библиотеки — на Хабре.

Примечания



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Naumen (Наумен консалтинг) (320)
  Comindware (Колловэар) (254)
  Softline (Софтлайн) (125)
  Okdesk (Облачные Решения) (39)
  Террасофт (Terrasoft, ТС-Консалтинг) (38)
  Другие (695)

  Comindware (Колловэар) (78)
  Okdesk (Облачные Решения) (14)
  Naumen (Наумен консалтинг) (11)
  Крикунов и Партнеры Бизнес Системы (КПБС, KPBS, Krikunov & Partners Business Systems) (7)
  Крок (3)
  Другие (28)

  Naumen (Наумен консалтинг) (14)
  Okdesk (Облачные Решения) (9)
  Comindware (Колловэар) (8)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (7)
  БизнесАвтоматика НПЦ (3)
  Другие (17)

  Naumen (Наумен консалтинг) (18)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (12)
  SimpleOne (Симпл 1) (9)
  Softline (Софтлайн) (3)
  Медиа-Тел (Media-Tel), ранее Devoteam Russia (2)
  Другие (17)

  SimpleOne (Симпл 1) (2)
  Angara Security (Ангара Технолоджиз Груп, АТ Груп) ранее Angara Technologies Group (1)
  Naumen (Наумен консалтинг) (1)
  Softline (Софтлайн) (1)
  Астра Группа компаний (1)
  Другие (4)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Naumen (Наумен консалтинг) (7, 342)
  Comindware (Колловэар) (1, 257)
  Microsoft (16, 123)
  OmniNet (ОмниНет) (4, 55)
  Террасофт (Terrasoft, ТС-Консалтинг) (4, 47)
  Другие (566, 599)

  Comindware (Колловэар) (1, 78)
  Okdesk (Облачные Решения) (1, 14)
  Rails Jedies
  Naumen (Наумен консалтинг) (3, 12)
  Nutanix (1, 9)
  Другие (18, 24)

  Naumen (Наумен консалтинг) (3, 14)
  Okdesk (Облачные Решения) (1, 10)
  Rails Jedies
  Comindware (Колловэар) (1, 8)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (2, 7)
  Другие (11, 14)

  Naumen (Наумен консалтинг) (4, 18)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (1, 12)
  SimpleOne (Симпл 1) (1, 9)
  РусБИТех-Астра (ГК Астра) (1, 3)
  Деснол Софт (2, 2)
  Другие (9, 11)

  РусБИТех-Астра (ГК Астра) (1, 3)
  SimpleOne (Симпл 1) (1, 2)
  Naumen (Наумен консалтинг) (2, 1)
  Газинформсервис (ГИС) (1, 1)
  Деснол Софт (1, 1)
  Другие (1, 1)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Naumen Service Desk - 278
  Comindware Business Application Platform - 257
  Microsoft System Center Configuration Manager (SCCM) - 50
  ITSM365.ru - 48
  OmniTracker - 41
  Другие 693

  Comindware Business Application Platform - 78
  Okdesk Система учета и регистрации заявок для малых и средних сервисных компаний - 14
  Nutanix HCI - 9
  ITSM365.ru - 6
  Naumen Service Desk - 4
  Другие 26

  Okdesk Система учета и регистрации заявок для малых и средних сервисных компаний - 10
  ITSM365.ru - 9
  Comindware Business Application Platform - 8
  ELMA365 Service - 6
  Naumen Service Desk - 3
  Другие 18

  ELMA365 Service - 12
  SimpleOne ITSM (IT Service Management) - 9
  ITSM365.ru - 9
  Naumen Service Desk - 7
  РусБИТех-Астра: ALD Pro - 3
  Другие 14

  РусБИТех-Астра: ALD Pro - 3
  SimpleOne ITSM (IT Service Management) - 2
  Naumen Software Asset Management (SAM) - 1
  Efros Config Inspector - 1
  Naumen Service Desk - 1
  Другие 2