Разработчики: | Alibaba Group |
Дата премьеры системы: | август 2023 г. |
Отрасли: | Информационные технологии |
2023: Запуск нейросети
25 августа 2023 года китайская корпорация Alibaba представила две модели искусственного интеллекта — Qwen-VL[1] (Qwen Large Vision Language Model) и Qwen-VL-Chat, которые обеспечивают расширенные возможности в плане анализа изображений и ведения диалогов на естественном языке.
Вышедшие решения имеют открытый исходный код, а это означает, что независимые исследователи, научные организации и компании по всему миру смогут использовать их для создания собственных ИИ-приложений без необходимости обучения своих систем. Это позволит экономить аппаратные ресурсы, время и деньги. Кроме того, ускорится выход конечных продуктов на коммерческий рынок.
Модель Qwen-VL может распознавать изображения и текст. Алгоритм способен обрабатывать запросы, связанные с графическими файлами, генерировать ответы, подписи к изображениям и пр. В свою очередь, модель Qwen-VL-Chat предназначена для более сложного взаимодействия: она может сравнивать несколько графических файлов, отвечать на серии вопросов, а также генерировать повествования. ИИ-алгоритмы дают возможность формировать изображения на основе фотографий, которые предоставляет пользователь, а также решать математические задачи, показанные на картинке. Например, можно задать искусственному интеллекту вопрос о местонахождении той или иной компании, загрузив фото ее вывески.
Анонсированные ИИ-модели, как отмечается, призваны улучшить взаимодействие с пользователем, предоставляя более точную и актуальную информацию. Вместе с тем, отмечают специалисты, существуют вопросы, связанные с обеспечением конфиденциальности. ИИ-алгоритмы с возможностью визуальной локализации теоретически позволяют определять местоположение людей, запечатленных на фотографиях: эти сведения могут использоваться для слежки или в преступных целях.[2]