Китайская технологическая компания, специализирующаяся на электронной коммерции, представила новые модели искусственного интеллекта, которые способны анализировать изображения и проводить более сложные диалоги. Эти модели были представлены в объявлении компании в пятницу и являются ответом на растущую конкуренцию в мировой гонке за лидерство в области искусственного интеллекта и его технологий.
Алибаба представила две новые модели – Qwen-VL и Qwen-VL-Chat. Обе эти модели будут доступны с открытым исходным кодом, что дает возможность исследователям, разработчикам, ученым и компаниям со всего мира использовать их для создания собственных приложений искусственного интеллекта без необходимости начинать с нуля. Это существенно экономит время и ресурсы.
По словам представителей Alibaba, модель Qwen-VL может отвечать на запросы, связанные с различными изображениями, и создавать к ним подписи. Модель Qwen-VL-Chat, в свою очередь, обладает возможностью более “сложного взаимодействия”, включая сравнение нескольких введенных изображений и ответы на несколько раундов вопросов. Qwen-VL-Chat также способна создавать истории и генерировать изображения на основе предоставленных пользователем фотографий, а также решать математические уравнения, представленные в виде изображений.
Пример использования, приведенный Alibaba, включает распознавание вывески больницы на китайском языке. Модель способна отвечать на вопросы о расположении конкретных отделений больницы, анализируя изображение вывески.
Ранее основная часть генеративного искусственного интеллекта, который создает ответы на основе действий человека, ориентировалась на текстовую информацию. Новые модели Alibaba, а также последняя версия ChatGPT от OpenAI, способны анализировать изображения и предоставлять текстовые ответы.
Обе новые модели Alibaba основаны на большой языковой модели компании под названием Tongyi Qianwen, которая была представлена в начале этого года. Эта модель, использующая обширные массивы данных, является основой для создания чат-ботов и других приложений искусственного интеллекта.
В этом месяце компания, базирующаяся в Ханчжоу, также предоставила доступ к исходному коду для еще двух моделей искусственного интеллекта. Такой подход, не подверженный лицензионным ограничениям, позволяет Alibaba привлечь больше пользователей к своим продуктам искусственного интеллекта, особенно в свете стремления ее облачного подразделения к расширению и планируемому IPO.