Представляем Lemur: современные открытые предварительно обученные большие языковые модели, балансирующие возможности текста и кода
Введение
Открытые модели большого языка (LLM) традиционно разрабатывались либо для текстовых задач, либо для задач, связанных с кодом, с ограниченными возможностями эффективного баланса обоих. Однако многие сложные языковые приложения, в частности агенты языковых моделей, требуют систем с многогранным набором навыков, охватывающих понимание, рассуждения, планирование, кодирование и обоснование контекста.
В этой работе мы представляем Lemur и Lemur-chat, современные открытые предварительно обученные и контролируемые тонко настроенные большие языковые модели, балансирующие возможности текста и кода.
Предварительное обучение и контролируемая тонкая настройка
Мы предварительно обучаем Llama 2 на данных с интенсивным использованием кода объемом ~ 100 Б, с последующей контролируемой точной настройкой данных общедоступных инструкций и диалогов объемом ~ 300 Тыс. для улучшения навыков кодирования и обоснования при сохранении конкурентоспособных текстовых рассуждений и производительности знаний.
![](https://i0.wp.com/newsletter.radensa.ru/wp-content/uploads/2023/08/train_procedure.png?resize=4253%2C2067&ssl=1)
Оценка
Lemur превосходит другие модели языков с открытым исходным кодом по показателям кодирования, но при этом остается конкурентоспособным в области текстовых рассуждений и производительности знаний.
![](https://i0.wp.com/newsletter.radensa.ru/wp-content/uploads/2023/08/base-model.png?resize=4665%2C2750&ssl=1)
Lemur-chat значительно превосходит другие модели с открытым исходным кодом, контролируемые для точной настройки по различным параметрам.
![](https://i0.wp.com/newsletter.radensa.ru/wp-content/uploads/2023/08/chat-model.png?resize=4665%2C2227&ssl=1)
Проект Lemur – это открытое совместное исследование XLang Lab и Salesforce Research. Мы хотели бы поблагодарить Salesforce Research, Google Research и Amazon AWS за их безвозмездную поддержку этого проекта с открытым исходным кодом! Модели с открытым исходным кодом еще предстоит пройти долгий путь по сравнению с моделями с закрытым исходным кодом. Тем не менее, мы надеемся, что работа Lemur станет ценным вкладом в создание более мощной и сбалансированной основы для модели с открытым исходным кодом и стимулирование исследований агентных моделей.