Dolly 2.0, как и предшественница Dolly, вышедшая несколько недель назад, использует меньший набор данных, чем у большинства больших языковых моделей. Dolly получила 6 миллиардов параметров, а у Dolly 2.0 их вдвое больше – 12 миллиардов. Для сравнения, у GPT-3 – 175 миллиардов параметров. Сообщается, что Dolly 2.0 была построена на высококачественном наборе данных.
Интересно Илон Маск купил тысячи видеокарт – вероятно, для своего проекта разработки искусственного интеллекта
Что предлагает новая языковая модель
Отличительной особенностью новых моделей генеративного ИИ является возможность использовать свой набор данных обучения для создания связных предложений и ответов на вопросы пользователей. И Dolly 2.0 может делать это даже несмотря на гораздо меньший объем исходных данных, чем у моделей OpenAI. Это позволяет использовать модель на своих серверах без необходимости делиться данными со сторонними организациями.
Мы считаем, что такие модели, как Dolly, помогут демократизировать LLM, превратив их из того, что могут себе позволить далеко не все компании, в товар, которым может обладать каждая компания, и который можно настраивать для улучшения своих продуктов,
– заявили в Databricks.
Руководитель Databricks в комментарии изданию SiliconANGLE подчеркнул, что предприятия "могут монетизировать Dolly 2.0". Компания предлагает Dolly 2.0 под лицензией Creative Commons, с полностью открытым исходным кодом и набором данных для обучения databricks-dolly-15k, который содержит 15 тысяч высококачественных пар запросов и ответов, созданных человеком. Все это можно свободно использовать, изменять и дополнять, а также использовать в коммерческих проектах, ничего никому не платя.
Как утверждает Databricks, в настоящее время Dolly 2.0 является единственной моделью, не имеющей лицензионных ограничений. Другие модели, включая Alpaca, Koala, GPT4All и Vicuna, нельзя использовать в коммерческих целях из-за использования обучающих данных, предоставленных им с определенными условиями.
Интересно, что первоначальный вариант Dolly был обучен на данных Stanford Alpaca с использованием API OpenAI, поэтому ее нельзя было использовать в коммерческих целях.