Компания Meta* представила свою новейшую разработку в сфере искусственного интеллекта — языковую модель Llama 3. Этот проект является прямым конкурентом GPT-4 Turbo от OpenAI и предлагается в двух исполнениях: Llama 3 8B и Llama 3 70B, соответственно с восьми и семьюдесятью миллиардами параметров.
Эти модели значительно превосходят своего предшественника MML, разработанного при участии основателя Meta* Марка Цукерберга, особенно по техническим характеристикам и результатам в различных тестах, включая MMLU, ARC и DROP.
Llama 3 теперь интегрирована в поисковые системы таких приложений Meta*, как Facebook, Messenger, Instagram и WhatsApp, что значительно улучшает их функциональность. Кроме того, новая модель ИИ доступна на специализированном сайте в виде чат-бота, работающего на английском языке и открытого для широкой публики, не только для пользователей социальных сетей Meta*.
Примечательно, что новинка не ограничивается только улучшением существующих функций. В Llama 3 добавлены инновации, такие как анимация изображений и более качественное размещение текста на картинках. ИИ также способен выполнять поиск по запросам в Google и Bing, что расширяет его функциональные возможности.
Обе версии Llama 3 демонстрируют впечатляющие способности в обучении, генерации кода и математических задачах, превосходя аналогичные модели на рынке по тестам, таким как GPQA, HumanEval и GSM-8K. Модели обучены на данных из открытых источников, включая 15 триллионов токенов и 750 миллиардов слов, и поддерживают 30 различных языков, что делает их чрезвычайно многофункциональными.
На фоне нарастающей обеспокоенности по поводу безопасности использования ИИ, Meta* усилена система защиты новых моделей. Так, в Llama 3 интегрированы протоколы безопасности Llama Guard и CybersecEval, а также инструмент для анализа безопасности кода Code Shield.
Meta* уже анонсировала следующее поколение технологии — модель Llama 3 с 400 миллиардами параметров, которая будет поддерживать еще больше языков и типов данных, включая обработку изображений. Эта мультимодальная модель призвана улучшить контекстуальное понимание ИИ и расширить его возможности в аналитической работе и написании кода, что, по мнению разработчиков, позволит превзойти такие конкурентные продукты, как ChatGPT и Gemini.
* признана экстремистской организацией, деятельность запрещена в России