Сравнение моделей Llama 3.2 11B Vision Instruct vs Phi 4

Сравнение моделей Llama 3.2 11B Vision Instruct vs Phi 4 по цене, контексту и дате релиза.

×
meta-llama
Llama 3.2 11B Vision Instruct
meta-llama/llama-3.2-11b-vision-instruct

Llama 3.2 11B Vision — мультимодальная модель на 11 млрд параметров для задач, сочетающих визуальные и текстовые данные. Она хорошо подходит для описания изображений, visual Q&A и других сценариев, где требуется объединить генерацию языка с визуальными рассуждениями. Модель обучена на большом наборе пар «изображение‑текст» и подходит для анализа изображений, создания контента, клиентских ассистентов и исследовательских задач.

Контекст 131K
Вход / 1M ₽5.59
Выход / 1M ₽5.59
Выпущена 25 Sep 2024
×
microsoft
Phi 4
microsoft/phi-4

Phi-4 — модель Microsoft Research, разработанная для эффективной работы в сложных задачах рассуждения и сценариях с ограниченной памятью или требованиями к быстрой отдаче. При размере 14 млрд параметров она обучена на смеси синтетических датасетов, отобранных веб‑данных и академических материалов и хорошо подходит для точного следования инструкциям. Лучше всего работает с английским языком.

Контекст 16K
Вход / 1M ₽7.98
Выход / 1M ₽15.96
Выпущена 10 Jan 2025