Сравнение моделей Llama-3.3-70B-Instruct-Turbo vs Qwen3 Coder 480B A35B

Сравнение моделей Llama-3.3-70B-Instruct-Turbo vs Qwen3 Coder 480B A35B по цене, контексту и дате релиза.

meta-llama

Llama-3.3-70B-Instruct-Turbo

meta-llama/Llama-3.3-70B-Instruct-Turbo

Llama 3.3-70B Instruct Turbo — ускоренная версия Llama 3.3-70B с FP8‑квантизацией, оптимизированная для более быстрого инференса при небольшом компромиссе по точности. Модель ориентирована на полезные, безопасные и гибкие ответы и подходит для диалоговых сценариев, генерации текста и перевода. Это хороший вариант, когда нужен баланс между качеством 70B‑класса и более высокой пропускной способностью.

Контекст 131K

Вход / 1M ₽11.40

Выход / 1M ₽36.48

Выпущена —

К модели

qwen

Qwen3 Coder 480B A35B

qwen/qwen3-coder

Qwen3-Coder-480B-A35B-Instruct — MoE‑модель генерации кода, разработанная командой Qwen. Она оптимизирована для агентных задач программирования, таких как вызов функций, использование инструментов и рассуждения на длинном контексте по репозиториям. Модель содержит 480 млрд параметров, из которых 35 млрд активируются за проход (8 из 160 экспертов). Цены на эндпоинтах Alibaba зависят от длины контекста. Если запрос превышает 128k входных токенов, применяется повышенная тарификация.

Контекст 262K

Вход / 1M ₽45.60

Выход / 1M ₽182.40

Выпущена 23 Jul 2025

К модели