Сравнение моделей DeepSeek V3.2 vs Qwen3 Coder 480B A35B

Сравнение моделей DeepSeek V3.2 vs Qwen3 Coder 480B A35B по цене, контексту и дате релиза.

deepseek

DeepSeek V3.2

deepseek/deepseek-v3.2

DeepSeek‑V3.2 — большая языковая модель, сочетающая высокую вычислительную эффективность с сильными рассуждениями и агентным использованием инструментов. Она использует DeepSeek Sparse Attention (DSA), чтобы снижать стоимость обучения и инференса без заметной потери качества на длинном контексте, а масштабируемое постобучение с подкреплением дополнительно усиливает reasoning‑возможности. Модель хорошо подходит для сложных сценариев с кодом, поиском и использованием инструментов, а режим рассуждений можно включать и выключать через параметр `reasoning.enabled`.

Контекст 163K

Вход / 1M ₽29.64

Выход / 1M ₽43.32

Выпущена 1 Dec 2025

К модели

qwen

Qwen3 Coder 480B A35B

qwen/qwen3-coder

Qwen3-Coder-480B-A35B-Instruct — MoE‑модель генерации кода, разработанная командой Qwen. Она оптимизирована для агентных задач программирования, таких как вызов функций, использование инструментов и рассуждения на длинном контексте по репозиториям. Модель содержит 480 млрд параметров, из которых 35 млрд активируются за проход (8 из 160 экспертов). Цены на эндпоинтах Alibaba зависят от длины контекста. Если запрос превышает 128k входных токенов, применяется повышенная тарификация.

Контекст 262K

Вход / 1M ₽45.60

Выход / 1M ₽182.40

Выпущена 23 Jul 2025

К модели