Сравнение моделей R1 0528 vs Qwen3 Coder 480B A35B

Сравнение моделей R1 0528 vs Qwen3 Coder 480B A35B по цене, контексту и дате релиза.

deepseek

R1 0528

deepseek/deepseek-r1-0528

Обновление от 28 мая для [исходной модели DeepSeek R1](/deepseek/deepseek-r1). Производительность на уровне [OpenAI o1](/openai/o1), но с открытым исходным кодом и полностью открытыми токенами рассуждений. Размер — 671B параметров, из них 37B активны за один проход инференса. Полностью open‑source модель.

Контекст 163K

Вход / 1M ₽57.00

Выход / 1M ₽245.10

Выпущена 28 May 2025

К модели

qwen

Qwen3 Coder 480B A35B

qwen/qwen3-coder

Qwen3-Coder-480B-A35B-Instruct — MoE‑модель генерации кода, разработанная командой Qwen. Она оптимизирована для агентных задач программирования, таких как вызов функций, использование инструментов и рассуждения на длинном контексте по репозиториям. Модель содержит 480 млрд параметров, из которых 35 млрд активируются за проход (8 из 160 экспертов). Цены на эндпоинтах Alibaba зависят от длины контекста. Если запрос превышает 128k входных токенов, применяется повышенная тарификация.

Контекст 262K

Вход / 1M ₽45.60

Выход / 1M ₽182.40

Выпущена 23 Jul 2025

К модели