Сравнение моделей Mixtral 8x7B Instruct vs Qwen3 14B

Сравнение моделей Mixtral 8x7B Instruct vs Qwen3 14B по цене, контексту и дате релиза.

mistralai

Mixtral 8x7B Instruct

mistralai/mixtral-8x7b-instruct

Mixtral 8x7B Instruct — instruction‑модель Mistral на архитектуре Sparse Mixture of Experts, предназначенная для чата и задач следования инструкциям. Она включает 8 экспертов при общем числе 47 млрд параметров и сочетает хорошее качество с эффективным использованием вычислений. Подходит для общих текстовых задач и ассистентных сценариев.

Контекст 32K

Вход / 1M ₽61.56

Выход / 1M ₽61.56

Выпущена 10 Dec 2023

К модели

qwen

Qwen3 14B

qwen/qwen3-14b

Qwen3‑14B — плотная причинная языковая модель на 14.8B параметров из серии Qwen3, разработанная для сложных рассуждений и эффективного диалога. Она поддерживает бесшовное переключение между режимом «thinking» для задач математики, программирования и логических выводов и режимом «non‑thinking» для общения общего назначения. Модель дообучена на следование инструкциям, использование инструментов агентами, творческое письмо и многоязычные задачи на 100+ языках и диалектах. Она нативно поддерживает контекст до 32K токенов и может расширяться до 131K токенов с помощью YaRN‑масштабирования.

Контекст 40K

Вход / 1M ₽13.68

Выход / 1M ₽27.36

Выпущена 28 Apr 2025

К модели