nvidia
NVIDIA-Nemotron-3-Super-120B-A12B
nvidia/NVIDIA-Nemotron-3-Super-120B-A12B
NVIDIA Nemotron 3 Super — открытая гибридная MoE‑модель, оптимизированная под высокую вычислительную эффективность и точность в многоагентных приложениях и специализированных agentic‑системах. Она рассчитана на запуск большого числа взаимодействующих агентов в рамках одного приложения, в том числе на одном GPU, сохраняя сильные результаты в reasoning, использовании инструментов и следовании инструкциям. Подходит для сложных агентных workflow, где важны throughput, длинный контекст и гибкость развёртывания.
Быстрый старт
Как использовать модель
Готовые примеры, где модель уже указана в запросе.
curl https://api.routify.ru/v1/chat/completions \
-H "Authorization: Bearer $ROUTIFY_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "nvidia/NVIDIA-Nemotron-3-Super-120B-A12B",
"messages": [
{"role": "system", "content": "Ты - полезный ассистент."},
{"role": "user", "content": "Объясни, что такое API"}
]
}'
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["ROUTIFY_API_KEY"],
base_url="https://api.routify.ru/v1",
)
response = client.chat.completions.create(
model="nvidia/NVIDIA-Nemotron-3-Super-120B-A12B",
messages=[
{"role": "system", "content": "Ты - полезный ассистент."},
{"role": "user", "content": "Объясни, что такое API"},
],
)
print(response.choices[0].message.content)
const response = await fetch("https://api.routify.ru/v1/chat/completions", {
method: "POST",
headers: {
"Authorization": `Bearer ${process.env.ROUTIFY_API_KEY}`,
"Content-Type": "application/json",
},
body: JSON.stringify({
model: "nvidia/NVIDIA-Nemotron-3-Super-120B-A12B",
messages: [
{ role: "system", content: "Ты - полезный ассистент." },
{ role: "user", content: "Объясни, что такое API" }
]
})
});
const data = await response.json();
console.log(data.choices[0].message.content);