nvidia
Nemotron Nano 9B V2
nvidia/nemotron-nano-9b-v2
NVIDIA-Nemotron-Nano-9B-v2 — языковая модель (LLM), обученная с нуля NVIDIA, предназначенная как единая модель для задач с рассуждениями и без них. Она отвечает на запросы, сначала генерируя трассу рассуждений, а затем финальный ответ. Возможности рассуждений можно контролировать через системный промпт. Если пользователь предпочитает ответы без промежуточных рассуждений, модель можно настроить соответствующим образом.
Быстрый старт
Как использовать модель
Готовые примеры, где модель уже указана в запросе.
curl https://api.routify.ru/v1/chat/completions \
-H "Authorization: Bearer $ROUTIFY_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "nvidia/nemotron-nano-9b-v2",
"messages": [
{"role": "system", "content": "Ты - полезный ассистент."},
{"role": "user", "content": "Объясни, что такое API"}
]
}'
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["ROUTIFY_API_KEY"],
base_url="https://api.routify.ru/v1",
)
response = client.chat.completions.create(
model="nvidia/nemotron-nano-9b-v2",
messages=[
{"role": "system", "content": "Ты - полезный ассистент."},
{"role": "user", "content": "Объясни, что такое API"},
],
)
print(response.choices[0].message.content)
const response = await fetch("https://api.routify.ru/v1/chat/completions", {
method: "POST",
headers: {
"Authorization": `Bearer ${process.env.ROUTIFY_API_KEY}`,
"Content-Type": "application/json",
},
body: JSON.stringify({
model: "nvidia/nemotron-nano-9b-v2",
messages: [
{ role: "system", content: "Ты - полезный ассистент." },
{ role: "user", content: "Объясни, что такое API" }
]
})
});
const data = await response.json();
console.log(data.choices[0].message.content);