meta-llama

Llama-3.3-70B-Instruct-Turbo

meta-llama/Llama-3.3-70B-Instruct-Turbo

Llama 3.3-70B Instruct Turbo — ускоренная версия Llama 3.3-70B с FP8‑квантизацией, оптимизированная для более быстрого инференса при небольшом компромиссе по точности. Модель ориентирована на полезные, безопасные и гибкие ответы и подходит для диалоговых сценариев, генерации текста и перевода. Это хороший вариант, когда нужен баланс между качеством 70B‑класса и более высокой пропускной способностью.

Открыть чат Сравнить

Контекст

131K

Вход / 1M

₽11.40

Выход / 1M

₽36.48

Выпущена

—

Быстрый старт

Как использовать модель

Готовые примеры, где модель уже указана в запросе.

curl https://api.routify.ru/v1/chat/completions \
  -H "Authorization: Bearer $ROUTIFY_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "meta-llama/Llama-3.3-70B-Instruct-Turbo",
    "messages": [
      {"role": "system", "content": "Ты - полезный ассистент."},
      {"role": "user", "content": "Объясни, что такое API"}
    ]
  }'

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["ROUTIFY_API_KEY"],
    base_url="https://api.routify.ru/v1",
)

response = client.chat.completions.create(
    model="meta-llama/Llama-3.3-70B-Instruct-Turbo",
    messages=[
        {"role": "system", "content": "Ты - полезный ассистент."},
        {"role": "user", "content": "Объясни, что такое API"},
    ],
)

print(response.choices[0].message.content)

const response = await fetch("https://api.routify.ru/v1/chat/completions", {
  method: "POST",
  headers: {
    "Authorization": `Bearer ${process.env.ROUTIFY_API_KEY}`,
    "Content-Type": "application/json",
  },
  body: JSON.stringify({
    model: "meta-llama/Llama-3.3-70B-Instruct-Turbo",
    messages: [
      { role: "system", content: "Ты - полезный ассистент." },
      { role: "user", content: "Объясни, что такое API" }
    ]
  })
});

const data = await response.json();
console.log(data.choices[0].message.content);