meta-llama

Llama-3.3-70B-Instruct-Turbo

meta-llama/Llama-3.3-70B-Instruct-Turbo

Llama 3.3-70B Instruct Turbo — ускоренная версия Llama 3.3-70B с FP8‑квантизацией, оптимизированная для более быстрого инференса при небольшом компромиссе по точности. Модель ориентирована на полезные, безопасные и гибкие ответы и подходит для диалоговых сценариев, генерации текста и перевода. Это хороший вариант, когда нужен баланс между качеством 70B‑класса и более высокой пропускной способностью.

Контекст
131K
Вход / 1M
₽11.40
Выход / 1M
₽36.48
Выпущена
Быстрый старт

Как использовать модель

Готовые примеры, где модель уже указана в запросе.

curl https://api.routify.ru/v1/chat/completions \
  -H "Authorization: Bearer $ROUTIFY_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "meta-llama/Llama-3.3-70B-Instruct-Turbo",
    "messages": [
      {"role": "system", "content": "Ты - полезный ассистент."},
      {"role": "user", "content": "Объясни, что такое API"}
    ]
  }'