PaddlePaddle

PaddleOCR-VL-0.9B

PaddlePaddle/PaddleOCR-VL-0.9B

PaddleOCR-VL-0.9B — ресурсно‑эффективная vision‑language модель, разработанная для разбора документов и точного распознавания элементов страницы. Она сочетает визуальный энкодер с динамическим разрешением в стиле NaViT и языковую модель ERNIE-4.5-0.3B, что позволяет уверенно извлекать текст, таблицы, формулы и графики. Модель поддерживает 109 языков, показывает сильные результаты в document parsing и element recognition и хорошо подходит для практического OCR и document AI.

Контекст
16K
Вход / 1M
₽15.96
Выход / 1M
₽91.20
Выпущена
Быстрый старт

Как использовать модель

Готовые примеры, где модель уже указана в запросе.

curl https://api.routify.ru/v1/chat/completions \
  -H "Authorization: Bearer $ROUTIFY_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "PaddlePaddle/PaddleOCR-VL-0.9B",
    "messages": [
      {"role": "system", "content": "Ты - полезный ассистент."},
      {"role": "user", "content": "Объясни, что такое API"}
    ]
  }'