NVIDIA: Llama 3.3 Nemotron Super 49B V1.5 — цены, контекст, провайдеры | Призма

NVIDIA: Llama 3.3 Nemotron Super 49B V1.5

nvidia/llama-3.3-nemotron-super-49b-v1.5

Llama-3.3-Nemotron-Super-49B-v1.5 — это англоцентричная модель для рассуждений и чатов с 49 млрд параметров, производная от Llama-3.3-70B-Instruct. Она оптимизирована для агентских сценариев (RAG, вызов инструментов) и демонстрирует высокие результаты в математических и кодинг-тестах. Благодаря архитектурному поиску (Neural Architecture Search), модель требует меньше памяти и обеспечивает высокую пропускную способность, позволяя развертывание на одной GPU (H100/H200) при сохранении качества рассуждений. Поддерживает контекст 128K.

Контекст
131K
Макс. выход
-
Модальность
text->text
Данные до
2024-03-31
Цены
Вход $0.10 / 1M токенов
Выход $0.40 / 1M токенов
Возможности
Вход text
Выход text
Токенизатор Llama3
Провайдеры (1)
Провайдер Данные Контекст Макс. выход Вход / 1M Выход / 1M Uptime 24ч Кэш
DeepInfra
deepinfra/fp8
Не обучает Не хранит
131K - $0.10 $0.40 100.0% -