NVIDIA: Llama 3.3 Nemotron Super 49B V1.5
nvidia/llama-3.3-nemotron-super-49b-v1.5
Llama-3.3-Nemotron-Super-49B-v1.5 — это англоцентричная модель для рассуждений и чатов с 49 млрд параметров, производная от Llama-3.3-70B-Instruct. Она оптимизирована для агентских сценариев (RAG, вызов инструментов) и демонстрирует высокие результаты в математических и кодинг-тестах. Благодаря архитектурному поиску (Neural Architecture Search), модель требует меньше памяти и обеспечивает высокую пропускную способность, позволяя развертывание на одной GPU (H100/H200) при сохранении качества рассуждений. Поддерживает контекст 128K.
Контекст
131K
Макс. выход
-
Модальность
text->text
Данные до
2024-03-31
Цены
Вход
$0.10 / 1M токенов
Выход
$0.40 / 1M токенов
Возможности
Вход
Выход
Токенизатор
Llama3
Провайдеры (1)
| Провайдер | Данные | Контекст | Макс. выход | Вход / 1M | Выход / 1M | Uptime 24ч | Кэш |
|---|---|---|---|---|---|---|---|
|
DeepInfra
deepinfra/fp8 |
Не обучает
Не хранит
|
131K | - | $0.10 | $0.40 | 100.0% | - |