NVIDIA: Llama 3.3 Nemotron Super 49B V1.5

nvidia/llama-3.3-nemotron-super-49b-v1.5

Llama-3.3-Nemotron-Super-49B-v1.5 — это англоцентричная модель для рассуждений и чатов с 49 млрд параметров, производная от Llama-3.3-70B-Instruct. Она оптимизирована для агентских сценариев (RAG, вызов инструментов) и демонстрирует высокие результаты в математических и кодинг-тестах. Благодаря архитектурному поиску (Neural Architecture Search), модель требует меньше памяти и обеспечивает высокую пропускную способность, позволяя развертывание на одной GPU (H100/H200) при сохранении качества рассуждений. Поддерживает контекст 128K.

Контекст

131K

Макс. выход

Модальность

text->text

Данные до

2024-03-31

Цены

Вход $0.10 / 1M токенов

Выход $0.40 / 1M токенов

Возможности

Вход

Выход

Токенизатор Llama3

Провайдеры (1)

Провайдер	Данные	Контекст	Макс. выход	Вход / 1M	Выход / 1M	Uptime 24ч	Кэш
DeepInfra deepinfra/fp8	Не обучает Не хранит	131K	-	$0.10	$0.40	100.0%	-

Использовать модель Все модели