Inception: Mercury 2 — цены, контекст, провайдеры | Призма

Inception: Mercury 2

inception/mercury-2

Mercury 2 — это чрезвычайно быстрая LLM для рассуждений и первая диффузионная LLM для рассуждений (dLLM). Вместо последовательной генерации токенов Mercury 2 создает и уточняет несколько токенов параллельно, достигая скорости более 1000 токенов/сек на стандартных GPU. Mercury 2 более чем в 5 раз быстрее ведущих оптимизированных по скорости моделей, таких как Claude 4.5 Haiku и GPT 5 Mini, при значительно меньшей стоимости. Модель поддерживает настраиваемые уровни рассуждений, контекст 128K, нативное использование инструментов и вывод в формате JSON по схеме. Создана для задач программирования, где важна низкая задержка, для голосового поиска в реальном времени и циклов работы агентов. Совместима с OpenAI API.

Контекст
128K
Макс. выход
50K
Модальность
text->text
Цены
Вход $0.25 / 1M токенов
Выход $0.75 / 1M токенов
Чтение кэша $0.02 / 1M токенов
Возможности
Вход text
Выход text
Токенизатор Other
Провайдеры (1)
Провайдер Данные Контекст Макс. выход Вход / 1M Выход / 1M Uptime 24ч Кэш
Inception
inception
Не обучает Не хранит
128K 50K $0.25 $0.75 99.9% $0.02 -90%