Inception: Mercury 2
inception/mercury-2
Mercury 2 — это чрезвычайно быстрая LLM для рассуждений и первая диффузионная LLM для рассуждений (dLLM). Вместо последовательной генерации токенов Mercury 2 создает и уточняет несколько токенов параллельно, достигая скорости более 1000 токенов/сек на стандартных GPU. Mercury 2 более чем в 5 раз быстрее ведущих оптимизированных по скорости моделей, таких как Claude 4.5 Haiku и GPT 5 Mini, при значительно меньшей стоимости. Модель поддерживает настраиваемые уровни рассуждений, контекст 128K, нативное использование инструментов и вывод в формате JSON по схеме. Создана для задач программирования, где важна низкая задержка, для голосового поиска в реальном времени и циклов работы агентов. Совместима с OpenAI API.
Контекст
128K
Макс. выход
50K
Модальность
text->text
Цены
Вход
$0.25 / 1M токенов
Выход
$0.75 / 1M токенов
Чтение кэша
$0.02 / 1M токенов
Возможности
Вход
Выход
Токенизатор
Other
Провайдеры (1)
| Провайдер | Данные | Контекст | Макс. выход | Вход / 1M | Выход / 1M | Uptime 24ч | Кэш |
|---|---|---|---|---|---|---|---|
|
Inception
inception |
Не обучает
Не хранит
|
128K | 50K | $0.25 | $0.75 | 99.9% | $0.02 -90% |