Inception: Mercury 2

inception/mercury-2

Mercury 2 — это чрезвычайно быстрая LLM для рассуждений и первая диффузионная LLM для рассуждений (dLLM). Вместо последовательной генерации токенов Mercury 2 создает и уточняет несколько токенов параллельно, достигая скорости более 1000 токенов/сек на стандартных GPU. Mercury 2 более чем в 5 раз быстрее ведущих оптимизированных по скорости моделей, таких как Claude 4.5 Haiku и GPT 5 Mini, при значительно меньшей стоимости. Модель поддерживает настраиваемые уровни рассуждений, контекст 128K, нативное использование инструментов и вывод в формате JSON по схеме. Создана для задач программирования, где важна низкая задержка, для голосового поиска в реальном времени и циклов работы агентов. Совместима с OpenAI API.

Контекст

128K

Макс. выход

50K

Модальность

text->text

Цены

Вход 24.00 ₽ / 1M токенов

Выход 72.00 ₽ / 1M токенов

Чтение кэша 2.40 ₽ / 1M токенов

Запись кэша Бесплатно / 1M токенов

Возможности

Вход

Выход

Токенизатор Other

Провайдеры (1)

Провайдер	Данные	Контекст	Макс. выход	Вход / 1M	Выход / 1M	Uptime 24ч	Кэш
Inception inception	Не обучает Не хранит	128K	50K	24.00 ₽	72.00 ₽	100.0%	2.40 ₽ -90%

Использовать модель Все модели