Z.ai: GLM 4.7 Flash
z-ai/glm-4.7-flash
Являясь SOTA-моделью класса 30B, GLM-4.7-Flash предлагает новый вариант, сочетающий производительность и эффективность. Она дополнительно оптимизирована для сценариев агентского программирования, усиливая способности к кодингу, планированию долгосрочных задач и совместной работе с инструментами. Модель достигла лидирующих показателей среди открытых моделей аналогичного размера в ряде популярных публичных бенчмарков.
Контекст
202K
Макс. выход
16K
Модальность
text->text
Цены
Вход
$0.06 / 1M токенов
Выход
$0.40 / 1M токенов
Чтение кэша
$0.01 / 1M токенов
Возможности
Вход
Выход
Токенизатор
Other
Провайдеры (5)
| Провайдер | Данные | Контекст | Макс. выход | Вход / 1M | Выход / 1M | Uptime 24ч | Кэш |
|---|---|---|---|---|---|---|---|
|
DeepInfra
deepinfra/bf16 |
Не обучает
Не хранит
|
202K | 16K | $0.06 | $0.40 | 99.4% | $0.01 -83% |
|
Cloudflare
cloudflare US
|
Не обучает
Хранит
|
131K | 131K | $0.06 | $0.40 | 99.5% | - |
|
Novita
novita/bf16 |
Не обучает
Не хранит
|
200K | 128K | $0.07 | $0.40 | 54.0% | $0.01 -86% |
|
Phala
phala US
|
Не обучает
Не хранит
|
202K | 202K | $0.10 | $0.43 | 94.8% | - |
|
Venice
venice/fp8 |
Не обучает
Не хранит
|
128K | 16K | $0.12 | $0.50 | 97.9% | - |