Qwen 3.7 Max на 51% дороже для иностранцев: как Alibaba делит цены по географии
Новейшая флагманская модель Alibaba — Qwen 3.7 Max, выпущенная 21 мая 2026 года, позиционируется как AI-модель, созданная специально для эпохи автономных агентов. Модель поддерживает обычный режим и режим рассуждения (thinking), стабильно входит в топ-15 на LM Arena по кодингу, математике и reasoning. Но тарифная структура на Alibaba Cloud Model Studio показывает чёткое географическое разделение: один и тот же API стоит на 51% дороже для международных пользователей, чем для клиентов из материкового Китая.
Цифры: $1.65 против $2.50 за миллион входных токенов


Разница в цене прозрачна и одинакова для входных и выходных токенов. При развертывании в материковом Китае (регион Пекин) вход стоит $1,65 за миллион токенов, выход — $4,95. Международное развертывание (регион Сингапур) берёт $2,50 за вход и $7,50 за выход — одинаковая наценка 51% по всем позициям.
| Зона развертывания | Input (за 1M токенов) | Output (за 1M токенов) | Регион |
|---|---|---|---|
| Материковый Китай | $1,65 | $4,95 | Пекин |
| Международная | $2,50 | $7,50 | Сингапур |
| Наценка | +51% для международных пользователей | ||
Оба тарифа поддерживают режимы thinking и non-thinking. В зоне материкового Китая бесплатные квоты не предоставляются, но действует скидка 50% на пакетный вывод (batch inference) и скидка на кэширование контекста. Международная зона включает кэширование контекста, но не предлагает скидку на batch. Международные цены действуют в течение 90 дней после активации Model Studio, после чего могут применяться стандартные тарифы.
Позиция Qwen 3.7 Max в рейтингах LM Arena
На лидерборде LM Arena (по состоянию на конец мая 2026) Qwen 3.7 Max демонстрирует конкурентные результаты. В задачах WebDev модель набирает ELO 1541 — 4-е место. По кодингу — 9-е место, по математике — 8-е, по reasoning на сложных промптах — 15-е. Общий рейтинг в Text Arena — 14-е место.
Модель находится сразу за доминирующими Claude Opus 4 (ранги 1–4 по кодингу и 1–6 по математике) и конкурентоспособными моделями Gemini 3. Для сравнения, GPT-4o значительно отстал — 46-е место по математике и 103-е по кодингу. Qwen 3.7 Max эффективно занимает нишу между топовыми западными моделями и быстро растущими open-source альтернативами.
Сравнение с другими моделями Qwen
В собственной линейке Alibaba Qwen 3.7 Max — самая дорогая текстовая модель, дороже предыдущего флагмана Qwen3-Max. Старый Qwen3-Max (международное развертывание, уровень 0–32K) стоит $1,20 за вход и $6,00 за выход — примерно вдвое дешевле по входным токенам. Средний Qwen3.5-Plus обходится в $0,40 за вход и $2,40 за выход, что в 6 раз дешевле по входу, при этом предлагает контекстное окно на 1 миллион токенов.
| Модель | Input (за 1M) | Output (за 1M) | Контекстное окно |
|---|---|---|---|
| Qwen 3.7 Max (Intl) | $2,50 | $7,50 | Не опубликовано |
| Qwen3-Max (Intl) | $1,20 | $6,00 | 262K |
| Qwen-Max | $1,60 | $6,40 | Не опубликовано |
| Qwen3.5-Plus | $0,40 | $2,40 | 1M |
| Qwen3.5-Flash | $0,10 | $0,40 | 1M |
Qwen 3.7 Max стоит дороже всех остальных моделей Qwen, что отражает его позиционирование как агенто-ориентированного флагмана, а не универсальной рабочей лошадки.
Географическое ценообразование у провайдеров AI
Географическая дифференциация цен Alibaba — не уникальное явление на рынке AI API, но масштаб наценки выделяется. Большинство облачных провайдеров применяют региональные корректировки, отражающие стоимость локальной инфраструктуры, регуляторные требования и налоговые режимы. Amazon Bedrock, Google Cloud Vertex AI и Azure OpenAI имеют региональные цены, но разница между США и Азиатско-Тихоокеанским регионом обычно составляет от 5% до 20%.
Разрыв в 51% для Qwen 3.7 Max значительно шире. Одна из причин — структурно более низкие затраты дата-центров в материковом Китае: электроэнергия, охлаждение, закупка оборудования. Другая — иное конкурентное давление и ценовые ожидания на внутреннем рынке Alibaba. Для международных разработчиков эффективная стоимость Qwen 3.7 Max приближается к ценам западных моделей среднего уровня, что уменьшает традиционное преимущество «китайский AI дешевле».
Что это значит для разработчиков на практике
Для разработчиков за пределами Китая тариф $2,50 за входные токены помещает Qwen 3.7 Max в определённый ценовой сегмент. Claude Opus 4.6 стоит $15 за миллион входных токенов — Qwen 3.7 Max примерно в 6 раз дешевле при сравнимых бенчмарках. GPT-4o при $2,50 за вход и $10 за выход стоит столько же на входе, но дороже на выходе.
Расчёт стоимости сильно зависит от типа нагрузки. Для агентских сценариев, где модель генерирует большие объёмы выходных данных (вызовы инструментов, цепочки рассуждений), расход в $7,50 за миллион выходных токенов — это основная статья затрат. Типичная агентская сессия, потребляющая 10K входных токенов и генерирующая 50K выходных, обойдётся примерно в $0,40 на международной зоне и $0,26 на материковом Китае — разница $0,14 за сессию, которая масштабируется при больших объёмах.
Стоит ли платить международную наценку
Решение зависит от требований к хранению данных и задержкам. Развёртывание в Сингапуре обеспечивает меньшую задержку для пользователей Юго-Восточной Азии, Океании и Ближнего Востока, тогда как материковый Китай может иметь проблемы с подключением извне из-за Великого китайского файрвола. Для чувствительных к задержкам приложений наценка 51% может быть оправдана исключительно сетевой производительностью.
Для задач, чувствительных к стоимости, где задержка менее критична, скидка на пакетный вывод в зоне материкового Китая (50%) фактически снижает стоимость выхода до $2,475 за миллион токенов — делая её конкурентоспособной со стандартными международными ценами Qwen3-Max. Разработчики, запускающие не-реалтайм агентские пайплайны, должны оценить, даёт ли batch mode на материковой зоне лучшую экономику несмотря на операционную сложность.
Заключение
Qwen 3.7 Max — способная модель, конкурирующая с лучшими на бенчмарках по кодингу и математике при значительно меньшей стоимости за токен, чем Claude Opus 4. Географическая разница в 51% — стратегический выбор Alibaba: дешевле для внутренних пользователей, составляющих ядро рынка, и с наценкой для международных пользователей, где Claude и GPT задают более высокий ценовой якорь.
Для разработчиков, строящих агентские системы, модель предлагает хорошую ценность на обеих ценовых точках. Международный тариф $2,50/$7,50 в 2–6 раз дешевле западных frontier-моделей, а китайский $1,65/$4,95 остаётся одним из самых доступных способов получить доступ к топовым reasoning-возможностям через API.
Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.