Использование

Узнайте об уровнях сервиса, модели ценообразования и отслеживании использования Puyun AI.

Уровни сервиса

Puyun AI предоставляет три уровня обслуживания, каждый из которых предназначен для различных сценариев использования и предлагает разное качество сервиса и цены.

Test — тестовый уровень

Сценарий использования: отладка API, проверка функциональности, тестирование на ранних этапах разработки
Особенности:
- Минимальная стоимость, подходит для большого количества тестовых вызовов
- Стабильность сервиса и скорость отклика не гарантируются
- Возможно ожидание в очереди запросов
Рекомендуемое применение: отладка API при первичной интеграции, автоматизированное тестирование в CI/CD

Flex — эластичный уровень

Сценарий использования: личная разработка, независимые проекты, повседневное использование
Особенности:
- Оптимальное соотношение цены и качества
- Хорошая стабильность сервиса
- Поддержка большинства популярных моделей
Рекомендуемое применение: личные инструменты, автоматизация скриптов, проекты среднего масштаба

Enterprise — корпоративный уровень

Сценарий использования: корпоративная продакшен-среда, критически важные бизнес-системы
Особенности:
- Максимальная стабильность сервиса и гарантии SLA
- Приоритетное планирование, низкая задержка
- Выделенный пул ресурсов, не зависит от других пользователей
- Выделенная техническая поддержка
Рекомендуемое применение: корпоративные приложения, бэкенд SaaS-продуктов, высоконагруженные продакшен-сервисы

Сравнение уровней

Характеристика	Test	Flex	Enterprise
Стоимость	Минимальная	Средняя	Повышенная
Стабильность	Базовая	Хорошая	Максимальная
Скорость отклика	Обычная	Быстрая	Максимальная
Гарантии SLA	Нет	Базовые	Полные
Техническая поддержка	Сообщество	Тикеты	Выделенная
Сценарий использования	Тестирование	Личная разработка	Корпоративный продакшен

Модель ценообразования

Ценообразование основано на потреблении Token. Каждая модель имеет свою цену за входящие и исходящие Token:

Входящие Token: Token из промпта и истории диалога
Исходящие Token: Token из сгенерированного моделью ответа

Цены на одну и ту же модель могут различаться в зависимости от уровня сервиса. Уровень Enterprise имеет более высокую цену, так как обеспечивает более стабильный сервис.

Просмотр цен

Посетите главную страницу для просмотра актуальных цен на все модели. Цены указаны за миллион Token.

Отслеживание использования

Отслеживайте своё использование через консоль Portal:

Войдите в Portal
Откройте страницу Использование
Просмотрите потребление Token и детали расходов по каждой модели

Пополнение баланса и оплата

Предоплаченная модель: сначала пополните баланс аккаунта перед использованием
Списание в реальном времени: потребление Token списывается с баланса в реальном времени
Без скрытых платежей: оплата только за фактическое потребление Token

Ограничения скорости

Ограничения скорости (rate limit) различаются в зависимости от уровня сервиса. Подробную информацию о текущих квотах см. в консоли. Уровень Enterprise поддерживает настраиваемые ограничения скорости.