Узнайте об уровнях сервиса, модели ценообразования и отслеживании использования Puyun AI.
Уровни сервиса
Puyun AI предоставляет три уровня обслуживания, каждый из которых предназначен для различных сценариев использования и предлагает разное качество сервиса и цены.
Test — тестовый уровень
Сценарий использования: отладка API, проверка функциональности, тестирование на ранних этапах разработки
Особенности:
Минимальная стоимость, подходит для большого количества тестовых вызовов
Стабильность сервиса и скорость отклика не гарантируются
Возможно ожидание в очереди запросов
Рекомендуемое применение: отладка API при первичной интеграции, автоматизированное тестирование в CI/CD
Flex — эластичный уровень
Сценарий использования: личная разработка, независимые проекты, повседневное использование
Особенности:
Оптимальное соотношение цены и качества
Хорошая стабильность сервиса
Поддержка большинства популярных моделей
Рекомендуемое применение: личные инструменты, автоматизация скриптов, проекты среднего масштаба
Enterprise — корпоративный уровень
Сценарий использования: корпоративная продакшен-среда, критически важные бизнес-системы
Особенности:
Максимальная стабильность сервиса и гарантии SLA
Приоритетное планирование, низкая задержка
Выделенный пул ресурсов, не зависит от других пользователей
Ценообразование основано на потреблении Token. Каждая модель имеет свою цену за входящие и исходящие Token:
Входящие Token: Token из промпта и истории диалога
Исходящие Token: Token из сгенерированного моделью ответа
Цены на одну и ту же модель могут различаться в зависимости от уровня сервиса. Уровень Enterprise имеет более высокую цену, так как обеспечивает более стабильный сервис.
Просмотр цен
Посетите главную страницу для просмотра актуальных цен на все модели. Цены указаны за миллион Token.
Отслеживание использования
Отслеживайте своё использование через консоль Portal:
Просмотрите потребление Token и детали расходов по каждой модели
Пополнение баланса и оплата
Предоплаченная модель: сначала пополните баланс аккаунта перед использованием
Списание в реальном времени: потребление Token списывается с баланса в реальном времени
Без скрытых платежей: оплата только за фактическое потребление Token
Ограничения скорости
Ограничения скорости (rate limit) различаются в зависимости от уровня сервиса. Подробную информацию о текущих квотах см. в консоли. Уровень Enterprise поддерживает настраиваемые ограничения скорости.