Использование

Узнайте об уровнях сервиса, модели ценообразования и отслеживании использования Puyun AI.

Уровни сервиса

Puyun AI предоставляет три уровня обслуживания, каждый из которых предназначен для различных сценариев использования и предлагает разное качество сервиса и цены.

Test — тестовый уровень

  • Сценарий использования: отладка API, проверка функциональности, тестирование на ранних этапах разработки
  • Особенности:
    • Минимальная стоимость, подходит для большого количества тестовых вызовов
    • Стабильность сервиса и скорость отклика не гарантируются
    • Возможно ожидание в очереди запросов
  • Рекомендуемое применение: отладка API при первичной интеграции, автоматизированное тестирование в CI/CD

Flex — эластичный уровень

  • Сценарий использования: личная разработка, независимые проекты, повседневное использование
  • Особенности:
    • Оптимальное соотношение цены и качества
    • Хорошая стабильность сервиса
    • Поддержка большинства популярных моделей
  • Рекомендуемое применение: личные инструменты, автоматизация скриптов, проекты среднего масштаба

Enterprise — корпоративный уровень

  • Сценарий использования: корпоративная продакшен-среда, критически важные бизнес-системы
  • Особенности:
    • Максимальная стабильность сервиса и гарантии SLA
    • Приоритетное планирование, низкая задержка
    • Выделенный пул ресурсов, не зависит от других пользователей
    • Выделенная техническая поддержка
  • Рекомендуемое применение: корпоративные приложения, бэкенд SaaS-продуктов, высоконагруженные продакшен-сервисы

Сравнение уровней

ХарактеристикаTestFlexEnterprise
СтоимостьМинимальнаяСредняяПовышенная
СтабильностьБазоваяХорошаяМаксимальная
Скорость откликаОбычнаяБыстраяМаксимальная
Гарантии SLAНетБазовыеПолные
Техническая поддержкаСообществоТикетыВыделенная
Сценарий использованияТестированиеЛичная разработкаКорпоративный продакшен

Модель ценообразования

Ценообразование основано на потреблении Token. Каждая модель имеет свою цену за входящие и исходящие Token:

  • Входящие Token: Token из промпта и истории диалога
  • Исходящие Token: Token из сгенерированного моделью ответа

Цены на одну и ту же модель могут различаться в зависимости от уровня сервиса. Уровень Enterprise имеет более высокую цену, так как обеспечивает более стабильный сервис.

Просмотр цен

Посетите главную страницу для просмотра актуальных цен на все модели. Цены указаны за миллион Token.

Отслеживание использования

Отслеживайте своё использование через консоль Portal:

  1. Войдите в Portal
  2. Откройте страницу Использование
  3. Просмотрите потребление Token и детали расходов по каждой модели

Пополнение баланса и оплата

  • Предоплаченная модель: сначала пополните баланс аккаунта перед использованием
  • Списание в реальном времени: потребление Token списывается с баланса в реальном времени
  • Без скрытых платежей: оплата только за фактическое потребление Token

Ограничения скорости

Ограничения скорости (rate limit) различаются в зависимости от уровня сервиса. Подробную информацию о текущих квотах см. в консоли. Уровень Enterprise поддерживает настраиваемые ограничения скорости.