Découvrez les niveaux de service, le modèle de tarification et le suivi de consommation de Puyun AI.
Niveaux de service
Puyun AI propose trois niveaux de service, chacun destiné à des cas d'usage différents et offrant une qualité de service et des tarifs distincts.
Test — Niveau de test
Cas d'usage : débogage d'API, validation fonctionnelle, tests en début de développement
Caractéristiques :
Coût minimal, adapté à un grand nombre d'appels de test
Aucune garantie de stabilité du service ni de vitesse de réponse
Possibilité de mise en file d'attente des requêtes
Usage recommandé : intégration d'API lors d'une première connexion, tests automatisés en CI/CD
Flex — Niveau élastique
Cas d'usage : développement personnel, projets indépendants, usage quotidien
Caractéristiques :
Bon rapport qualité-prix
Bonne stabilité du service
Prise en charge de la plupart des modèles populaires
Usage recommandé : outils personnels, automatisation de scripts, projets de petite et moyenne envergure
Enterprise — Niveau entreprise
Cas d'usage : environnements de production d'entreprise, systèmes critiques
Caractéristiques :
Stabilité maximale avec garanties SLA
Ordonnancement prioritaire, faible latence
Pool de ressources dédié, non affecté par d'autres utilisateurs
Support technique dédié
Usage recommandé : applications d'entreprise, back-end de produits SaaS, services de production à forte concurrence
Comparaison des niveaux
Caractéristique
Test
Flex
Enterprise
Coût
Minimal
Moyen
Élevé
Stabilité
Basique
Bonne
Maximale
Vitesse de réponse
Standard
Rapide
La plus rapide
Garantie SLA
Aucune
Basique
Complète
Support technique
Communauté
Ticket
Dédié
Cas d'usage
Tests
Développement personnel
Production d'entreprise
Modèle de tarification
La tarification est basée sur la consommation de Token. Chaque modèle possède un prix unitaire distinct pour les Token d'entrée et de sortie :
Token d'entrée : Token présents dans le prompt et l'historique de conversation
Token de sortie : Token générés dans la réponse du modèle
Le prix d'un même modèle peut varier selon le niveau de service. Le niveau Enterprise, offrant un service plus stable, a un tarif légèrement supérieur.
Consulter les tarifs
Accédez à la page d'accueil pour voir les tarifs en temps réel de tous les modèles. Les prix sont affichés par million de Token.
Consultez les détails de consommation de Token et les coûts par modèle
Recharge et facturation
Mode prépayé : rechargez votre solde de compte avant utilisation
Débit en temps réel : la consommation de Token est déduite du solde en temps réel
Aucun frais caché : facturation uniquement basée sur la consommation réelle de Token
Limites de débit
Les limites de débit varient selon le niveau de service. Consultez les informations de quota actuelles dans la console. Le niveau Enterprise prend en charge les limites de débit personnalisées.