Utilisation

Découvrez les niveaux de service, le modèle de tarification et le suivi de consommation de Puyun AI.

Niveaux de service

Puyun AI propose trois niveaux de service, chacun destiné à des cas d'usage différents et offrant une qualité de service et des tarifs distincts.

Test — Niveau de test

Cas d'usage : débogage d'API, validation fonctionnelle, tests en début de développement
Caractéristiques :
- Coût minimal, adapté à un grand nombre d'appels de test
- Aucune garantie de stabilité du service ni de vitesse de réponse
- Possibilité de mise en file d'attente des requêtes
Usage recommandé : intégration d'API lors d'une première connexion, tests automatisés en CI/CD

Flex — Niveau élastique

Cas d'usage : développement personnel, projets indépendants, usage quotidien
Caractéristiques :
- Bon rapport qualité-prix
- Bonne stabilité du service
- Prise en charge de la plupart des modèles populaires
Usage recommandé : outils personnels, automatisation de scripts, projets de petite et moyenne envergure

Enterprise — Niveau entreprise

Cas d'usage : environnements de production d'entreprise, systèmes critiques
Caractéristiques :
- Stabilité maximale avec garanties SLA
- Ordonnancement prioritaire, faible latence
- Pool de ressources dédié, non affecté par d'autres utilisateurs
- Support technique dédié
Usage recommandé : applications d'entreprise, back-end de produits SaaS, services de production à forte concurrence

Comparaison des niveaux

Caractéristique	Test	Flex	Enterprise
Coût	Minimal	Moyen	Élevé
Stabilité	Basique	Bonne	Maximale
Vitesse de réponse	Standard	Rapide	La plus rapide
Garantie SLA	Aucune	Basique	Complète
Support technique	Communauté	Ticket	Dédié
Cas d'usage	Tests	Développement personnel	Production d'entreprise

Modèle de tarification

La tarification est basée sur la consommation de Token. Chaque modèle possède un prix unitaire distinct pour les Token d'entrée et de sortie :

Token d'entrée : Token présents dans le prompt et l'historique de conversation
Token de sortie : Token générés dans la réponse du modèle

Le prix d'un même modèle peut varier selon le niveau de service. Le niveau Enterprise, offrant un service plus stable, a un tarif légèrement supérieur.

Consulter les tarifs

Accédez à la page d'accueil pour voir les tarifs en temps réel de tous les modèles. Les prix sont affichés par million de Token.

Suivi de consommation

Suivez votre utilisation via la console Portal :

Connectez-vous au Portal
Allez dans la page Consommation
Consultez les détails de consommation de Token et les coûts par modèle

Recharge et facturation

Mode prépayé : rechargez votre solde de compte avant utilisation
Débit en temps réel : la consommation de Token est déduite du solde en temps réel
Aucun frais caché : facturation uniquement basée sur la consommation réelle de Token

Limites de débit

Les limites de débit varient selon le niveau de service. Consultez les informations de quota actuelles dans la console. Le niveau Enterprise prend en charge les limites de débit personnalisées.