Utilisation

Découvrez les niveaux de service, le modèle de tarification et le suivi de consommation de Puyun AI.

Niveaux de service

Puyun AI propose trois niveaux de service, chacun destiné à des cas d'usage différents et offrant une qualité de service et des tarifs distincts.

Test — Niveau de test

  • Cas d'usage : débogage d'API, validation fonctionnelle, tests en début de développement
  • Caractéristiques :
    • Coût minimal, adapté à un grand nombre d'appels de test
    • Aucune garantie de stabilité du service ni de vitesse de réponse
    • Possibilité de mise en file d'attente des requêtes
  • Usage recommandé : intégration d'API lors d'une première connexion, tests automatisés en CI/CD

Flex — Niveau élastique

  • Cas d'usage : développement personnel, projets indépendants, usage quotidien
  • Caractéristiques :
    • Bon rapport qualité-prix
    • Bonne stabilité du service
    • Prise en charge de la plupart des modèles populaires
  • Usage recommandé : outils personnels, automatisation de scripts, projets de petite et moyenne envergure

Enterprise — Niveau entreprise

  • Cas d'usage : environnements de production d'entreprise, systèmes critiques
  • Caractéristiques :
    • Stabilité maximale avec garanties SLA
    • Ordonnancement prioritaire, faible latence
    • Pool de ressources dédié, non affecté par d'autres utilisateurs
    • Support technique dédié
  • Usage recommandé : applications d'entreprise, back-end de produits SaaS, services de production à forte concurrence

Comparaison des niveaux

CaractéristiqueTestFlexEnterprise
CoûtMinimalMoyenÉlevé
StabilitéBasiqueBonneMaximale
Vitesse de réponseStandardRapideLa plus rapide
Garantie SLAAucuneBasiqueComplète
Support techniqueCommunautéTicketDédié
Cas d'usageTestsDéveloppement personnelProduction d'entreprise

Modèle de tarification

La tarification est basée sur la consommation de Token. Chaque modèle possède un prix unitaire distinct pour les Token d'entrée et de sortie :

  • Token d'entrée : Token présents dans le prompt et l'historique de conversation
  • Token de sortie : Token générés dans la réponse du modèle

Le prix d'un même modèle peut varier selon le niveau de service. Le niveau Enterprise, offrant un service plus stable, a un tarif légèrement supérieur.

Consulter les tarifs

Accédez à la page d'accueil pour voir les tarifs en temps réel de tous les modèles. Les prix sont affichés par million de Token.

Suivi de consommation

Suivez votre utilisation via la console Portal :

  1. Connectez-vous au Portal
  2. Allez dans la page Consommation
  3. Consultez les détails de consommation de Token et les coûts par modèle

Recharge et facturation

  • Mode prépayé : rechargez votre solde de compte avant utilisation
  • Débit en temps réel : la consommation de Token est déduite du solde en temps réel
  • Aucun frais caché : facturation uniquement basée sur la consommation réelle de Token

Limites de débit

Les limites de débit varient selon le niveau de service. Consultez les informations de quota actuelles dans la console. Le niveau Enterprise prend en charge les limites de débit personnalisées.