使用方式

了解 Puyun AI 的服务层级、定价模型与用量追踪。

服务层级

Puyun AI 提供三种服务层级,每种层级面向不同的使用场景,提供不同的服务质量与价格。

Test — 测试层级

  • 适用场景:接口调试、功能验证、开发初期测试
  • 特点
    • 费用最低,适合大量测试调用
    • 不保证服务稳定性与响应速度
    • 可能存在请求排队
  • 建议用途:首次接入时的接口联调、CI/CD 中的自动化测试

Flex — 弹性层级

  • 适用场景:个人开发、独立项目、日常使用
  • 特点
    • 性价比均衡
    • 较好的服务稳定性
    • 支持大部分主流模型
  • 建议用途:个人工具、脚本自动化、中小型项目

Enterprise — 企业层级

  • 适用场景:企业生产环境、关键业务系统
  • 特点
    • 最高的服务稳定性与 SLA 保障
    • 优先调度,低延迟
    • 独占资源池,不受其他用户影响
    • 专属技术支持
  • 建议用途:企业应用、SaaS 产品后端、高并发生产服务

层级对比

特性TestFlexEnterprise
费用最低中等较高
稳定性基础良好最高
响应速度一般较快最快
SLA 保障基础完整
技术支持社区工单专属
适用场景测试个人开发企业生产

定价模型

定价基于 Token 消耗,每个模型有不同的输入和输出 Token 单价:

  • 输入 Token:提示词和对话历史中的 Token
  • 输出 Token:模型生成的响应 Token

不同服务层级的同一模型价格可能不同,Enterprise 层级因提供更稳定的服务而价格略高。

查看价格

访问首页查看所有模型的实时价格,价格以每百万 Token 为单位展示。

用量追踪

通过 Portal 控制台监控你的使用情况:

  1. 登录 Portal
  2. 进入 用量 页面
  3. 查看各模型的 Token 消耗和费用明细

充值与计费

  • 预付费模式:使用前先充值到账户余额
  • 实时扣费:Token 消耗从余额中实时扣除
  • 无隐藏费用:仅按实际 Token 消耗计费

速率限制

不同服务层级的速率限制不同,具体限制请查看控制台中的当前配额信息。Enterprise 层级支持自定义速率限制。