使用方式

了解 Puyun AI 的服务层级、定价模型与用量追踪。

服务层级

Puyun AI 提供三种服务层级，每种层级面向不同的使用场景，提供不同的服务质量与价格。

Test — 测试层级

适用场景：接口调试、功能验证、开发初期测试
特点：
- 费用最低，适合大量测试调用
- 不保证服务稳定性与响应速度
- 可能存在请求排队
建议用途：首次接入时的接口联调、CI/CD 中的自动化测试

Flex — 弹性层级

适用场景：个人开发、独立项目、日常使用
特点：
- 性价比均衡
- 较好的服务稳定性
- 支持大部分主流模型
建议用途：个人工具、脚本自动化、中小型项目

Enterprise — 企业层级

适用场景：企业生产环境、关键业务系统
特点：
- 最高的服务稳定性与 SLA 保障
- 优先调度，低延迟
- 独占资源池，不受其他用户影响
- 专属技术支持
建议用途：企业应用、SaaS 产品后端、高并发生产服务

层级对比

特性	Test	Flex	Enterprise
费用	最低	中等	较高
稳定性	基础	良好	最高
响应速度	一般	较快	最快
SLA 保障	无	基础	完整
技术支持	社区	工单	专属
适用场景	测试	个人开发	企业生产

定价模型

定价基于 Token 消耗，每个模型有不同的输入和输出 Token 单价：

输入 Token：提示词和对话历史中的 Token
输出 Token：模型生成的响应 Token

不同服务层级的同一模型价格可能不同，Enterprise 层级因提供更稳定的服务而价格略高。

查看价格

访问首页查看所有模型的实时价格，价格以每百万 Token 为单位展示。

用量追踪

通过 Portal 控制台监控你的使用情况：

登录 Portal
进入用量页面
查看各模型的 Token 消耗和费用明细

充值与计费

预付费模式：使用前先充值到账户余额
实时扣费：Token 消耗从余额中实时扣除
无隐藏费用：仅按实际 Token 消耗计费

速率限制

不同服务层级的速率限制不同，具体限制请查看控制台中的当前配额信息。Enterprise 层级支持自定义速率限制。