使用方式
了解 Puyun AI 的服务层级、定价模型与用量追踪。
服务层级
Puyun AI 提供三种服务层级,每种层级面向不同的使用场景,提供不同的服务质量与价格。
Test — 测试层级
- 适用场景:接口调试、功能验证、开发初期测试
- 特点:
- 费用最低,适合大量测试调用
- 不保证服务稳定性与响应速度
- 可能存在请求排队
- 建议用途:首次接入时的接口联调、CI/CD 中的自动化测试
Flex — 弹性层级
- 适用场景:个人开发、独立项目、日常使用
- 特点:
- 建议用途:个人工具、脚本自动化、中小型项目
Enterprise — 企业层级
- 适用场景:企业生产环境、关键业务系统
- 特点:
- 最高的服务稳定性与 SLA 保障
- 优先调度,低延迟
- 独占资源池,不受其他用户影响
- 专属技术支持
- 建议用途:企业应用、SaaS 产品后端、高并发生产服务
层级对比
| 特性 | Test | Flex | Enterprise |
|---|
| 费用 | 最低 | 中等 | 较高 |
| 稳定性 | 基础 | 良好 | 最高 |
| 响应速度 | 一般 | 较快 | 最快 |
| SLA 保障 | 无 | 基础 | 完整 |
| 技术支持 | 社区 | 工单 | 专属 |
| 适用场景 | 测试 | 个人开发 | 企业生产 |
定价模型
定价基于 Token 消耗,每个模型有不同的输入和输出 Token 单价:
- 输入 Token:提示词和对话历史中的 Token
- 输出 Token:模型生成的响应 Token
不同服务层级的同一模型价格可能不同,Enterprise 层级因提供更稳定的服务而价格略高。
查看价格
访问首页查看所有模型的实时价格,价格以每百万 Token 为单位展示。
用量追踪
通过 Portal 控制台监控你的使用情况:
- 登录 Portal
- 进入 用量 页面
- 查看各模型的 Token 消耗和费用明细
充值与计费
- 预付费模式:使用前先充值到账户余额
- 实时扣费:Token 消耗从余额中实时扣除
- 无隐藏费用:仅按实际 Token 消耗计费
速率限制
不同服务层级的速率限制不同,具体限制请查看控制台中的当前配额信息。Enterprise 层级支持自定义速率限制。