使い方
Puyun AI のサービス階層、料金モデル、使用量トラッキングについて理解しましょう。
サービス階層
Puyun AI は3つのサービス階層を提供しています。各階層は異なるユースケースに向けられており、異なるサービス品質と料金を提供します。
Test — テスト階層
- 対象ユース:API のデバッグ、機能検証、開発初期のテスト
- 特徴:
- 最安料金。大量のテスト呼び出しに適しています
- サービスの安定性とレスポンス速度は保証されません
- リクエストのキューイングが発生する場合があります
- 推奨用途:初回接続時の API 統合テスト、CI/CD での自動テスト
Flex — エラスティック階層
- 対象ユース:個人開発、個人プロジェクト、日常的な使用
- 特徴:
- コストパフォーマンスに優れています
- 良好なサービス安定性
- 主要なモデルの大部分に対応
- 推奨用途:個人用ツール、スクリプト自動化、中小規模プロジェクト
Enterprise — エンタープライズ階層
- 対象ユース:エンタープライズ本番環境、ミッションクリティカルなシステム
- 特徴:
- 最高のサービス安定性と SLA 保証
- 優先スケジューリング、低レイテンシ
- 専有リソースプール。他のユーザーの影響を受けません
- 専任テクニカルサポート
- 推奨用途:エンタープライズアプリケーション、SaaS プロダクトのバックエンド、高並発本番サービス
階層比較
| 特徴 | Test | Flex | Enterprise |
|---|
| 料金 | 最安 | 中程度 | やや高め |
| 安定性 | 基本 | 良好 | 最高 |
| レスポンス速度 | 一般 | 速い | 最速 |
| SLA 保証 | なし | 基本 | 完備 |
| テクニカルサポート | コミュニティ | チケット | 専任 |
| 対象ユース | テスト | 個人開発 | エンタープライズ本番 |
料金モデル
料金は Token 消費量に基づいています。各モデルには異なる入力・出力 Token 単価が設定されています:
- 入力 Token:プロンプトと会話履歴に含まれる Token
- 出力 Token:モデルが生成したレスポンスの Token
同じモデルでもサービス階層により価格が異なる場合があります。Enterprise 階層はより安定したサービスを提供するため、価格はやや高くなります。
料金の確認
ホームページで全モデルのリアルタイム料金をご確認いただけます。料金は100万 Token あたりの単位で表示されます。
使用量トラッキング
Portal コンソールから使用状況をモニタリングできます:
- Portal にログイン
- 使用量 ページに移動
- 各モデルの Token 消費量と費用の明細を確認
チャージと課金
- 前払い方式:使用前にアカウント残高にチャージします
- リアルタイム課金:Token 消費は残高からリアルタイムで引き落とされます
- 隠し料金なし:実際の Token 消費に基づく課金のみ
レート制限
サービス階層によりレート制限が異なります。具体的な制限については、コンソールの現在のクォータ情報をご確認ください。Enterprise 階層ではカスタムレート制限に対応しています。