使い方

Puyun AI のサービス階層、料金モデル、使用量トラッキングについて理解しましょう。

サービス階層

Puyun AI は3つのサービス階層を提供しています。各階層は異なるユースケースに向けられており、異なるサービス品質と料金を提供します。

Test — テスト階層

  • 対象ユース:API のデバッグ、機能検証、開発初期のテスト
  • 特徴
    • 最安料金。大量のテスト呼び出しに適しています
    • サービスの安定性とレスポンス速度は保証されません
    • リクエストのキューイングが発生する場合があります
  • 推奨用途:初回接続時の API 統合テスト、CI/CD での自動テスト

Flex — エラスティック階層

  • 対象ユース:個人開発、個人プロジェクト、日常的な使用
  • 特徴
    • コストパフォーマンスに優れています
    • 良好なサービス安定性
    • 主要なモデルの大部分に対応
  • 推奨用途:個人用ツール、スクリプト自動化、中小規模プロジェクト

Enterprise — エンタープライズ階層

  • 対象ユース:エンタープライズ本番環境、ミッションクリティカルなシステム
  • 特徴
    • 最高のサービス安定性と SLA 保証
    • 優先スケジューリング、低レイテンシ
    • 専有リソースプール。他のユーザーの影響を受けません
    • 専任テクニカルサポート
  • 推奨用途:エンタープライズアプリケーション、SaaS プロダクトのバックエンド、高並発本番サービス

階層比較

特徴TestFlexEnterprise
料金最安中程度やや高め
安定性基本良好最高
レスポンス速度一般速い最速
SLA 保証なし基本完備
テクニカルサポートコミュニティチケット専任
対象ユーステスト個人開発エンタープライズ本番

料金モデル

料金は Token 消費量に基づいています。各モデルには異なる入力・出力 Token 単価が設定されています:

  • 入力 Token:プロンプトと会話履歴に含まれる Token
  • 出力 Token:モデルが生成したレスポンスの Token

同じモデルでもサービス階層により価格が異なる場合があります。Enterprise 階層はより安定したサービスを提供するため、価格はやや高くなります。

料金の確認

ホームページで全モデルのリアルタイム料金をご確認いただけます。料金は100万 Token あたりの単位で表示されます。

使用量トラッキング

Portal コンソールから使用状況をモニタリングできます:

  1. Portal にログイン
  2. 使用量 ページに移動
  3. 各モデルの Token 消費量と費用の明細を確認

チャージと課金

  • 前払い方式:使用前にアカウント残高にチャージします
  • リアルタイム課金:Token 消費は残高からリアルタイムで引き落とされます
  • 隠し料金なし:実際の Token 消費に基づく課金のみ

レート制限

サービス階層によりレート制限が異なります。具体的な制限については、コンソールの現在のクォータ情報をご確認ください。Enterprise 階層ではカスタムレート制限に対応しています。