Cách sử dụng

Tìm hiểu về cấp dịch vụ, mô hình định giá và theo dõi mức sử dụng của Puyun AI.

Cấp dịch vụ

Puyun AI cung cấp ba cấp dịch vụ, mỗi cấp hướng đến các trường hợp sử dụng khác nhau, cung cấp chất lượng dịch vụ và mức giá khác nhau.

Test — Cấp thử nghiệm

  • Trường hợp sử dụng: Gỡ lỗi API, xác minh chức năng, thử nghiệm giai đoạn đầu phát triển
  • Đặc điểm:
    • Chi phí thấp nhất, phù hợp cho nhiều lệnh gọi thử nghiệm
    • Không đảm bảo tính ổn định và tốc độ phản hồi của dịch vụ
    • Có thể xảy ra xếp hàng yêu cầu
  • Khuyến nghị sử dụng: Kiểm tra liên thông API khi tích hợp lần đầu, kiểm thử tự động trong CI/CD

Flex — Cấp linh hoạt

  • Trường hợp sử dụng: Phát triển cá nhân, dự án độc lập, sử dụng hàng ngày
  • Đặc điểm:
    • Cân bằng hiệu quả chi phí
    • Tính ổn định dịch vụ tốt
    • Hỗ trợ phần lớn các mô hình phổ biến
  • Khuyến nghị sử dụng: Công cụ cá nhân, tự động hóa script, dự án quy mô nhỏ và trung bình

Enterprise — Cấp doanh nghiệp

  • Trường hợp sử dụng: Môi trường sản xuất doanh nghiệp, hệ thống nghiệp vụ quan trọng
  • Đặc điểm:
    • Tính ổn định dịch vụ và đảm bảo SLA cao nhất
    • Lịch trình ưu tiên, độ trễ thấp
    • Nhóm tài nguyên riêng, không bị ảnh hưởng bởi người dùng khác
    • Hỗ trợ kỹ thuật chuyên dụng
  • Khuyến nghị sử dụng: Ứng dụng doanh nghiệp, backend sản phẩm SaaS, dịch vụ sản xuất tải cao

So sánh các cấp

Tính năngTestFlexEnterprise
Chi phíThấp nhấtTrung bìnhCao hơn
Tính ổn địnhCơ bảnTốtCao nhất
Tốc độ phản hồiBình thườngNhanhNhanh nhất
Đảm bảo SLAKhôngCơ bảnĐầy đủ
Hỗ trợ kỹ thuậtCộng đồngTicketChuyên dụng
Trường hợp sử dụngThử nghiệmPhát triển cá nhânSản xuất doanh nghiệp

Mô hình định giá

Định giá dựa trên lượng Token tiêu thụ, mỗi mô hình có đơn giá Token đầu vào và đầu ra khác nhau:

  • Token đầu vào: Token trong prompt và lịch sử hội thoại
  • Token đầu ra: Token trong phản hồi do mô hình tạo ra

Cùng một mô hình ở các cấp dịch vụ khác nhau có thể có giá khác nhau, cấp Enterprise có giá cao hơn một chút do cung cấp dịch vụ ổn định hơn.

Xem giá

Truy cập trang chủ để xem giá theo thời gian thực của tất cả mô hình, giá được hiển thị theo đơn vị mỗi triệu Token.

Theo dõi mức sử dụng

Giám sát việc sử dụng của bạn thông qua bảng điều khiển Portal:

  1. Đăng nhập Portal
  2. Vào trang Mức sử dụng
  3. Xem chi tiết tiêu thụ Token và chi phí theo từng mô hình

Nạp tiền và thanh toán

  • Mô hình trả trước: Nạp tiền vào số dư tài khoản trước khi sử dụng
  • Khấu trừ theo thời gian thực: Token tiêu thụ được khấu trừ từ số dư theo thời gian thực
  • Không có phí ẩn: Chỉ tính phí theo lượng Token thực tế tiêu thụ

Giới hạn tốc độ

Giới hạn tốc độ khác nhau tùy theo cấp dịch vụ, chi tiết vui lòng xem thông tin hạn mức hiện tại trong bảng điều khiển. Cấp Enterprise hỗ trợ tùy chỉnh giới hạn tốc độ.