Cách sử dụng

Tìm hiểu về cấp dịch vụ, mô hình định giá và theo dõi mức sử dụng của Puyun AI.

Cấp dịch vụ

Puyun AI cung cấp ba cấp dịch vụ, mỗi cấp hướng đến các trường hợp sử dụng khác nhau, cung cấp chất lượng dịch vụ và mức giá khác nhau.

Test — Cấp thử nghiệm

Trường hợp sử dụng: Gỡ lỗi API, xác minh chức năng, thử nghiệm giai đoạn đầu phát triển
Đặc điểm:
- Chi phí thấp nhất, phù hợp cho nhiều lệnh gọi thử nghiệm
- Không đảm bảo tính ổn định và tốc độ phản hồi của dịch vụ
- Có thể xảy ra xếp hàng yêu cầu
Khuyến nghị sử dụng: Kiểm tra liên thông API khi tích hợp lần đầu, kiểm thử tự động trong CI/CD

Flex — Cấp linh hoạt

Trường hợp sử dụng: Phát triển cá nhân, dự án độc lập, sử dụng hàng ngày
Đặc điểm:
- Cân bằng hiệu quả chi phí
- Tính ổn định dịch vụ tốt
- Hỗ trợ phần lớn các mô hình phổ biến
Khuyến nghị sử dụng: Công cụ cá nhân, tự động hóa script, dự án quy mô nhỏ và trung bình

Enterprise — Cấp doanh nghiệp

Trường hợp sử dụng: Môi trường sản xuất doanh nghiệp, hệ thống nghiệp vụ quan trọng
Đặc điểm:
- Tính ổn định dịch vụ và đảm bảo SLA cao nhất
- Lịch trình ưu tiên, độ trễ thấp
- Nhóm tài nguyên riêng, không bị ảnh hưởng bởi người dùng khác
- Hỗ trợ kỹ thuật chuyên dụng
Khuyến nghị sử dụng: Ứng dụng doanh nghiệp, backend sản phẩm SaaS, dịch vụ sản xuất tải cao

So sánh các cấp

Tính năng	Test	Flex	Enterprise
Chi phí	Thấp nhất	Trung bình	Cao hơn
Tính ổn định	Cơ bản	Tốt	Cao nhất
Tốc độ phản hồi	Bình thường	Nhanh	Nhanh nhất
Đảm bảo SLA	Không	Cơ bản	Đầy đủ
Hỗ trợ kỹ thuật	Cộng đồng	Ticket	Chuyên dụng
Trường hợp sử dụng	Thử nghiệm	Phát triển cá nhân	Sản xuất doanh nghiệp

Mô hình định giá

Định giá dựa trên lượng Token tiêu thụ, mỗi mô hình có đơn giá Token đầu vào và đầu ra khác nhau:

Token đầu vào: Token trong prompt và lịch sử hội thoại
Token đầu ra: Token trong phản hồi do mô hình tạo ra

Cùng một mô hình ở các cấp dịch vụ khác nhau có thể có giá khác nhau, cấp Enterprise có giá cao hơn một chút do cung cấp dịch vụ ổn định hơn.

Xem giá

Truy cập trang chủ để xem giá theo thời gian thực của tất cả mô hình, giá được hiển thị theo đơn vị mỗi triệu Token.

Theo dõi mức sử dụng

Giám sát việc sử dụng của bạn thông qua bảng điều khiển Portal:

Đăng nhập Portal
Vào trang Mức sử dụng
Xem chi tiết tiêu thụ Token và chi phí theo từng mô hình

Nạp tiền và thanh toán

Mô hình trả trước: Nạp tiền vào số dư tài khoản trước khi sử dụng
Khấu trừ theo thời gian thực: Token tiêu thụ được khấu trừ từ số dư theo thời gian thực
Không có phí ẩn: Chỉ tính phí theo lượng Token thực tế tiêu thụ

Giới hạn tốc độ

Giới hạn tốc độ khác nhau tùy theo cấp dịch vụ, chi tiết vui lòng xem thông tin hạn mức hiện tại trong bảng điều khiển. Cấp Enterprise hỗ trợ tùy chỉnh giới hạn tốc độ.