Tin tức và phân tích của tất cả các thiết bị di động

OpenAI ra mắt API cho ChatGPT và Whisper: quyền truy cập, giá cả, cách sử dụng, tất cả những điều cần biết

Chỉnh sửa ngày 07 tháng 7 lúc 9:28 sáng: OpenAI thông báo rằng API GPT4 hiện có sẵn cho tất cả khách hàng API ChatGPT hiện tại “có lịch sử thanh toán thành công”. Công ty Mỹ có kế hoạch mở rộng khả năng tiếp cận cho các nhà phát triển mới vào cuối tháng.

Sau khi ra mắt gói đăng ký ChatGPT Plus vào tháng 2 năm ngoái, OpenAI tiếp tục phát triển bằng cách giới thiệu hai API mới cho các mô hình ChatGPT và Whisper của nó. Mục tiêu là cung cấp cho các nhà phát triển quyền truy cập vào các tính năng ngôn ngữ và chuyển văn bản thành giọng nói nâng cao.

Thông qua một loạt tối ưu hóa trên toàn hệ thống, chúng tôi đã giảm được 90% chi phí ChatGPT kể từ tháng 12; OpenAI chỉ ra rằng chúng tôi hiện đang chuyển những khoản tiết kiệm đó cho người dùng API.

API ChatGPT cho dịch vụ đàm thoại nâng cao

API ChatGPT được cung cấp bởi GPT-3.5 turbo, mô hình AI tương tự như trình tạo văn bản ChatGPT. Về mặt giá cả, bạn phải tính đến 00,002 USD cho 1 000 token, nghĩa là “Rẻ hơn 10 lần” hơn các mẫu GPT khác 3.5 từ OpenAI.

Một số công ty đã bắt đầu sử dụng API ChatGPT, chẳng hạn như Snapchat vừa ra mắt một chatbot có thể tùy chỉnh có tên My AI dành cho người dùng Snapchat+, gói đăng ký trả phí của Snapchat. Shopify cũng đã tận dụng API cho ứng dụng của mình cửa hàng. Trợ lý mua sắm mới được hỗ trợ bởi AI của nó có thể quét hàng triệu sản phẩm để tìm thấy những gì khách truy cập đang tìm kiếm nhanh hơn và đưa ra câu trả lời phù hợp hơn.

Yêu cầu quyền truy cập API

Người dùng API ChatGPT có thể mong đợi những cải tiến liên tục về mô hình và khả năng chọn khả năng chuyên dụng để kiểm soát mô hình tốt hơn.

API Whisper để phiên âm và dịch thuật

Vào tháng 9 năm 2022, OpenAI đã phát hành Thì thầmmô hình tích hợp nhận dạng giọng nói tự động (ASR, Nhận dạng giọng nói tự động). Khả năng của nó: phiên âm sang nhiều ngôn ngữ và dịch từ các ngôn ngữ này sang tiếng Anh. Whisper hỗ trợ các định dạng sau: m4a, mp3, mp4, mpeg, mpga, wav, webm. Về mặt giá cả, bạn phải tính đến 00,006 USD mỗi phút. Xin nhắc lại, mô hình này đã được đào tạo trên 680.000 giờ dữ liệu đa ngôn ngữ và đa nhiệm được thu thập trên web.

Các nhà phát triển hiện có thể sử dụng mô hình Whisper big-v2 mã nguồn mở của chúng tôi trong API với kết quả nhanh hơn và tiết kiệm chi phí hơn nhiều, OpenAI nêu bật.

Trong bài đăng trên blog của mình, OpenAI nêu bật ví dụ về nói chuyện, một ứng dụng học ngôn ngữ nổi tiếng ở Hàn Quốc đã chuyển sang API Whisper để cung cấp sản phẩm đồng hành và sản phẩm học tiếng Anh AI mới. Công ty Mỹ nhấn mạnh lợi thế của mô hình của mình: “Độ chính xác ở cấp độ con người của Whisper dành cho người học ngôn ngữ ở mọi cấp độ kỹ năng cho phép thực hành trò chuyện cởi mở và phản hồi có độ chính xác cao.” »