Tin tức và phân tích của tất cả các thiết bị di động

OpenAI ra mắt ‘GPTBot’: trình thu thập dữ liệu web giúp AI thông minh hơn

OpenAI ra mắt GPTBot: một công cụ tìm kiếm tài liệu trên Internet để làm cho hệ thống AI thông minh hơn.

Đọc sách giúp bạn thông minh hơn. Đó là quy tắc không chỉ áp dụng cho trẻ em mà còn cho cả hệ thống AI. Để tinh chỉnh các mô hình ngôn ngữ của họ, OpenAI hiện đang giới thiệu GPTBotmột công cụ tìm kiếm trên Internet để học hỏi từ bất cứ điều gì nó có thể tìm thấy.

Nói một cách cụ thể, GPTBot tốt nhất có thể được gắn nhãn là ‘trình thu thập thông tin’. Những công cụ như vậy xuất hiện khắp nơi trên internet, tìm kiếm dữ liệu có thể truy cập công khai. Dữ liệu đó có thể được sử dụng để phát triển các mô hình ngôn ngữ như GPT 4 thông minh hơn và chính xác hơn. Các mô hình ngôn ngữ hiện tại, GPT 3.5 và GPT 4đã được đào tạo với dữ liệu cho đến tháng 9 năm 2021. Với GPTBot, nhiều dữ liệu gần đây hơn cũng có thể được thêm vào và ChatGPT có thể phản hồi tốt hơn với các sự kiện hiện tại.

OpenAI dường như đã chú ý đến: công ty trước đây đã bị mất uy tín vì cách thu thập dữ liệu. Công ty AI nhiều lần bị cáo buộc “đánh cắp” dữ liệu cá nhân để đào tạo hệ thống AI của mình. GPTBot được phát triển theo cách nó có thể loại trừ một số nguồn nhất định. Do đó, tài liệu nằm sau tường phí hoặc các nguồn thường chứa thông tin cá nhân có thể tự động tránh được.

Bạn có sở hữu hoặc quản lý trang web của riêng bạn? Khi đó, bạn không nhất thiết phải cấp cho GPTBot quyền truy cập vào dữ liệu được thu thập ở đó. Thậm chí có thể cấp cho GPTBot quyền truy cập vào một phần nhất định của trang web và khóa một phần khác. Điều này có thể được thực hiện bằng cách chặn địa chỉ IP của bot hoặc bằng cách điều chỉnh tệp Robots.txt trên trang web của bạn.

Bài viết nổi bật OpenAI đưa công cụ phát hiện AI ngoại tuyến do kết quả kém