Tin tức và phân tích của tất cả các thiết bị di động

OpenAI ra mắt một công cụ chính thức để xác định văn bản do AI tạo ra; Tìm chi tiết ở đây

Kể từ khi ChatGPT và các đối thủ của nó ra mắt, các ý kiến ​​​​về chatbot AI đã bị chia rẽ. Trong khi một số người cảm thấy nó quan trọng và tiết kiệm thời gian, một số người khác lại lo ngại về việc mọi người sử dụng AI để truyền bá thông tin sai lệch và đạo văn tác phẩm. OpenAI, công ty đứng sau bot AI lan truyền ChatGPT và trình tạo văn bản thành hình ảnh DALL-E, đã phát hành một công cụ Phân loại AI mới để xác định văn bản do AI viết. Trong thông cáo báo chí chính thức, OpenAI nêu chi tiết cách đào tạo Trình phân loại, các hạn chế của nó và các số liệu khác. Kiểm tra tất cả các chi tiết dưới đây.

Trình phân loại của OpenAI phân biệt văn bản AI với chữ viết của con người

Trong một thông cáo báo chí gần đây, công ty đã trình bày chi tiết cách công cụ Phân loại AI mới này nhằm giúp mọi người xác định văn bản AI. Công cụ này thực hiện điều đó bằng cách nhận thông tin đầu vào từ người dùng, sau đó chạy thông qua dữ liệu đã được đào tạo để phân loại dữ liệu đó là nội dung AI hoặc do con người tạo ra.

Trình phân loại AI là một mô hình ngôn ngữ và đã được đào tạo trên bộ dữ liệu bao gồm các cặp văn bản do con người và AI viết về cùng một chủ đề. OpenAI lưu ý rằng dữ liệu của con người đã được thu thập từ nhiều nguồn khác nhau mà họ tin là do con người viết ra. Văn bản này đã được chia thành các lời nhắc và phản hồi mà văn bản AI được tạo ra để thu thập tập dữ liệu đầy đủ.

Trình phân loại AI chưa hoàn toàn đáng tin cậy

Mặc dù công cụ mới nhằm mục đích giúp cuộc sống của chúng ta dễ dàng hơn (đặc biệt là giáo viên và giáo sư) khi nói đến AI, công ty đã tuyên bố rõ ràng rằng Trình phân loại AI không hoàn toàn đáng tin cậy và dễ mắc lỗi. Trong các đánh giá nội bộ của công ty, chuyên gia phân loại đã xác định chính xác 26% văn bản do AI viết là “có thể do AI viết”.

Nó tiếp tục xác định sai 9% văn bản của con người được viết bởi AI. Mặc dù tỷ lệ sai sót khá thấp nhưng rõ ràng là Trình phân loại không thể đánh lừa được. Hơn nữa, OpenAI còn đề cập rằng nó không đáng tin cậy đối với các văn bản ngắn bên dưới 1,000 ký tự.

“Bộ phân loại của chúng tôi có một số hạn chế quan trọng. Nó không nên được sử dụng như một công cụ ra quyết định chính mà thay vào đó là một công cụ bổ sung cho các phương pháp khác để xác định nguồn của một đoạn văn bản.”OpenAI

Công cụ này có một số hạn chế khác, bao gồm chỉ hỗ trợ đầu vào bằng tiếng Anh, khó đoán văn bản và hiệu chỉnh kém bên ngoài dữ liệu đào tạo. Vì tất cả những lý do đó và hơn thế nữa, chưa nên sử dụng Bộ phân loại AI mới này làm công cụ ra quyết định chính. Tuy nhiên, theo thời gian, chúng ta có thể mong đợi sự cải thiện khi có nhiều dữ liệu hơn được cung cấp cho nó.

Trình phân loại OpenAI hoạt động như thế nào trong thử nghiệm của chúng tôi

Trình phân loại văn bản AI của OpenAI (liên kết trang web) là một công cụ trực tuyến miễn phí sử dụng. Vì vậy, chúng tôi quyết định thực hiện một vòng quay ngắn và nó hoạt động tốt như bạn mong đợi ở giai đoạn này. Tôi đã thử nghiệm nhiều bài viết có độ dài vừa phải từ trang web của chúng tôi. Chúng bao gồm các mẩu tin tức và các bài báo nổi bật. Sau khi dán văn bản và chạy tool thì chúng ta nhận được phản hồi “Trình phân loại coi văn bản rất khó được tạo ra bởi AI.”

Để kiểm tra xem nó hoạt động tốt như thế nào, tôi đã yêu cầu ChatGPT viết một câu chuyện ngắn và sử dụng Trình phân loại để xem liệu nó có thể xác định câu chuyện đó có được viết bởi chính AI của nó hay không. Rất may, nó đưa ra phản hồi rằng văn bản “có thể do AI tạo ra”. Tôi đã thử tương tự với một số văn bản khác như The Merchant of Venice của Shakespeare và AI đã phát hiện ra khả năng có liên quan đến AI.

Như đã đề cập ở trên, Trình phân loại OpenAI sẽ hoạt động tốt hơn khi tập dữ liệu của nó tăng lên. Tuy nhiên, ngay cả cho đến khi điều đó xảy ra, bạn vẫn có thể tự do sử dụng công cụ này và tận hưởng nó. Vậy suy nghĩ của bạn về trình phát hiện văn bản AI là gì? Bạn có cảm thấy chúng cần thiết vào năm 2023 không? Hãy thả hai xu của bạn vào phần bình luận bên dưới.