Tin tức và phân tích của tất cả các thiết bị di động

Bài kiểm tra Turing có lỗi thời không? 5 các bài kiểm tra Turing thay thế

Hơn 70 năm trước, khi trí tuệ nhân tạo được khái niệm hóa, Alan Turing đã xuất bản một bài báo mô tả cách xác định nó. Sau này nó được gọi là bài kiểm tra Turing và đã được sử dụng trong nhiều thập kỷ để phân biệt giữa trí tuệ con người và trí tuệ nhân tạo.

Tuy nhiên, với sự ra đời của các chatbot AI tiên tiến như ChatGPT và Google Bard, ngày càng khó để biết liệu bạn có đang nói chuyện với AI hay không. Điều này đặt ra câu hỏi; bài kiểm tra Turing có lỗi thời không? Và nếu vậy, các lựa chọn thay thế là gì?

Bài kiểm tra Turing có lỗi thời không?

Nguồn hình ảnh: Jesus Sanz/Shutterstock

Để xác định xem bài kiểm tra Turing có lỗi thời hay không, trước tiên bạn phải hiểu cách thức hoạt động của nó. Để AI vượt qua bài kiểm tra Turing, nó phải thuyết phục được người thẩm vấn rằng đó là con người. Tuy nhiên, có một nhược điểm – AI được đánh giá cùng với con người và phải phản hồi bằng văn bản.

Nghĩ theo cách này; Nếu bạn là người phỏng vấn và bạn đang đặt câu hỏi cho hai người tham gia trực tuyến qua tin nhắn, nhưng một trong số họ là mô hình AI, bạn có phân biệt được họ sau năm phút không? Lưu ý rằng mục đích của bài kiểm tra Turing không phải là xác định mô hình AI dựa trên các câu trả lời đúng mà là để đánh giá xem AI có thể suy nghĩ hoặc hành xử giống con người hay không.

Vấn đề với phương pháp thử nghiệm Turing chỉ xác định các phản ứng giống con người là các yếu tố khác không được tính đến. Ví dụ như trí thông minh của mô hình AI hay kiến ​​thức của người thẩm vấn. Ngoài ra, bài kiểm tra Turing chỉ giới hạn ở văn bản và ngày càng khó xác định AI tạo ra giọng nói của con người hoặc các video deepfake bắt chước hành vi của con người.

Tuy nhiên, các mô hình AI hiện nay như ChatGPT-4 và Google Bard, vẫn chưa phát triển đến mức có thể vượt qua Bài kiểm tra Turing một cách nhất quán. Trên thực tế, nếu biết AI, bạn có thể nhận dạng văn bản do AI tạo ra.

5 các lựa chọn thay thế tốt nhất cho bài kiểm tra Turing

Có thể các mô hình AI trong tương lai như ChatGPT-5có thể vượt qua bài kiểm tra Turing. Nếu điều đó xảy ra, chúng tôi cần nhiều bài kiểm tra khác nhau kết hợp với bài kiểm tra Turing để xác định xem chúng tôi đang nói chuyện với AI hay con người. Dưới đây là các lựa chọn thay thế thử nghiệm Turing tốt nhất:

1. Bài kiểm tra của Marcus

Gary Marcus, một nhà khoa học nhận thức và nhà nghiên cứu trí tuệ nhân tạo nổi tiếng, đã đề xuất một phương pháp thay thế cho bài kiểm tra Turing được công bố trên tạp chí The New Yorker để xác định khả năng nhận thức của trí tuệ nhân tạo. Bài kiểm tra rất đơn giản – bạn đánh giá mô hình AI dựa trên khả năng xem và hiểu video từ YouTube và các chương trình TV không có phụ đề hoặc văn bản. Để AI vượt qua bài kiểm tra Marcus, nó phải hiểu được những lời mỉa mai, hài hước, mỉa mai và cốt truyện trong khi xem phim và giải thích nó như một con người.

Hiện tại GPT-4 có thể mô tả hình ảnh, nhưng cho đến nay vẫn chưa có mô hình AI nào có khả năng hiểu video như con người. Xe tự lái hoạt động gần nhưng không tự động hoàn toàn và cần có cảm biến vì chúng không thể hiểu mọi thứ về môi trường.

2. Kiểm tra Turing trực quan

Theo một bài báo khoa học được xuất bản trên PNAS, bài kiểm tra Turing trực quan có thể được sử dụng để xác định xem bạn đang nói chuyện với con người hay trí tuệ nhân tạo bằng cách sử dụng bảng câu hỏi bằng hình ảnh. Nó hoạt động giống như bài kiểm tra Turing, nhưng thay vì trả lời câu hỏi bằng văn bản, người tham gia được xem hình ảnh và được yêu cầu trả lời các câu hỏi đơn giản bằng cách suy nghĩ như một con người. Tuy nhiên, bài kiểm tra Turing trực quan khác với CAPTCHA vì tất cả các câu trả lời đều đúng – nhưng để vượt qua bài kiểm tra, AI phải xử lý hình ảnh giống như con người.

Ngoài ra, nếu AI và con người được hiển thị nhiều hình ảnh cạnh nhau và được yêu cầu xác định hình ảnh thực tế, con người sẽ có khả năng nhận thức để vượt qua bài kiểm tra. Điều này là do các mô hình AI gặp khó khăn trong việc phân biệt giữa những bức ảnh trông không giống như được chụp trong thế giới thực. Trên thực tế, đây là lý do tại sao bạn có thể xác định những hình ảnh do AI tạo ra có những điểm bất thường vô nghĩa.

3. Thử nghiệm Lovelace 2.0

Lý thuyết cho rằng máy tính không thể tạo ra những ý tưởng độc đáo ngoài những gì nó được lập trình để thực hiện đã được Ada Lovelace đưa ra lần đầu tiên trước Bài kiểm tra Turing. Tuy nhiên, Alan Turing đã phản đối lý thuyết này, cho rằng trí tuệ nhân tạo vẫn có thể khiến con người ngạc nhiên. Mãi đến năm 2001, các hướng dẫn cho bài kiểm tra Lovelace mới được phát triển để phân biệt giữa AI và con người – và theo Kurzweilbrary, các quy tắc sau đó đã được thay đổi vào năm 2014.

Để AI vượt qua bài kiểm tra Lovelace, nó phải chứng minh rằng nó có thể tạo ra những ý tưởng độc đáo vượt xa quá trình đào tạo. Các mô hình AI hiện nay như GPT-4, không có khả năng phát minh ra những phát minh mới ngoài kiến ​​thức hiện tại của chúng ta. Tuy nhiên, trí tuệ nhân tạo tổng hợp có thể đạt được khả năng này và vượt qua bài kiểm tra Lovelace.

4. Kiểm tra Turing nghịch đảo

Còn phép thử Turing được thực hiện ngược lại thì sao? Thay vì cố gắng tìm hiểu xem bạn có đang nói chuyện với con người hay không, mục tiêu của bài kiểm tra Turing ngược là đánh lừa AI tin rằng bạn là AI. Tuy nhiên, bạn cần một mô hình AI khác để trả lời những câu hỏi tương tự bằng văn bản.

Ví dụ: nếu người thẩm vấn là ChatGPT-4, bạn có thể đăng ký Google Bard và một người khác làm người tham gia. Nếu mô hình AI có thể xác định chính xác con người dựa trên câu trả lời thì nó đã vượt qua bài kiểm tra.

Nhược điểm của thử nghiệm Turing ngược là nó không đáng tin cậy, đặc biệt khi xét đến việc đôi khi AI không thể phân biệt giữa nội dung do AI tạo ra và nội dung do con người viết ra.

5. Khung phân loại trí tuệ nhân tạo

Theo khung phân loại AI do Chris Saad phát triển, bài kiểm tra Turing chỉ là một phương pháp đánh giá để biết bạn có đang nói chuyện với AI hay không. Nói một cách ngắn gọn hơn, khung phân loại AI dựa trên lý thuyết trí tuệ đa dạng, đòi hỏi trí thông minh của con người phải đáp ứng ít nhất 8 tiêu chí khác nhau, bao gồm: nhịp điệu âm nhạc, trí thông minh logic-toán học, nhận dạng trực quan, trí tuệ cảm xúc, khả năng tự phản xạ. trí tuệ, khả năng tư duy hiện sinh và vận động cơ thể.

Vì AI được đánh giá dựa trên tám thông số khác nhau nên nó khó có thể được chuyển sang con người, ngay cả khi nó hoạt động tốt hơn mức trung bình ở một số điểm chuẩn. Ví dụ: ChatGPT có thể giải các bài toán, mô tả hình ảnh và nói chuyện bằng ngôn ngữ tự nhiên như con người, nhưng nó sẽ không xử lý các danh mục khác được xác định bởi phân loại AI.

Phép thử Turing không mang tính kết luận

Bài kiểm tra Turing được dự định là một thử nghiệm tư duy hơn là một bài kiểm tra rõ ràng về sự khác biệt giữa con người và trí tuệ nhân tạo. Khi được đề xuất ban đầu, nó là chuẩn mực quan trọng để đo lường trí thông minh của máy.

Tuy nhiên, với sự phát triển gần đây của các mô hình trí tuệ nhân tạo với khả năng tương tác giọng nói, thị giác và thính giác, bài kiểm tra Turing là chưa đủ vì nó chỉ giới hạn trong một cuộc trò chuyện bằng văn bản. Giải pháp hiệu quả nhất là giới thiệu các bài kiểm tra Turing thay thế, điều này sẽ giúp phân biệt rõ hơn các mô hình trí tuệ nhân tạo với mô hình con người.