▷ Hướng dẫn đầy đủ về phát hiện đạo văn chatbot AI

Các chatbot AI như ChatGPT không chỉ giúp trả lời các câu hỏi của bạn. Họ có thể viết email giống như con người, thư xin việc, tiểu luận, thơ, bài đăng trên blog, v.v.

Chữ viết của AI giống như một con tắc kè hoa – nó có thể hòa hợp tốt với bất kỳ kiểu viết nào khác đến mức khó có thể phân biệt được.

Thật không may, điều này khiến con người chúng ta cực kỳ khó phát hiện khi nào AI đã viết thứ gì đó thay vì một người. Chắc chắn, tất cả chúng ta đều có thể nghe theo lời khuyên của Sherlock Holmes và “loại bỏ những điều không thể”, nhưng ai có thời gian cho việc đó?

Nếu tôi nói với bạn rằng đoạn văn trên được viết bởi trí tuệ nhân tạo thì sao? Có, tôi đã nhờ YouWrite viết một đoạn giới thiệu ngắn cho bài đăng này và điều đó đã xảy ra. Khá thuyết phục phải không? Vấn đề ở đây là nó quá thuyết phục đến mức bất cứ ai cũng có thể coi nó là tác phẩm của mình để tận dụng.

AI không chỉ định dạng lại nội dung; họ tìm hiểu chủ đề và trình bày nó bằng ngôn ngữ tự nhiên bằng RLHF. Điều này có nghĩa là nội dung được tạo ra sẽ không được đọc như robot, cũng như không được so sánh với dữ liệu có sẵn trực tuyến để phát hiện đạo văn.

Việc nắm bắt nội dung do AI tạo ra không hề dễ dàng và tôi sẽ không tạo cho bạn hy vọng hão huyền rằng bạn có thể nắm bắt được nội dung đó với độ chính xác 100%. Tuy nhiên, với một chút công việc thám tử và sự trợ giúp của các công cụ phát hiện chữ viết AI, hầu hết các công việc AI đều có thể bị bắt.

Dưới đây bạn sẽ tìm thấy các cách thủ công để phát hiện đạo văn AI cũng như một số công cụ tự động.

Phát hiện đạo văn AI theo cách thủ công 🕵️

ChatGPT thậm chí không phải là vấn đề lớn khi nói đến vấn đề đạo văn AI. Có nhiều công cụ thay thế dựa trên cùng công nghệ GPT-3 và được tạo ra để viết. Chúng rất tiên tiến và được thiết kế đặc biệt để tạo ra nội dung giống con người mà khó nắm bắt.

Các công cụ tự động khám phá có đôi chút sai sót tùy thuộc vào loại nội dung, độ dài và độ phức tạp. Vì vậy, ít nhất hiện tại, cách tốt nhất là kết nối các dấu chấm theo cách thủ công để tìm hiểu xem bản ghi có phải do AI tạo ra hay không.

Dưới đây, tôi đã liệt kê một số mẹo phổ biến mà bạn có thể tìm kiếm để nắm bắt nội dung do AI tạo.

# 1. Thông tin lỗi thời

ChatGPT và các AI dựa trên GPT khác3 mất kiến thức vào cuối năm 2021. Mặc dù một số bot AI có công cụ tìm kiếm tích hợp để tìm thông tin mới nhất nhưng chúng vẫn dựa vào dữ liệu cũ để viết nội dung dài như bài tiểu luận hoặc bài đăng trên blog.

Nếu bạn nhận thấy bài viết liên tục nói về những dữ liệu đã lỗi thời, đặc biệt là trước năm 2021 thì đó có thể là do AI tạo ra.

Trong ảnh chụp màn hình bên dưới, tôi đã yêu cầu YouWrite kể cho tôi nghe về FIFA World Cup gần đây và đây là những gì họ nghĩ ra.

Nó đang nói về World Cup 2018, không phải giải cuối cùng từ năm 2022. Mặc dù công cụ này đã được cập nhật để nói về các sự kiện gần đây như World Cup 2022, nhưng nó vẫn sử dụng dữ liệu lỗi thời được xây dựng để viết những bài đăng dài.

#2. Sử dụng cấu trúc câu giống nhau để mô tả

Khi viết nhiều mô tả sản phẩm/ứng dụng, AI thường sử dụng cùng một cấu trúc câu và chỉnh sửa để phù hợp với mô tả sản phẩm. Mô tả thường bắt đầu bằng cùng một từ, chẳng hạn như The, It, A hoặc tên sản phẩm. Mô tả cũng có trọng tâm chuyên dụng lặp đi lặp lại.

Ví dụ bên dưới, tôi đã yêu cầu ChatGPT cho tôi biết về “trang web việc làm”. Bạn có thể thấy rằng tất cả các mô tả đều bắt đầu bằng chữ “A” và rất cụ thể.

Tôi cũng đã hỏi YouChat câu hỏi tương tự và anh ấy cũng làm như vậy và lặp lại tên của từng trang web ở đầu và bản thân các mô tả trông giống như phiên bản được viết lại của mỗi trang web.

Nếu mô tả bạn đang phân tích bao gồm mô tả về điều gì đó tương tự về bản chất thì đây là một cách tuyệt vời để nắm bắt cách viết của AI.

#3. Sử dụng câu ngắn

Đối với hầu hết các mô tả, AI sẽ sử dụng các câu một dòng có nhiều nhất một dấu phẩy. Họ có thể đang cố gắng giảm thiểu nguy cơ mắc lỗi nhưng tránh viết những câu dài có thể yêu cầu sử dụng dấu hai chấm, dấu chấm phẩy hoặc dòng kẻ ngang dày.

Tôi biết đây không phải là mẹo tốt nhất để bắt AI gõ phím, nhưng nó đáng để xem xét để chứng minh thêm sự nghi ngờ của bạn.

#4. Có thể cung cấp thông tin không chính xác

Đối với những câu hỏi phức tạp, thường liên quan đến một số loại hướng dẫn, AI có thể không hiểu ý định và cung cấp thông tin không chính xác. Ở đây tôi không nói đến những thông tin lỗi thời, họ chỉ tự tin đưa thông tin sai khi không hiểu rõ chủ đề.

Ví dụ: tôi đã yêu cầu YouWrite cho tôi biết “cách root điện thoại Android mà không cần máy tính”. Anh ấy tiếp tục chỉ cho tôi những phương pháp yêu cầu sử dụng máy tính ở một số điểm trong hướng dẫn.

#5. Không thêm quan điểm cá nhân

Khi nói về điều gì đó, AI chỉ đơn giản nói về những sự thật đã biết. Không giống như mọi người, cô ấy sẽ không nói về những trải nghiệm cá nhân của mình với anh ấy. Mặc dù AI có thể được hướng dẫn để tạo một bản ghi khả thi nhưng theo mặc định, chúng tránh làm như vậy.

Nếu bạn nhận thấy rằng phần mô tả chỉ nói đến những sự thật nổi tiếng thì rất có thể nó được viết bởi trí tuệ nhân tạo. Ví dụ: khi nói về một ứng dụng, người ta sẽ nói về các tính năng của nó chứ không phải việc điều hướng mượt mà hay cách sử dụng ứng dụng đúng cách.

#6. Giải thích ngắn gọn

Vì AI bị giới hạn bởi kiến thức hiện có nên chúng có xu hướng viết những lời giải thích và mô tả ngắn gọn. Theo kinh nghiệm của tôi, nếu họ đang nói về một chủ đề cụ thể – chẳng hạn như root Android – họ sẽ giải thích nhiều nhất bằng 2-3 đoạn văn. Đối với các ứng dụng hoặc sản phẩm, phần mô tả thường không vượt quá 1 đoạn văn.

Mọi người có thể viết về điều gì đó một cách chi tiết, bao gồm các tính năng, hạn chế, trải nghiệm cá nhân, giá cả, v.v. Mặt khác, AI có xu hướng tập trung vào các tính năng chính hoặc điểm nổi bật nên phần mô tả cũng ngắn gọn. Nếu người hướng dẫn hỏi thêm chi tiết, khả năng thông tin không chính xác sẽ tăng lên đáng kể.

#7. Tham khảo câu chuyện của nhà văn

Với tư cách là giáo viên hoặc quản trị viên web, nếu bạn có quyền truy cập vào tác phẩm hoặc bài tập trước đây của người viết, bạn có thể so sánh chúng với bài viết mà bạn không chắc chắn về nó. Rất khó có khả năng người viết có phong cách viết tương tự như AI. Mặc dù AI có thể thay đổi giọng điệu trong văn bản của bạn nhưng phong cách mà nó chọn khá chung chung và không thể sao chép giọng điệu của bạn.

Lấy ví dụ từ đoạn văn được tạo ra bởi trí tuệ nhân tạo trong phần giới thiệu bài viết này. Ai đã đọc những bài viết trước đây của tôi sẽ dễ dàng nhận thấy phong cách viết của tôi hoàn toàn khác.

Bạn chỉ có thể đọc 2-3 tác phẩm trước đây của người viết và xem liệu nó có phù hợp với phong cách viết của hồ sơ nghi phạm hay không.

Công cụ phát hiện đạo văn AI

Có rất nhiều công cụ có thể phát hiện nội dung được viết bởi AI. Tuy nhiên, độ chính xác của chúng khác nhau và có thể thất bại tùy thuộc vào loại nội dung và độ dài.

Tôi đã thử nghiệm các công cụ này bằng cách sử dụng các loại nội dung khác nhau được tạo bởi ChatGPT, GPT-3 Sân chơi, WriteSonic, Rytr và YouWrite. Họ có thể phát hiện tất cả các loại nội dung được tạo bởi ChatGPT và GPT-3 sân chơi.

Mặc dù họ có nhiều kết quả khác nhau đối với các công cụ viết chuyên dụng, nhưng điều thú vị là tất cả họ đều không phát hiện ra YouWrite. Tôi đoán điều này là do YouWrite mắc lỗi do con người gây ra để tránh bị phát hiện.

Tôi khuyên bạn nên sử dụng những công cụ này cùng với việc kiểm tra nội dung thủ công. Đầu tiên, hãy phân tích nội dung bằng một trong những công cụ này, sau đó kiểm tra thủ công mọi manh mối để xác nhận nghi ngờ của bạn.

Dưới đây là những cái mang lại kết quả tốt nhất và dễ sử dụng nhất:

Lưu ý: Để minh họa, tôi sẽ sử dụng văn bản được tạo từ WriteSonic về chủ đề “Lợi ích của xoài”.

# 1. Nội dung quy mô lớn

Trong hầu hết các thử nghiệm tôi đã thực hiện, trình phát hiện nội dung AI của Content At Scal là chính xác nhất. Nó cho phép bạn quét tối đa 2500 ký tự mỗi lần quét và đưa ra dự đoán tỷ lệ phần trăm hiển thị mật độ nội dung đúng hoặc sai.

Có thể an toàn khi cho rằng nội dung giả mạo hơn 60% là do AI viết hoặc ít nhất là phần lớn nội dung đó. Trong ảnh chụp màn hình bên dưới, bạn có thể thấy 96% nội dung là giả mạo do tôi tạo hoàn toàn bằng trí tuệ nhân tạo.

#2. GPTZero

Nếu bạn muốn xem chính xác nội dung nào được AI tạo ra, GPTZero là một lựa chọn tốt. GPTZero không xếp hạng nội dung. Thay vào đó, nó làm nổi bật chính xác nội dung có thể do AI tạo ra.

Mặc dù nó hiển thị kết quả giật và xé để có ý tưởng về tính ngẫu nhiên của văn bản, nhưng quan trọng hơn, nó hỗ trợ 5000 ký tự cho mỗi lần quét và cũng có thể truyền tệp. Quét nội dung lớn giúp cải thiện độ chính xác rất nhiều.

#3. Máy dò đầu ra GPT-2

Những người tạo ra ChatGPT cũng cung cấp bot để phát hiện tác phẩm của chính bạn. Bởi vì GPT-2 và GPT-3 chỉ khác nhau về tổng dữ liệu được sử dụng để đào tạo, trình phát hiện GPT này-2 cũng hoạt động tốt với AI dựa trên GPT3.

Không có giới hạn về số lượng nội dung được quét, vì vậy đây là giải pháp lý tưởng để phát hiện nội dung rất dài do AI tạo ra. Tôi cũng nhận thấy độ chính xác của nó ở mức tốt, đặc biệt đối với nội dung do ChatGPT tạo. Tuy nhiên, nó hơi kém khả năng dự đoán, vì vậy chỉ xem xét kết quả của nó nếu nó hiển thị hơn 50% nội dung là sai.

#4. Trình phát hiện nội dung AI của nhà văn

Kết quả của Writer AI Content Detector còn đáng nghi ngờ khi phát hiện nội dung từ các công cụ viết AI, nhưng nó hoạt động rất tốt đối với nội dung do ChatGPT tạo ra. Bạn có thể quét 1500 ký tự cho mỗi lần quét và thậm chí thêm URL nội dung nếu nó đã được xuất bản.

Trong văn bản thử nghiệm do AI tạo của tôi có ghi rằng 94% nội dung là do con người tạo ra, điều này khá sai so với các công cụ khác. Tuy nhiên, vẫn đáng sử dụng nó để phát hiện nội dung ChatGPT, đặc biệt nếu nó đã được xuất bản.

#5. Phác thảo và nhắm mục tiêu

Công cụ phát hiện chữ viết tay AI đơn giản nhưng mạnh mẽ. Theo kinh nghiệm của tôi, Bản nháp & Mục tiêu mang lại kết quả tương tự như Nội dung theo tỷ lệ, nhưng không có giới hạn từ nên có thể quét các bản ghi dài. Tuy nhiên, thời gian quét tăng lên tùy thuộc vào lượng nội dung bạn quét.

Trong văn bản ví dụ của tôi có ghi rằng 94% văn bản được tạo ra bởi trí tuệ nhân tạo.

Suy nghĩ của tôi 💭

Cá nhân tôi nghĩ rằng hỗ trợ AI là một cách thực sự tuyệt vời để loại bỏ sự cản trở của người viết, thu thập tất cả thông tin của bạn ở một nơi và tìm thấy nguồn cảm hứng. Tuy nhiên, nó không bao giờ nên thay thế chữ viết tay của con người vì AI bị giới hạn ở những gì đã biết.

Bạn cũng có thể xem các công cụ kiểm tra đạo văn tốt nhất để ngăn chặn việc sao chép.

Mục lục

Hướng dẫn đầy đủ về phát hiện đạo văn chatbot AI