Tin tức và phân tích của tất cả các thiết bị di động

CAPTCHA là gì? Nó đã phát triển như thế nào?

CAPTCHA, có sẵn trên mọi trang web ngày nay, dù bí mật hay công khai, được Google phát triển trong những năm gần đây là gì? Trong bài viết này, chúng tôi mô tả điểm đáng kinh ngạc mà CAPTCHA đã đạt được ngày hôm nay, bắt đầu từ sự xuất hiện của nó.

Ngày nay, mọi người dùng internet đều thực hiện một bài kiểm tra mà họ phải hoàn thành thành công trong khi thực hiện các hoạt động khác nhau trên hầu hết mọi trang web mà họ truy cập, ngay cả khi vào trang web: MÃ NGẪU NHIÊN. Được phát triển bởi nhóm tại Trường Khoa học Máy tính Carnegie Mellon, bài kiểm tra này được sử dụng để xác định xem khách truy cập vào trang web có phải là người thật hay không.

CAPTCHA đã đưa ra nhiều chủ đề khác nhau cho đến nay. Hôm nay, anh ấy bắt chúng tôi chọn đèn giao thông hoặc yêu cầu chúng tôi chọn những bức tranh có chứa một đối tượng nào đó trong số một số bức tranh. Chà, thứ khiến chúng ta hết lần này đến lần khác bị suy nhược thần kinh, “Tôi có phải là người máy không?CAPTCHA, khiến chúng tôi phải suy nghĩ cho mục đích gì và nó đã được phát triển như thế nào và cho đến nay Nó đã phát triển như thế nào? Hãy cùng tìm hiểu bài kiểm tra này mà chúng ta phải đối mặt hàng ngày.

  • Ghi chú: Tôi khuyên bạn nên đọc toàn bộ bài báo, vì công nghệ liên tục được phát triển bằng cách thêm vào nó. Nếu không thì Bạn có thể bỏ lỡ các liên kết đến các điểm quan trọng.

Trước hết, CAPTCHA là gì?

MÃ NGẪU NHIÊN, “Cđầy đủ Mộttự động hóa Public Tkiểm tra mệt mỏi để cho biết Computers và Hmong Mộtphần (Kiểm tra Turing Chung hoàn toàn tự động để Tách biệt Máy tính và Con người). người hỏi, thuật toán của CAPTCHA nó là chính nó. Chúng tôi cần chứng minh với người thẩm vấn rằng chúng tôi không phải là máy tính trong các câu trả lời của chúng tôi đối với CAPTCHA. Tuy nhiên, nếu chúng tôi trả lời đúng, chúng tôi sẽ vượt qua bài kiểm tra Turing và nhận được nội dung chúng tôi muốn.

CAPTCHA ra đời như thế nào?

CAPTCHA tại Trường Khoa học Máy tính Carnegie Mellon Luis von Ahn Được phát triển bởi Manuel Blum, Nicholas J. Hopper và John Langford với sự đồng hành của các đạo diễn. Nếu ý tưởng cải thiện hệ thống cảm ơn một công ty khổng lồ đã xuất hiện. Luis von Ahn đã kể câu chuyện về sự phát triển của hệ thống bằng lời của chính mình.

Năm 2000, vẫn đang học năm nhất tiến sĩ, Luis đã là một trong những công ty khổng lồ thời bấy giờ. Bài phát biểu của kỹ sư trưởng của Yahoo đã tham gia. Chủ đề của cuộc trò chuyện là Yahoo bằng cách nào đó 10 vấn đề anh ấy không thể giải quyết. Một trong những vấn đề này đã khơi dậy ý tưởng của Luis và nhóm của anh ấy về CAPTCHA, điều này đã khiến chúng ta phải đổ mồ hôi cho ngày hôm nay và gây ra các cuộc tranh luận về trí tuệ nhân tạo trong những năm qua.

Yahoo vào thời điểm đó lập trình viên để mở hàng triệu địa chỉ email Anh ấy đang cố gắng đối phó với người dùng của mình và anh ấy không thể vượt qua nó. Các chương trình được viết ra có thể tạo một địa chỉ e-mail bằng cách chỉ cần điền vào biểu mẫu trên Yahoo và có thể làm điều này không ngừng. Yahoo khổng lồ không thể đi trước nó.

Luis von Ahn và nhóm của ông cũng đã đưa ra một giải pháp rất hợp lý cho việc này: Một bài kiểm tra để phân biệt giữa máy tính và con người. Tóm lại, bài kiểm tra này dành cho mọi lứa tuổi và trên toàn thế giới. phải được giải quyết bởi bất kỳ con người nào, nhưng máy tính không nên vượt qua bài kiểm tra này. Đó thực sự là một phần khó khăn. Nhưng nhóm nghiên cứu đã hướng đến bản chất con người vì điều này: Chúng tôi có thể dễ dàng tạo các ký tự và văn bản. Chúng tôi có thể nhận dạng ngôn ngữ bất kể hình thức và môi trường mà họ đang ở. Nhưng máy tính chỉ có thể nhận ra những ký tự này như được hiển thị cho chúng. Tất nhiên, điều này đúng với máy tính thời đó. Chúng tôi sẽ nói về vấn đề này ngay sau đây.

Đây là cách hệ thống CAPTCHA đầu tiên xuất hiện:

Phiên bản đầu tiên của các bài kiểm tra được hiển thị cho người dùng trong CAPTCHA, không thay đổi bao gồm hai từhiển thị méo mó nó là một loạt. Máy tính đã đưa ra câu trả lời chính xác cho câu hỏi này và người dùng được yêu cầu câu trả lời đó. Trong khi con người có thể nhận ra các ký tự bị bóp méo, máy tính không thể tự động nhận ra những ký tự này, vì vậy chúng không thể hoàn thành bài kiểm tra.

Yahoo đã bắt đầu sử dụng phiên bản CAPTCHA đầu tiên này trên trang soạn email nơi nó gặp sự cố. Trong những tuần đầu tiên mà CAPTCHA được thêm vào, hệ thống đã được sử dụng hàng triệu lần và thực sự đã thành công trong việc tách con người khỏi máy tính. Nhưng với hệ thống này, một vấn đề lớn bắt đầu xuất hiện: Trí tuệ nhân tạo phát triển với các câu trả lời được đưa ra và thậm chí Câu trả lời của CAPTCHA đã được bán trên thị trường chợ đen.

CAPTCHA đã làm cho máy tính trở nên thông minh trong khi tách biệt máy tính và con người:

Những câu trả lời này, cùng với câu trả lời của người dùng cho CAPTCHA, thực sự đã được ghi lại ở đâu đó. Do đó, khi một máy tính gặp CAPTCHA có câu trả lời đã biết, nó đã vượt qua bài kiểm tra thành công bằng cách dán câu trả lời đó và được máy tính xác định là ‘con người’. Trên thực tế, tình trạng này trở nên nghiêm trọng đến mức các ‘trang trại CAPTCHA’ đã được thành lập và những người làm việc với tiềnbằng cách giải quyết hàng nghìn CAPTCHA, các bài kiểm tra này đã lưu câu trả lời đúng cho bot. Do đó, CAPTCHA buộc phải nâng cấp lên phiên bản thứ hai.

Phiên bản thứ hai CAPTCHA: reCAPTCHA:

Sự phát triển tiếp theo của CAPTCHA diễn ra vào năm 2005. Lần này là CAPTCHA, ‘reCAPTCHA‘ đã được đặt tên. Trong phiên bản này, hai từ không còn là nghĩa đen nữa, trong đó ai đó đã được thực hiện có thể thay thế. Một trong những từ là từ mà máy tính biết câu trả lời, và từ còn lại là từ ngẫu nhiên từ sách, bài báo hoặc bất kỳ nội dung nào khác có ký tự bất thường. Máy tính không biết câu trả lời cho từ đó. Vậy làm thế nào máy tính biết được câu trả lời cho từ thứ hai đó có đúng không?

reCAPTCHA là hai từ giống nhau, một từ được máy tính biết đến và từ còn lại không được biết đến, không phải đối với một người dùng nào, đã hiển thị cho nhiều người dùng. Vì vậy, nhiều người dùng hỏi cùng một câu hỏi câu trả lời được coi là đúng vì nó đưa ra cùng một câu trả lời. Trong quá trình này, hàng nghìn bài báo và sách có lỗi chính tả đã được quét thủ công và từ thứ hai được hình thành.

Việc Google mua lại reCAPTCHA đã làm cho hệ thống trở nên thông minh hơn:

Đến năm 2009, Google mua lại reCAPTCHA. Một trong những điều đầu tiên công ty làm là tạo ra từ thứ hai. những gì cần thiết là tự động hóa quá trình quét. Những dòng chữ có nền xám trông như được lấy ra từ cuốn sách cũ mà chúng tôi nhìn thấy thực ra được lấy từ những cuốn sách cũ. Với phương pháp này của công ty, máy tính quét văn bản đã có thể nhận ra các dạng chữ bị hỏng. Máy tính không còn gặp khó khăn khi nhận dạng một từ bị cắt xén khi hiển thị. Máy tính đã học cách đọc các văn bản bị cắt xén.

Một cuộc thử nghiệm do Google thực hiện trong lĩnh vực máy học vào năm 2014 cũng tiết lộ máy tính thông minh khủng khiếp như thế nào. Theo kết quả của bài kiểm tra này, mọi người không thể bỏ sót những từ viết sai chính tả. 33% chính xác có thể đọc. Trí tuệ nhân tạo, từng thậm chí không thể phát hiện các ký tự mở rộng, đã bị loại khỏi thử nghiệm này. 99%,8 tỷ lệ có kết quả chính xác. Do đó, trong phương pháp CAPTCHA, đến một sự thay đổi mang tính cách mạng Không còn.

Phiên bản thứ hai của phiên bản thứ hai: reCAPTCHA V2 và Không có CAPTCHA reCAPTCHA

Sau khi thử nghiệm cùng năm reCAPTCHA V2 phiên bản đã được nâng cấp. Trong phiên bản này, người dùng không còn gặp phải các văn bản như hiện nay. với hình ảnh đã gặp. Cho người dùng chọn hình ảnh với một đối tượng cụ thể no đa noi răng. Tuy nhiên, GoogleKhông có CAPTCHA reCAPTCHA (ReCAPTCHA Non-CAPTCHA) ”, ông cũng đưa vào hoạt động một hệ thống.

Những cái tên đầu tiên sử dụng hệ thống vào thời điểm đó là Snapchat, WordPress và HumbleBundle. Với hệ thống mới, người dùng có thể “Tôi không phải là người máy”Bắt đầu nhìn thấy hộp điều khiển. Về cách thức hoạt động của hệ thống, nó thực sự quản lý để tách người dùng khỏi máy tính ở một mức độ lớn trước khi thử nghiệm.

Một hệ thống luôn đi sau được gọi là “Phân tích rủi ro nâng cao” đang theo dõi sự tương tác của người dùng với trang web. Có, chúng tôi liên tục bị theo dõi trên Internet. Nó thậm chí còn ghi lại cách chúng tôi điều hướng trang, cải tiến công nghệ. Nếu hành vi của người dùng khớp với hành vi được mong đợi từ một con người thực, bạn có thể nhấp vào Tôi không phải là rô bốt. bạn không nhận được bất kỳ bài kiểm tra nàoNó đã được xác nhận rằng bạn là con người. Nhưng tương tác không phù hợp với sự tương tácnghĩa là, nếu máy tính nghĩ rằng máy tính đã vào trang web, chúng sẽ Nó đang hiển thị CAPTCHA. Các CAPTCHA này cũng là CAPTCHA hình ảnh đi kèm với reCAPTCHA V2.

Xác minh hình ảnh của reCAPTCHA V2 tất nhiên cũng cải thiện trí thông minh nhân tạo. Nhưng lần này câu trả lời của bạn chủ yếu không phải do cướp biển, được sử dụng bởi google. Thậm chí ngày nay, Google sử dụng câu trả lời của chúng tôi cho CAPTCHA để phân biệt các đối tượng trong một hình ảnh. Vì vậy, ví dụ, một chiếc ô tô tự lái có thể băng qua một cái cây, một họng cứu hỏa, một đèn giao thông hoặc một lối sang đường dành cho người đi bộ. có thể phát hiện. Như bạn có thể thấy, hệ thống này, cho phép chúng tôi sử dụng internet một cách an toàn, cho phép Google phát triển hơn nữa. Đôi bên cùng có lợi.

ReCAPTCHA hôm nay: reCAPTCHA V3

Google ra mắt phiên bản reCAPTCHA đầu tiên để hiển thị các bài đăng 4 Nó đã hoàn toàn ngừng hoạt động vào tháng 4 năm 2018. Ngày nay, nhiều trang web vẫn có thể tiếp tục sử dụng reCAPTCHA V2. Tuy nhiên, ngoài bài kiểm tra vật lý có sẵn này, reCAPTCHA V3, được phát hành vào ngày 29 tháng 10 năm 2018, cũng được sử dụng. reCAPTCHA V3, dùng reCAPTCHA V2 trở nên cao cấp hơn đã mang lại.

Các trang web sử dụng V3 thay vì reCAPTCHA V2 kể từ năm 2018, không yêu cầu bất kỳ tương tác nào của người dùng. Các trang web này không hiển thị bài kiểm tra CAPTCHA. Ngược lại, thông báo cho chủ sở hữu của các trang web trong trường hợp có lưu lượng truy cập rủi ro. Trải nghiệm người dùng không bị suy giảm theo bất kỳ cách nào bởi CAPTCHA. Việc loại bỏ rủi ro được để hoàn toàn cho chủ sở hữu trang web.

Sẽ rất hữu ích khi giải thích logic hoạt động này với ví dụ về Google. Bạn sở hữu một trang web mua sắm và gần đây đã thấy một lượng truy cập cao vào trang web của bạn. Nhưng lưu lượng truy cập này không được chuyển đổi thành chuyển đổi theo bất kỳ cách nào. Vì vậy, bạn nghĩ rằng họ không phải là khách hàng thực sự. Tại thời điểm này, tất cả những gì bạn biết là trang web của bạn đang nhận được lượng truy cập cao. Tuy nhiên, lưu lượng này Bạn không biết nó đang nhắm đến mục tiêu gì, nó đang làm gì trên trang web của bạn.

Đó chính xác là những gì reCAPTCHA V3 cho bạn biết. Hệ thống reCAPTCHA V3, mà bạn thêm vào từng trang riêng biệt, theo dõi mọi mục nhập được thực hiện trên trang web. Ví dụ: hệ thống bạn thêm vào trang đánh giá sản phẩm của mình cho bạn biết rằng các bot đã vào trang này để bình luận. Mỗi giao dịch được chấm điểm bởi reCAPTCHA và chủ sở hữu trang web có thể phân biệt giữa nhận xét thực và nhận xét bot. Phân biệt bot là sự tương tác trên trang web được sử dụng trong No CAPTCHA reCAPTCHA. bằng cách so sánh với tương tác thực của con người. đang được thực hiện.

Tất cả sự phát triển này cho thấy công nghệ, vốn nổi lên như một giải pháp cho vấn đề mà Yahoo đang gặp phải, có thể phát triển đến mức nào ngày nay và Bạn có thể đóng góp như thế nào cho trí tuệ nhân tạo? nó đã cho thấy. Đồng thời, nó là công cụ trong việc phát triển các công nghệ mới để theo dõi dấu vân tay của chúng ta trên Internet. Chúng tôi mong nhận được nhận xét của bạn về reCAPTCHA, nơi bạn chia sẻ suy nghĩ của mình và cách nó có thể đạt được một điểm trong tương lai.

Mục lục