Tin tức và phân tích của tất cả các thiết bị di động

Tin tốt cho người dọn dẹp dữ liệu! Tòa phúc thẩm Hoa Kỳ bác bỏ việc dữ liệu công cộng là hợp pháp

Theo Tòa phúc thẩm Hoa Kỳ khu vực thứ chín, việc thu thập dữ liệu công khai không phải là vấn đề. Tòa án gần đây đã ra phán quyết rằng việc thu thập dữ liệu từ một trang web công cộng không cấu thành hành vi gian lận máy tính theo Đạo luật Lừa đảo và Lạm dụng Máy tính (CFAA).

Năm 2017, HiQ đã đệ đơn kiện những nỗ lực của LinkedIn nhằm ngăn chặn việc thu thập dữ liệu từ hồ sơ của người dùng. Sau khi xác định rằng CFAA – cấm truy cập vào máy tính được bảo mật – không áp dụng do dữ liệu được công khai, tòa án đã cấm Linkedin chấm dứt việc thu thập dữ liệu HiQ.

Vào năm 2019, Tòa phúc thẩm Hoa Kỳ khu vực thứ chín đã đảo ngược quyết định trước đó và đưa ra phán quyết có lợi cho HiQ. LinkedIn đã đệ đơn kháng cáo vào tháng 3 năm 2020, lập luận rằng những hạn chế về mặt kỹ thuật và việc gửi thư ngừng hoạt động đã làm mất hiệu lực ủy quyền. Do đó, mọi hoạt động thu thập dữ liệu tiếp theo đều là bất hợp pháp và vi phạm CFAA.

Tòa phúc thẩm Hoa Kỳ nộp hồ sơ cho Khu vực thứ chín làm rõ vấn đề về việc thu thập dữ liệu công cộng

Nó có thể được đọc từ Tòa phúc thẩm Hoa Kỳ khu vực thứ chín nộp hồ sơ (PDF) rằng:

“Vấn đề là liệu sau khi hiQ nhận được thư yêu cầu ngừng hoạt động của LinkedIn, bất kỳ hoạt động thu thập và sử dụng dữ liệu nào khác của LinkedIn có phải là ‘không được phép’ theo nghĩa của CFAA hay không. Hội thảo kết luận rằng hiQ đã đặt ra một câu hỏi nghiêm túc là liệu khái niệm ‘không được phép’ của CFAA có thể áp dụng được hay không khi, như ở đây, thường không cần phải có sự cho phép trước nhưng một người cụ thể—hoặc bot—bị từ chối truy cập.”

Một số biện pháp bảo mật kỹ thuật của LinkedIn nhằm ngăn chặn việc thu thập dữ liệu được nêu bật trong hồ sơ:

  • Cấm các máy chủ của nó bị truy cập bởi các trình thu thập thông tin và bot của công cụ tìm kiếm – tất nhiên, ngoài Google – bằng cách sử dụng tệp ‘robots.txt’ thông thường của trang web.
  • Một hệ thống có tên ‘Cát lún’ có thể xác định hoạt động cạo thông qua hành vi không phải của con người
  • Một hệ thống được gọi là hệ thống ‘Sentinel’ có khả năng làm chậm hoạt động từ các địa chỉ IP không đáng tin cậy.
  • Một hệ thống khác gọi là ‘Khối tổ chức’ có thể tạo danh sách các địa chỉ IP đã biết có thể có kết nối với các hoạt động thu thập thông tin quy mô lớn.
Các công ty AI thường dựa vào việc thu thập dữ liệu công khai chắc chắn sẽ hài lòng với quyết định của tòa án.

LinkedIn tuyên bố chặn hơn 95 triệu nỗ lực tự động để thu thập dữ liệu mỗi ngày.

Tòa phúc thẩm Hoa Kỳ tại Tòa án số 9 đã ủng hộ quyết định trước đó, nhận thấy rằng “sự cân bằng giữa những khó khăn có lợi đáng kể cho HiQ” và việc tước quyền truy cập LinkedIn sẽ khiến sự tồn tại của HiQ gặp rủi ro.

Giám đốc điều hành của HiQ’s nhấn mạnh tầm quan trọng của khả năng tiếp cận công chúng:

“Toàn bộ hoạt động kinh doanh của hiQ phụ thuộc vào khả năng truy cập hồ sơ thành viên LinkedIn công khai. Hiện tại không có giải pháp thay thế khả thi nào cho cơ sở dữ liệu thành viên của LinkedIn để lấy dữ liệu cho các dịch vụ Keeper và Skill Mapper của hiQ.”

Tuy nhiên, LinkedIn bắt mắt (PDF) tuyên bố rằng quyết định này có sự phân nhánh rộng hơn theo luật sư của công ty:

“Theo quy định của Khu vực thứ chín, mọi công ty có phần công khai trên trang web của mình là một phần không thể thiếu đối với hoạt động kinh doanh của mình – từ các nhà bán lẻ trực tuyến như Ticketmaster và Amazon đến các nền tảng mạng xã hội như Twitter – sẽ tiếp xúc với các bot xâm lấn được triển khai bởi những kẻ ăn bám trừ khi họ đặt những trang web đó hoàn toàn sau hàng rào mật khẩu.”

“Nhưng nếu điều đó xảy ra, các công cụ tìm kiếm sẽ không thể lập chỉ mục các trang web đó nữa, điều này sẽ khiến thông tin ít có sẵn để khám phá bằng các phương tiện chính mà mọi người sử dụng để lấy thông tin trên Internet.”

Các công ty AI sẽ hài lòng với quyết định của tòa phúc thẩm Hoa Kỳ

Các công ty AI thường dựa vào việc thu thập dữ liệu hàng loạt chắc chắn sẽ hài lòng với quyết định của tòa án.

Quyết định của Tòa phúc thẩm Hoa Kỳ tại Khu vực thứ chín bãi bỏ điều khoản cấm các công ty AI sử dụng các thuật toán thường xuyên dựa vào việc thu thập dữ liệu với số lượng lớn sẽ làm hài lòng nhiều công ty AI.

Việc thu thập dữ liệu công khai là hợp pháp theo tòa án Hoa Kỳ. Các công ty AI sẽ hài lòng với quyết định này.

Các nhà chức trách và các nhóm bảo mật đã nhắm mục tiêu vào các công ty như Clearview AI và các công ty khác thu thập hàng tỷ bức ảnh từ các trang web công cộng để cung cấp năng lượng cho công nghệ nhận dạng khuôn mặt của họ.

Luật sư Clearview AI Tor Ekeland nói Đồng xuBàn rằng “luật chung chưa bao giờ công nhận quyền riêng tư đối với khuôn mặt của bạn”.

Vụ kiện chống lại LinkedIn cuối cùng đã bị bác bỏ, nhưng chủ đề thu thập dữ liệu hàng loạt vẫn gây chia rẽ lớn. Những người ủng hộ sẽ cho rằng quyết định của tòa phúc thẩm là đúng, trong khi những người phản đối sẽ bày tỏ sự dè dặt về việc bình thường hóa hoạt động này.