Tin tức và phân tích của tất cả các thiết bị di động

Deepfake: định nghĩa, sử dụng và rủi ro

Amine Kacete, kỹ sư trong phòng thí nghiệm IA của IRT B <> com, Laurent Amsaleg, giám đốc nghiên cứu và trưởng nhóm Linkmedia và Alain Droniou, nghiên cứu sinh tại Viện Hệ thống Thông minh và Người máy, cho chúng tôi biết một chút về điều đó. thế giới của deepfakes tại hội nghị Công nghệ kỹ thuật số, do Arnaud Wassmer chủ trì.

Deepfake là gì?

“Về cơ bản, thuật ngữ deepfake đã được sử dụng cho khuôn mặt của con người. Amine Kacete giải thích: Từ thời điểm chúng ta thay đổi hình ảnh của một khuôn mặt người, chúng ta đang nói về deepfake. Deepfake là một thuật ngữ tiếng Anh tương ứng với thuật ngữ tiếng Pháp “hypertrucage”: một kỹ thuật tổng hợp đa phương tiện dựa trên trí tuệ nhân tạo.

Trên thực tế, trong deepfakes, có một số loại:

Hoán đổi khuôn mặt: kỹ thuật tốt nhất được biết đến. Bạn lấy khuôn mặt của ai đó và đặt nó lên người khác, theo một cách cực kỳ thực tế.
Bản tóm tắt đầy đủ: một kỹ thuật cho phép bạn tạo ảnh của một người không tồn tại. Máy được yêu cầu tạo ra một khuôn mặt siêu thực.
Các khả năng khác: sử dụng ảnh gốc của một người và chỉ thay đổi một số đặc điểm khuôn mặt hoặc một số đặc điểm nhất định trên khuôn mặt (ví dụ: màu tóc). Cũng có thể có sự xuất hiện của một người khác trên video (như diễn viên hài Canteloup có thể làm).

Amine Kacete đưa ra một ví dụ về tình yêu sâu sắc của Barack Obama do nam diễn viên người Mỹ Jordan Peel đạo diễn, bạn có thể xem bên dưới. Video được thực hiện vào năm 2018 này đã bắt đầu cảnh báo về tác động mà mức độ sâu sắc có thể gây ra.

Một ví dụ khác với tài khoản TikTok đăng tải các bức ảnh sâu về nam diễn viên Tom Cruise:

@ deeptomcruise Đây là cách tôi phối đồ! ♬ âm thanh gốc – Tom

Deepfakes được tạo ra như thế nào?

Laurent Amsaleg cung cấp thông tin chi tiết về deepfakes được thực hiện thông qua tổng hợp tích hợp: “nó đến từ ‘học sâu’, đó là một cách hoạt động của Trí tuệ nhân tạo, nó không chỉnh sửa, nó không phải thủ công, đây là những khuôn mặt được tạo ra nhờ vào chiếc máy có đã học được khuôn mặt của con người là gì. Cô đã được ăn hàng triệu khuôn mặt và học các đặc điểm trên khuôn mặt thông qua một hệ thống thuật toán phức tạp. Những gì chúng tôi có thể tạo ra là khá đáng kinh ngạc. »

Nhưng làm thế nào để bạn phát hiện ra các tệp tin sâu “độc hại”?

Amine Kacet nhấn mạnh thực tế là chất lượng của các bức ảnh sâu đã thực sự được cải thiện trong vài năm qua: “ngày nay chúng tôi quản lý để tạo ra các khuôn mặt ở độ phân giải HD (1024 × 2024). Đây là lý do tại sao hiện nay việc xử lý ảnh và video bằng kỹ thuật deepfake trở nên dễ dàng hơn. Nhưng sau đó làm thế nào để phát hiện chúng?

Nhờ cơ sở dữ liệu được tạo thành từ các biểu hiện trên khuôn mặt con người, có thể phát hiện lỗi sâu dễ dàng hơn: “đây là những cơ sở dữ liệu mà chúng tôi có thể tự đánh giá, và trên hết là thu được các số liệu khách quan để phát triển một máy dò hoạt động, chúng tôi có những cơ sở dữ liệu rất thách thức, với các kịch bản khác nhau và chất lượng hình ảnh khác nhau, và ở đó, chúng tôi có thể định lượng một cách khách quan hiệu quả của thuật toán ”, kỹ sư B <> com giải thích.

Trên những bức ảnh deepfake, chúng ta có thể phân biệt được một nhược điểm rõ ràng: “những người mà chúng ta tạo ra một cách toàn diện, họ không bao giờ nhắm mắt lại, các kỹ thuật tổng hợp thiết kế họ không thể tạo ra điều đó. Đôi mắt thường là vùng ngoại lệ đối với những vết thâm. »

Deepfakes cũng được thiết kế vì những lý do chính đáng…

Deepfakes không chỉ được sử dụng cho các mục đích xấu. Laurent Amsaleg quay lại một số lý do khoa học nhất định cho việc phát minh ra deepfakes: “Điểm khởi đầu là việc sử dụng Trí tuệ nhân tạo để làm cho các sửa đổi trở nên cực kỳ thực tế, vượt ra khỏi tay nghề thủ công, nơi chúng tôi sẽ thực hiện Photoshop. Ví dụ, có mong muốn hoạt hình các nhân vật thực tế trong trò chơi điện tử. Ngoài ra còn có các thuật toán đã được phát minh để hiểu cách môi của mọi người di chuyển, điều này được sử dụng đặc biệt trong ngành công nghiệp điện ảnh để đạt được lồng tiếng thực tế hơn cho các bộ phim bằng các ngôn ngữ khác. »

Bất chấp những lý do chính đáng này, giám đốc nghiên cứu cảnh báo về sự vượt quá của tiến bộ này bởi vì có thể khiến bất kỳ ai cử động môi có nghĩa là có thể khiến bất kỳ ai nói bất cứ điều gì. Và đây là nơi nó có thể trở nên nguy hiểm.

Với tiến bộ công nghệ, tương lai nào cho video deepfake? Những rủi ro nào?

Alain Droniou phát biểu về chủ đề này: “Chúng tôi vẫn biết cách quay lại dữ liệu nguồn nếu dữ liệu nguồn đã được sử dụng. Ngày nay, không thể tạo video từ con số không nhưng nếu chúng ta dự đoán bản thân mình vào tương lai và với sự phát triển mà chúng ta đã thấy trong những năm gần đây, có thể trong một vài năm nữa chúng ta sẽ làm được, và theo định nghĩa thì nó sẽ không thể quay lại video nguồn bị thao túng vì nó sẽ được tạo hoàn toàn. Amine Kacet cho biết thêm: “Chúng tôi có thể tạo ra một hình ảnh tĩnh từ hư không nhưng chúng tôi không thể tạo ra một người biết nói từ không có gì. »

Laurent Amsaleg kết luận rằng chúng tôi không còn xa lắm mới có thể tạo ra nội dung hoàn toàn nhân tạo từ một mô tả bằng văn bản.

Mục lục