▷ Từ xác định độ tuổi đến lập chỉ mục chương

YouTube là mạng truyền thông xã hội và công cụ tìm kiếm lớn thứ hai trên hành tinh, với hơn 2.3 tỷ người dùng đang hoạt động.

Kể từ khi thành lập vào năm 2005, YouTube đã phát triển thành một gã khổng lồ công nghệ. Nó hiện là trung tâm dành cho những người sáng tạo nội dung theo sở thích, những người có ảnh hưởng chuyên nghiệp và các chuyên gia tiếp thị truyền thông xã hội.

Hơn 12 triệu người sáng tạo nội dung đang tranh giành người xem và cạnh tranh để phát triển kênh của họ. Một triệu người trong số họ được coi là người sáng tạo chuyên nghiệp, nghĩa là họ kiếm sống toàn thời gian nhờ nền tảng này, hiện cung cấp nhiều cách kiếm tiền khác nhau cho người dùng.

Theo thông tin gần đây dữ liệu của Statista, hơn 500 giờ nội dung video được tải lên nền tảng mỗi phút – tức là 30.000 giờ mỗi giờ. Và tốc độ này đang tăng nhanh, với tỷ lệ tải lên nội dung tăng 40% từ năm 2014 đến năm 2020.

Để đối phó với sự tấn công dữ liệu này, YouTube đang khai thác trí tuệ nhân tạo (AI) theo nhiều cách.

Từ việc đề xuất video phù hợp với sở thích của từng người dùng cho đến gắn cờ các clip không phù hợp, YouTubeAI của Google đóng một vai trò rất lớn trong nội dung người dùng nhìn thấy trên nền tảng. Đó là yếu tố quyết định giữa video nào đạt được thành công lan truyền và video nào biến mất hoặc bị xóa hoàn toàn.

Trong bài viết này, chúng ta sẽ xem xét kỹ hơn về cách chính xác YouTube khai thác AI và điều này ảnh hưởng như thế nào đến trải nghiệm người dùng của cả người xem và người sáng tạo nội dung. Quyết định kết quả tìm kiếm và đề xuất

Để bắt đầu, công dụng quan trọng nhất của YouTube tạo ra AI và học máy có dạng thuật toán chọn kết quả tìm kiếm và khuyến nghị.

Thách thức chính mà thuật toán này phải đối mặt là cơ sở dữ liệu video thay đổi liên tục, từ đó nó phải xác định các kết quả tìm kiếm và đề xuất phù hợp với sở thích của từng người dùng.

Nói chung, thuật toán hoạt động theo hai bước: tạo và xếp hạng ứng viên.

Bước đầu tiên thu hẹp YouTubethư viện video khổng lồ của nó chỉ còn vài trăm video, dựa trên sở thích của người dùng và đặc điểm nhân khẩu học của họ.

Ở đây, điều đáng chú ý là thuật toán xem xét các tùy chọn tiềm ẩn của người dùng. Điều đó có nghĩa là nó tính đến các video mà người dùng đã xem, liệu họ có chia sẻ, thích hay nhận xét về chúng hay không và họ đã xem chúng trong bao lâu. Một video được xem đến cuối sẽ được đánh giá cao hơn nhiều về sở thích của người dùng so với một clip mà họ ngừng xem sau một hoặc hai phút.

Khi nhóm ứng viên đó được tập hợp, bước xếp hạng sẽ quyết định thứ tự các video sẽ xuất hiện.

Các yếu tố như sở thích tiềm ẩn của người dùng cũng được tính đến ở đây. Tuy nhiên, ở giai đoạn này, số liệu video – như số lượt xem, lượt thích, lượt chia sẻ và bình luận – ảnh hưởng nặng nề đến vị trí xếp hạng của họ.

Bước cuối cùng, thuật toán sẽ đưa yếu tố ngẫu nhiên vào bảng xếp hạng. Điều này đảm bảo rằng người dùng khám phá nhiều chủ đề khác nhau và các kênh mới hơn cũng thấy được mức độ hiển thị nhất định.

Kết quả của quá trình này có thể được nhìn thấy trên YouTube: trong các video được đề xuất trên trang chủ của người dùng, thanh bên tiếp theo và màn hình kết thúc video cũng như trong các kênh chủ đề được tạo tự động và YouTube hỗn hợp. Gắn cờ nội dung và nhận xét

Lĩnh vực triển khai thứ hai dành cho YouTubeAI của nền tảng là quá trình gắn cờ nội dung và nhận xét vi phạm quy tắc của nền tảng.

Dựa theo YouTube’S Báo cáo minh bạch, 9,569.641 video đã bị xóa khỏi nền tảng chỉ trong khoảng thời gian từ tháng 1 đến tháng 3 năm 2021. Trong đó, gần như 9,1 triệu đã được gắn cờ tự động.

Thuật toán đã được đào tạo để nhận biết các hành vi lừa đảo, thông tin sai lệch, nội dung bạo lực và nội dung người lớn như ảnh khỏa thân và nội dung khiêu dâm. Nó đi qua từng khung hình của video và chuyển nó qua mạng thần kinh tích chập để phát hiện các tính năng có khả năng rõ ràng. Sau đó, mỗi khung được dán nhãn độc lập. Sự phán xét này là chỉ dựa trên thông tin trực quan.

Tương tự, thuật toán được gắn cờ 1 tỷ bình luận vi phạm YouTubequy tắc cộng đồng của trong ba tháng đầu năm 2021. Theo nhân viên thống kêphần lớn các nhận xét này đã bị xóa vì kiểu ngôn từ của chúng trùng khớp với các nhận xét lừa đảo (55%), vi phạm an toàn trẻ em (25%) hoặc bắt nạt và quấy rối trên mạng (26%).

Hiện nay, một tính năng mới đang được thử nghiệm sử dụng AI để ngăn chặn những bình luận xúc phạm. Ở đây, thuật toán nhận ra những nhận xét có thể có vấn đề khi người dùng nhập chúng. Sau đó, một cửa sổ bật lên sẽ nhắc nhở người dùng về các nguyên tắc của nền tảng trước khi họ có thể đăng nhận xét của mình. Bảo vệ bản quyền

Tương tự như việc gắn cờ nội dung vi phạm YouTubeTheo nguyên tắc nền tảng của Google, học máy cũng được sử dụng để phát hiện các hành vi vi phạm bản quyền.

YouTubeHệ thống Content ID của cho phép chủ sở hữu bản quyền đăng ký các tệp mà họ giữ bản quyền. Sau đó, các tệp này sẽ được đối sánh với các video được tải lên nền tảng theo quy trình tương tự như quy trình được mô tả ở trên.

Sau khi nội dung của chủ bản quyền được gắn cờ là do người khác tải lên, chủ bản quyền có một số tùy chọn. Họ có thể chặn hoàn toàn video vi phạm, kiếm tiền từ video đó thông qua quảng cáo vì lợi ích riêng của họ hoặc chỉ cần theo dõi số liệu thống kê về lượng người xem của video đó. Nội dung giới hạn độ tuổi

Một ứng dụng khác của trí tuệ nhân tạo và học máy trên nền tảng này là ngăn người dùng trẻ tuổi xem nội dung không phù hợp với họ, ngay cả khi nội dung đó không trái với nguyên tắc của nền tảng. Quá trình này được gọi là xác định tuổi tác.

Mặc dù người tải lên có thể đặt danh mục nội dung của họ thành “18+” nhưng rất ít người chọn làm như vậy. ĐẾN loại bỏ mối nguy hiểm người xem trẻ tuổi nhìn thấy nội dung có thể gây hại cho họ theo bất kỳ cách nào, YouTube sử dụng AI để gắn cờ những clip như vậy. Sau đó, quyền truy cập sẽ bị hạn chế đối với tất cả người dùng chưa đủ tuổi và đối với bất kỳ ai chưa đăng nhập vào nền tảng.

Việc xác định độ tuổi một phần là hệ quả của các hướng dẫn do Liên minh Châu Âu ban hành trong Chỉ thị về Dịch vụ Truyền thông Nghe nhìn (AVMSD). Do đó, YouTube trong tương lai sẽ yêu cầu xác minh độ tuổi và người dùng EU có thể phải gửi thêm bằng chứng về độ tuổi trước khi được cấp quyền truy cập vào nội dung người lớn.

Về mặt quy trình tính toán, việc xác định độ tuổi dựa trên các tín hiệu như tiêu đề, mô tả và siêu dữ liệu của video cũng như phân tích hình ảnh. Tự động thêm chú thích, chương và bản dịch

Ngược lại với quá trình gắn cờ và loại bỏ được mô tả ở trên, YouTube cũng sử dụng AI để làm cho video dễ tiếp cận hơn với người xem và tăng cơ hội được tìm thấy.

Đặc biệt, nó thực hiện điều này bằng cách thêm chú thích, bản dịch và chương video.

Phụ đề video đang được tạo tự động bằng một số ngôn ngữ dựa trên thuật toán xử lý ngôn ngữ tự nhiên (NLP). Gần đây, tính năng này cũng đã có sẵn cho các buổi phát trực tiếp trên nền tảng này.

Phù hợp với YouTubeTheo nguyên tắc cộng đồng của, thuật toán NLP sẽ cố tình chỉnh sửa ngôn ngữ, chẳng hạn như bằng cách xóa các từ không phù hợp.

Ngoài ra, tính năng tự động dịch các phụ đề được tạo tự động và do người dùng tải lên gần đây đã bước vào thử nghiệm. Người dùng đã báo cáo rằng họ thấy các tùy chọn dịch cho tiêu đề, mô tả cũng như chú thích cả trong trình duyệt và trong YouTubeứng dụng di động của. Các tùy chọn này bao gồm tiếng Anh-Bồ Đào Nha và tiếng Anh-Thổ Nhĩ Kỳ.

Gần đây nhất, YouTube đã thông báo rằng thuật toán của họ giờ đây cũng có khả năng phân tích cấu trúc của video đến mức có thể thêm các chương tự động. Cho đến nay, người dùng phải liệt kê dấu thời gian theo cách thủ công cùng với tiêu đề các chương trong phần mô tả video của họ. Đối với họ, điều này mang lại lợi thế là những “khoảnh khắc quan trọng” này sẽ xuất hiện trong các tìm kiếm trên Google và tăng khả năng tìm thấy video của họ. Bây giờ, các chương này có thể được tạo tự động.

YouTube dưới dạng Bộ dữ liệu ML

Ngoài ra YouTube khai thác AI và ML để cung cấp trải nghiệm người dùng tốt hơn cho người xem và người sáng tạo nội dung, nền tảng này cũng đóng vai trò là kho lưu trữ dữ liệu học tập khổng lồ cho các thuật toán.

Ví dụ: các nhà nghiên cứu của Google đã sử dụng video về thử thách ma-nơ-canh để rèn luyện nhận thức sâu sắc của các mô hình. Mặc dù nội dung do người dùng tạo “lộn xộn” hơn các tập dữ liệu được quản lý riêng cho máy học, nhưng khối lượng tuyệt đối của nó là vô giá. Điều này đặc biệt đúng vì nó có thể giúp các thuật toán nhận ra các tình huống thực tế.

Một ví dụ khác có thể được tìm thấy vào năm 2019. Vào thời điểm đó, các nhà nghiên cứu AI của Google đã sử dụng YouTube dữ liệu để đào tạo một mạng lưới thần kinh để hoán đổi nền. Thuật toán thu được có khả năng trao đổi nền video mà không cần thiết bị chuyên dụng.

Ngoài ra, YouTube là gắn chặt với AI Video của Google. Nó vừa đóng vai trò là dữ liệu đào tạo vừa là ứng dụng cho các tính năng như nhận diện khuôn mặt, quảng cáo theo ngữ cảnh và nhận dạng logo. Tương lai của AI trên YouTube: Phát hiện sản phẩm

Một số ứng dụng bổ sung của AI và ML trên YouTube hiện đang được thử nghiệm. Nhìn chung, việc sử dụng chúng có thể sẽ mở rộng với tốc độ nhanh chóng trong những tháng tới.

Ví dụ: vào tháng 3 năm 2021, YouTube đã từng là thử nghiệm phát hiện sản phẩm trong video.

Thuật toán được đề cập có thể nhận dạng các sản phẩm xuất hiện trong nội dung video. Sau đó, nó sẽ hiển thị chúng cùng với các sản phẩm liên quan, ngay bên dưới trình phát video.

Theo The Vergemục đích của phương pháp này là cung cấp YouTube truy cập trực tiếp vào thị trường liên kết sinh lợi cao. Nó sẽ thiết lập kết nối trực tiếp giữa tải lên video và thương mại điện tử. Phần kết luận

YouTubeViệc sử dụng AI rất đa dạng và phức tạp.

Không còn nghi ngờ gì nữa, mục tiêu chung của nó là đáp ứng mong đợi của người dùng, đáp ứng thị hiếu của họ và mang lại trải nghiệm tích cực. Thuật toán tìm kiếm phức tạp, việc tự động tạo chú thích và chương cũng như gắn cờ nội dung không phù hợp (độ tuổi) góp phần vào việc này.

Tuy nhiên, các ứng dụng khác của AI trên nền tảng này rõ ràng nhằm mục đích tăng khả năng và lợi nhuận của chính nó. Các đề xuất và màn hình “Tiếp theo” nhằm mục đích thu hút người xem, trong khi các tính năng như thuật toán phát hiện sản phẩm trực tiếp nhằm mục đích tăng YouTubedoanh thu của.

Bài viết này ban đầu xuất hiện trên buổi trưa và được sao chép với sự cho phép.

Từ xác định độ tuổi đến lập chỉ mục chương – Làm thế nào YouTube Sử dụng AI

Khuyến Khích: