▷ Các mô hình AI mới của Google biến hình ảnh có độ phân giải thấp thành hình ảnh chất lượng cao

Khi các nhà nghiên cứu thúc đẩy giới hạn của họ để phát triển các công nghệ trí tuệ nhân tạo (AI) tiên tiến, chúng ta đã thấy một số công cụ và hệ thống AI để cải thiện công nghệ hình ảnh. Chúng tôi đã thấy các công cụ AI để xóa nền ngay lập tức khỏi hình ảnh và khử mờ ảnh. Giờ đây, Google đã phát triển hai công cụ dựa trên AI dựa trên các mô hình khuếch tán có thể chuyển đổi ảnh có độ phân giải thấp thành ảnh chất lượng cao.

Được mệnh danh là Siêu phân giải thông qua Tinh chỉnh lặp lại (SR3) và Mô hình khuếch tán theo tầng (CDM), hai công nghệ mới đã được Nhóm nghiên cứu của Google phát triển gần đây. Gã khổng lồ Mountain View gần đây đã xuất bản một bài đăng blog chuyên sâu trên diễn đàn AI của mình, trình bày chi tiết về cả hai công nghệ. Nó tương tự như thuật toán AI trước đây mà chúng ta đã thấy các nhà nghiên cứu tại Đại học Duke của Bắc Carolina phát triển vào đầu năm nay.

Bây giờ, bắt đầu với mô hình SR3, về cơ bản nó là một mô hình khuếch tán siêu phân giải có thể chuyển đổi hình ảnh có độ phân giải thấp thành hình ảnh có độ phân giải cao từ nhiễu tinh khiết. Nó lấy một hình ảnh có độ phân giải thấp làm đầu vào và sử dụng quy trình làm hỏng hình ảnh, sử dụng quy trình này đã được đào tạo, để tăng dần tiếng ồn vào hình ảnh cho đến khi chỉ còn lại tiếng ồn thuần túy. Sau đó, nó đảo ngược quá trình và bắt đầu loại bỏ nhiễu để đạt được hình ảnh mục tiêu với hình ảnh đầu vào có độ phân giải thấp làm tham chiếu.

Công ty nói rằng với quá trình đào tạo quy mô lớn đối với mô hình SR3, nó có thể đạt được kết quả điểm chuẩn mạnh mẽ trong nhiệm vụ siêu phân giải cho khuôn mặt và hình ảnh tự nhiên. Mô hình có thể chuyển đổi hình ảnh đầu vào 64 x 64 thành hình ảnh 1024 x 1024. Để chứng minh quy trình này, Google đã chia sẻ một đoạn video ngắn giới thiệu mô hình SR3 đang hoạt động, bạn có thể xem ngay bên dưới.

Bây giờ, đến với mô hình AI thứ hai, Mô hình khuếch tán Cascaded (CDM) là một mô hình khuếch tán có điều kiện lớp đã được đào tạo trên dữ liệu ImageNet. Điều này cho phép mô hình tạo ra hình ảnh tự nhiên có độ phân giải cao bằng cách kết hợp nhiều mô hình chung trên một số độ phân giải không gian.

Trong quá trình này, Mô hình CDM sử dụng một mô hình khuếch tán để tạo dữ liệu ở độ phân giải thấp, tiếp theo là một chuỗi các mô hình khuếch tán siêu phân giải SR3. Điều này dần dần tăng độ phân giải của hình ảnh có độ phân giải thấp lên độ phân giải cao nhất. Bạn có thể xem ảnh GIF đính kèm bên dưới để hiểu rõ hơn về quá trình tạo ảnh.

Các mô hình AI mới của Google biến hình ảnh có độ phân giải thấp thành hình ảnh chất lượng cao

Ngoài hai mô hình được mô tả ở trên, các nhà nghiên cứu tại Google AI cũng đã phát triển một kỹ thuật gia tăng dữ liệu mới được gọi là điều hòa tăng cường. Nó cải thiện hơn nữa kết quả chất lượng mẫu của CDM bằng cách sử dụng nhiễu Gaussian và mờ Gauss. Hơn nữa, nó ngăn không cho mỗi mô hình độ phân giải siêu phù hợp với đầu vào điều hòa độ phân giải thấp hơn của nó. Nó dẫn đến chất lượng mẫu có độ phân giải cao tốt hơn cho CDM.

Vì vậy, với các mô hình cải tiến hình ảnh dựa trên AI ở trên, Google nói rằng họ đã đẩy giới hạn của các mô hình khuếch tán lên mức tối tân trên điểm chuẩn thế hệ ImageNet có độ phân giải siêu cao và có điều kiện. Các nhà nghiên cứu sẽ kiểm tra thêm các giới hạn của các mô hình này để tìm ra các vấn đề mô hình tổng quát hơn trong tương lai.

Các mô hình AI mới của Google biến hình ảnh có độ phân giải thấp thành hình ảnh chất lượng cao

Khuyến Khích: