▷ Chúng tôi đã thử nghiệm Gen-2AI đầy hứa hẹn có thể tạo video chỉ bằng lệnh văn bản

Chúng tôi đang chứng kiến sự tăng trưởng ổn định trong việc phát triển trí tuệ nhân tạo tổng quát (AI) như ChatGPT và DALL-E do OpenAI cung cấp. Tuy nhiên, công ty Runway đã nổi bật với hoạt động nghiên cứu và phát triển AI tập trung vào chỉnh sửa và tạo nội dung vốn là một phần của nhóm máy biểu cảm này.

Sản phẩm chính của nó là các mô hình Gen-Generative AI1 và Gen-2ra mắt vào cuối tháng 3, đã thu hút sự chú ý vì có thể tạo các video ngắn chỉ bằng các lệnh văn bản, mang lại nội dung rất làm hài lòng người dùng các công cụ này.

Trong bài viết này chúng ta sẽ hiểu Gen-2chúng tôi sẽ nhận xét về kết quả thử nghiệm của chúng tôi trên phiên bản miễn phí và phân tích các khả năng trong tương lai của công nghệ này trong việc tạo ra nội dung sáng tạo.

Cách thức hoạt động và kiểm tra

Để bắt đầu, cần giải thích một số thuật ngữ, bắt đầu với Generative AI, là những hệ thống có khả năng tạo nội dung mới từ cơ sở dữ liệu tham chiếu hiện có, có thể là hình ảnh, video, âm thanh hoặc văn bản.

Mô hình thống kê mà các AI này thường sử dụng là mô hình khuếch tán, hoạt động thông qua một quá trình lặp đi lặp lại thêm và loại bỏ nhiễu khỏi thông tin, dần dần tinh chỉnh việc tạo nội dung cho đến khi đạt được kết quả mong muốn.

Trong phạm vi khuếch tán cũng có khuếch tán ổn định, một kỹ thuật dùng để huấn luyện và cập nhật dần dần các mô hình AI, tránh những thay đổi đột ngột có thể dẫn đến mất ổn định hoặc sai lệch hiệu suất lớn.

Cả hai Gen-1 đối với gen2 sử dụng những phương pháp này để xác định, điều trị và mang lại kết quả đáng kinh ngạc. Công ty đã có một ứng dụng miễn phí dành cho iOS, RunwayML, nơi người dùng hiện có thể tận hưởng những công cụ này cho smartphoneschứng tỏ rằng các rào cản trong việc sáng tạo với AI không còn bị giới hạn ở máy tính để bàn nữa!

Cần lưu ý rằng, để tận dụng 100% công suất các chương trình của công ty, có hai loại đăng ký, một hàng tháng và một hàng năm. Trong cả hai tùy chọn, còn có loại Standard và Pro, cả hai đều cấp quyền truy cập vào nhiều cài đặt chỉnh sửa hơn và giải phóng thêm dung lượng lưu trữ; Tiêu chuẩn có giá $15 và $12 hàng tháng và hàng năm, còn Pro $35 và $28.

Runway tự tuyên bố mình là “công ty đang định hình kỷ nguyên tiếp theo của nghệ thuật, giải trí và sự sáng tạo của con người”, và đã làm được điều đó thông qua các chương trình giúp các chuyên gia nghe nhìn và người dùng Internet tò mò dễ dàng hơn trong việc tạo ra nội dung của mình.

Những công cụ này được tạo ra với mục đích sử dụng đơn giản, lưu ý rằng công ty đang tìm cách xóa tan ý tưởng rằng để tạo ra nội dung phức tạp hơn bằng AI, mọi người cần có kinh nghiệm trước đó trong lĩnh vực này và nền tảng mạnh mẽ.

Hiện nay đã có AI khác sản xuất hình ảnh/video/văn bản cho video nhưng chưa có gì so sánh được với những gì công ty đã sản xuất!

Để tìm hiểu xem công ty có cung cấp được một chương trình thực sự dễ sử dụng hay không, chúng tôi đã thử nghiệm chương trình web của họ. Và kết quả, dù có vẻ đơn giản đối với một số người, lại thật đáng kinh ngạc vì những lý do sẽ được thảo luận sau. Hãy đi kiểm tra.

Bài kiểm tra 1: “Dòng chảy của sông Amazon lúc bình minh”.

AI sáng tạo đã là bậc thầy trong việc tạo ra các kịch bản tuyệt đẹp và Gen-2 đã không làm mọi người thất vọng khi tạo nên khung cảnh bình minh trên không trên sông Amazon. Ánh sáng, sự phản chiếu và bầu trời là những phần ấn tượng nhất của tác phẩm này. Anh ấy còn chèn một loại sương mù nào đó trên dòng sông và một vài con sóng ở góc màn hình. Đó có phải là Pororoca không?

Bài kiểm tra 2: “Cảnh đường phố ở São Paulo Brazil, vào giữa trưa”.

Hiện chúng tôi đang thử một kịch bản phức tạp hơn, trong đó anh ấy đã tạo ra một con phố có ít người đi bộ di chuyển và sự kết hợp của các phong cách xây dựng rất đặc trưng của thành phố. Tất cả những gì còn thiếu là những sợi dây điện rối rắm và sự hỗn loạn ở São Paulo giữa trưa.

Bỏ chuyện đùa sang một bên, Gen-2 một lần nữa cố gắng mang lại ánh sáng và sự phản chiếu đáng kinh ngạc, trong đó anh ấy cũng thực hiện công việc tạo bóng xuất sắc và có bầu trời rất chân thực.

Một chi tiết thú vị khác cần chỉ ra là ở phía dưới bên trái của video, “máy ảnh” ghi lại bên trong một tòa nhà, nhưng vì quá tối nên nó chỉ ghi lại được hình ảnh phản chiếu của thứ có vẻ là khung cửa. và ánh sáng trong nhà, điều này thật tuyệt vời!

Bài kiểm tra 3: “Cảnh một ngày nắng trên bãi biển ở Brazil”.

Trong thử nghiệm này, có sự tương phản giữa tính chân thực và sự kỳ lạ, đặc biệt là khi nói đến giải phẫu của những người trong video. Những gì nó thể hiện một chút về khuôn mặt và cánh tay của mọi người có vẻ hơi kỳ quái, cộng thêm thức ăn trên bàn khá méo mó.

Quan sát quan trọng, nó không được yêu cầu chèn người hoặc thức ăn vào lời nhắc này, Gen-2 có quyền tự do “sáng tạo” để triển khai hình ảnh với những yếu tố này.

Bài kiểm tra 4: “Thành phố thời Trung cổ với nhiều công dân, cờ trang trí thành phố, vài cái cây trên đường phố, với nền là một lâu đài lớn bằng vàng”.

Ở đây chúng tôi quyết định hỏi thêm chi tiết và xem Gen-2 sẽ xuất hiện, nhưng cuối cùng nó lại mang lại kết quả thấp hơn so với các lời nhắc khác, vì một số yếu tố được nhấn mạnh hơn nhiều so với các yếu tố khác. Anh ấy cũng không trình bày các yếu tố khác đã được yêu cầu, chẳng hạn như cây cối và lâu đài vàng, vì “nhiều công dân” ở phía sau.

Bầu trời, một số trường hợp ánh sáng và bố cục chung, không đạt yêu cầu như những phần trước, điều này cho chúng ta thấy rằng AI, như mong đợi, vẫn còn chỗ để cải thiện. Thật tốt khi chỉ ra rằng Gen-2 đang cố gắng tái tạo cơ chế chiếu sáng và chuyển động vải rất ấn tượng!

Bài kiểm tra 5: “Chiến tranh không gian trên quỹ đạo hành tinh đỏ với những con tàu lớn và chùm tia laser”.

Cuối cùng, kết quả thú vị nhất là lời nhắc về trận chiến ngoài không gian này, nơi nó có thể tạo ra một cảnh có màu sắc khá đậm và phông nền sống động. Việc thiếu hành tinh đỏ và tàu vũ trụ có điểm nhấn hình học hơn không làm giảm chất lượng của video.

Có việc sử dụng ống kính lóa trong tia laser, việc bổ sung thêm các ngôi sao khác và một số con tàu ở hậu cảnh, một lần nữa cho thấy Gen-2 trong việc có thể tạo ra một kịch bản liên tục đôi khi vượt quá mong đợi.

Cân nhắc cuối cùng

Do sự xuất hiện liên tục của các AI tạo ra tác phẩm nghệ thuật tuyệt vời và/hoặc rất thực tế trong thời gian gần đây, một số người ngày càng ít ấn tượng hơn với kết quả và kích thước mà những công cụ này mang lại.

Nhưng Gen-2 Không thể bỏ qua công suất của nó vì nó đã là một mẫu xe mang lại kết quả khá ấn tượng; “sự thành thạo” đối với một số cách thể hiện thực tế, chẳng hạn như ánh sáng và cơ học chất lỏng đã được đề cập, mới là lớp kem trên bánh.

Runway đã cố gắng tạo ra một công cụ có khả năng tạo nội dung cực kỳ hứa hẹn cho thị trường nghệ thuật sáng tạo, tiếp tục mở ra một chân trời vốn đã hiệu quả. Và tất nhiên, giống như tất cả các AI, Gen-2 nó đang trong giai đoạn học hỏi liên tục và với việc sử dụng cũng như phản hồi của người dùng, nó sẽ nằm trong tầm ngắm như một chương trình liên tục thách thức các đối thủ cạnh tranh.

Trong số các AI đã được cổng thông tin thử nghiệm ở đây, cái này dễ dàng đứng đầu 5 đáng ngạc nhiên nhất!

Thông qua: Thế hệ công cụ ma thuật AI-2, Mô hình khuếch tán, khuếch tán ổn định, Giới thiệu Gen-2: Chuyển văn bản thành video, Giới thiệu: Đường băng cho di động, Gen-2 bởiRunway

Mục lục

Chúng tôi đã thử nghiệm Gen-2AI đầy hứa hẹn có thể tạo video chỉ bằng lệnh văn bản