Tin tức và phân tích của tất cả các thiết bị di động

Trình tạo văn bản thành văn bản mới của Google: MusicLM

Gã khổng lồ công nghệ đã công bố Google MusicLM, một công cụ âm nhạc có thể tạo ra âm nhạc từ các lệnh văn bản và thậm chí tương tự như cách các hệ thống như DALL-E tạo ra hình ảnh từ các lệnh bằng văn bản. Mặc dù không thể thực hiện thay đổi nào đối với âm nhạc được sản xuất nhưng công ty đã chia sẻ một số âm nhạc mà họ tạo ra bằng công cụ này.

Google MusicLM là gì?

Trước hết, chúng ta cần phải nói rằng các ví dụ khá ấn tượng. Công cụ trí tuệ nhân tạo có thể tạo ra âm nhạc giống với những bài hát thực sự. Không phải ai cũng có thể ủng hộ nó, nhưng âm nhạc được tạo ra gần như được sáng tác bởi con người. Trên trang demo Ngoài ra còn có những ví dụ về những gì nhạc cụ tạo ra khi được yêu cầu tạo ra âm thanh dài 10 giây của các nhạc cụ như cello và maracas, các đoạn clip dài 8 giây về một thể loại cụ thể, âm nhạc phù hợp với cuộc vượt ngục và thậm chí cả cách một người mới chơi piano sẽ làm như thế nào. âm thanh chống lại người chơi đàn piano cao cấp hơn. Nó cũng bao gồm các ví dụ về các cụm từ như “câu lạc bộ tương lai” và “accordion death metal”.

Google công bố MusicLM: mô hình tạo nhạc từ văn bản Dưới đây là một số điều điên rồ nó có thể làm:

1. Với âm thanh của một giai điệu, nó có thể tạo ra âm nhạc mới lấy cảm hứng từ giai điệu đó được tùy chỉnh theo lời nhắc! Đây là ai đó đang ngân nga bella ciao đã chuyển thành điệp khúc cappella, EDM, v.v. pic.twitter.com/HKDnXI1C8U

—bleedingedge.ai (@bleedingedgeai) Ngày 27 tháng 1 năm 2023

Google MusicLM thậm chí có thể mô phỏng giọng hát của con người và mặc dù nó có vẻ nắm bắt chính xác giai điệu và âm thanh tổng thể của giọng nói nhưng giọng nói đó chắc chắn có chất lượng. Cách tốt nhất để mô tả điều này là nếu âm thanh bị nhiễu hạt hoặc ứ đọng.

Cũng như các sáng kiến ​​AI khác, Google MusicLM thận trọng hơn nhiều so với một số đối thủ cạnh tranh có công nghệ tương tự. Ông nói: “Chúng tôi không có kế hoạch tung ra các mẫu xe vào thời điểm này. bài báotrích dẫn “khả năng lạm dụng nội dung sáng tạo” (được hiểu là đạo văn) và nguy cơ tiềm ẩn về quyền sở hữu văn hóa hoặc xuyên tạc.

Luôn có khả năng công nghệ này sẽ xuất hiện trong một trong những thử nghiệm âm nhạc thú vị của Google vào một thời điểm nào đó, nhưng hiện tại, những người duy nhất có thể hưởng lợi từ nghiên cứu này là những người khác đang phát triển hệ thống AI âm nhạc. Google cho biết họ đã phát hành công khai một tập dữ liệu chứa khoảng 5.500 cặp văn bản-nhạc có thể hữu ích khi phát triển và đánh giá các công cụ AI khác.