Đấu trường Thế hệ âm nhạc AI đã là một trong số ít những phần ổn định của cuộc cách mạng AI trong hai năm qua. Hai công ty thống trị, Suno và Udio, đều đã thiết lập một danh tiếng xứng đáng và người hâm mộ trong lĩnh vực thích hợp.
Tuy nhiên, hiện trạng ấm cúng này có thể sắp thay đổi đáng kể. Một nền tảng tạo âm nhạc mới có tên là Yue, vừa bỏ đi, và nó miễn phí, nguồn mở và tạo ra các bản nhạc hay đáng ngạc nhiên.
Yue, có nghĩa là 'âm nhạc' và 'hạnh phúc' trong tiếng Trung Quốc, thực sự là một nhóm các mô hình làm việc cùng nhau để cung cấp các bài hát đầy đủ.
Các mô hình bao gồm sản xuất trữ tình, nhạc cụ và thể loại. Cũng như nhiều mô hình AI mới của Trung Quốc này, bản chất mở của Yue đã khuyến khích rất nhiều sự phát triển của Homebrew – chủ yếu là để giảm yêu cầu tính toán để nhiều người có thể tận dụng công cụ này.
Dự án ban đầu yêu cầu tối thiểu 24GB RAM video và khuyến nghị chính thức để tạo ra các bài hát đầy đủ vẫn còn được đặt ở mức 80GB. Điều này rõ ràng là cách xa tầm với của người dùng gia đình bình thường, và nhắm đến các chuyên gia, kinh doanh và học viện.
Tin tốt là rất nhiều nỗ lực đã được thực hiện để tạo ra các gói nhỏ hơn cho quần chúng, bao gồm cả công việc được thực hiện bởi nền tảng Pinokio phổ biến, cho phép bất cứ ai nhanh chóng và dễ dàng chạy các dự án AI nguồn mở trên Windows.
Sự đánh đổi
https://cdn.mos.cms.futurecdn.net/tKBNuazbZibNGKkAFE9M-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/tKBNuazbZibNGKkAFE9M-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/tKBNuazbZibNGKkAFE9M-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/tKBNuazbZibNGKkAFE9M-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/tKBNuazbZibNGKkAFE9M-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/tKBNuazbZibNGKkAFE9M.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/tKBNuazbZibNGKkAFE9M.jpg"/>
Việc đánh đổi với các phiên bản VRAM nhỏ này là thực tế là chất lượng âm thanh chắc chắn bị suy giảm và thời gian thế hệ có thể bị chậm.
Ngay cả khi sử dụng Pinokio, yêu cầu VRAM cơ bản ở mức 12GB đã nằm ngoài tầm với của tất cả nhưng các máy tính mạnh nhất. Tuy nhiên, một người dùng táo bạo gần đây đã giới thiệu một phiên bản bộ nhớ siêu thấp mới, đã mở ra cơ hội để tôi nhảy vào và chơi xung quanh bằng cách sử dụng hệ thống GPU RTX 8GB PLTRY của tôi.
Đây là những gì tôi đã làm:
Ấn tượng đầu tiên là giao diện người dùng Gradio rất có thẩm quyền. Ở phía bên trái của màn hình là hộp nhắc nhở, bên dưới là hộp lời để bạn nhập từ của bạn, và sau đó số lượng bài hát bạn muốn tạo. Cũng có thể đặt số lượng RAM bạn muốn sử dụng, được gắn với độ dài của bài hát và số lượng câu thơ.
Nhấn nút Tạo và ngồi lại và đợi trong khi nền tảng tạo bản nhạc.
Các nhà phát triển tuyên bố rằng với GPU VRAM 16GB, một bản nhạc một phút sẽ chỉ mất bốn phút để tạo. Thật không may, điều đó dường như không mở rộng quy mô xuống, bởi vì với 8GB của tôi, mỗi người mất 2 đến 2,5 giờ để tạo ra hai bản nhạc 40 và 50 giây.
Các nhà phát triển tuyên bố rằng với GPU VRAM 16GB, một bản nhạc một phút sẽ chỉ mất bốn phút để tạo.
Nhưng họ là những bài hát tuyệt vời. Chúng có thể ngắn, và chất lượng âm thanh có thể không phải là cấp cao, nhưng âm nhạc là không thể tin được.
Lần cuối cùng tôi thử nghiệm tạo âm nhạc AI trên máy tính của mình, nó nghe giống như một bảng điều khiển arcade bẩn từ thập niên 90. Đây là âm nhạc thực sự, với sự tuân thủ nhanh chóng chính xác, giọng hát tuyệt vời và loại nhạc cụ bạn mong đợi từ một dịch vụ AI thương mại.
Bạn có thể nghe nhiều kết quả được nhúng ở đây trên SoundCloud:
Suy nghĩ cuối cùng
Vì vậy, dự án này vẫn cực kỳ thô và sẵn sàng, và các tài nguyên điện toán bạn cần là vô lý.
Ngay cả khi bạn có một máy tính khá, bạn sẽ dành nhiều thời gian để chờ đợi các bản nhạc xuất hiện. Nhưng – và đó là một “nhưng” – mặc dù tất cả những nhược điểm này, đây là một đáng kinh ngạc Đầu tiên cố gắng sản xuất một sản phẩm mở trong lĩnh vực này.
Nếu đây là loại chất lượng mà việc tạo âm nhạc AI nguồn mở có thể tạo ra ngay bây giờ, thì sẽ không còn lâu nữa các dịch vụ thương mại như Udio và Suno bắt đầu cảm thấy nóng thực sự từ cộng đồng DIY.
Thêm từ hướng dẫn của Tom
Khám phá thêm từ Phụ Kiện Đỉnh
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.