AI tạo ra âm nhạc với độ trung thực cao
Một nhóm kỹ sư tại Google đang trình diễn hệ thống AI thế hệ âm nhạc mới có tên MusicLM. Nhóm nghiên cứu tuyên bố rằng hệ thống mới thiết lập một cấp độ sáng tác mới và độ trung thực cao ở các bài hát do máy tính tạo ra.
MusicLM là một phần trong làn sóng ứng dụng trí tuệ nhân tạo học sâu được phát triển với mục tiêu tái tạo khả năng tinh thần của con người, như viết bài, vẽ tranh, làm bài kiểm tra, nói chuyện hoặc tạo chứng minh toán học.
Một số nỗ lực khác đã được thực hiện để tạo ứng dụng tạo bài hát, bao gồm Dance Diffusion, Jukebox và Riffusion. Nhưng mỗi ứng dụng đều có những hạn chế rõ ràng và những bài hát chúng tạo ra sẽ không bao giờ bị nhầm lẫn với âm nhạc được viết bởi một nhà soạn nhạc.
Trong nỗ lực mới này, nhóm nghiên cứu của Google tuyên bố hệ thống mới của họ vượt trội so với các hệ thống trước đó, cả về chất lượng bài hát được tạo ra và việc tuân thủ lời nhắc bằng văn bản. Google cung cấp nhiều ví dụ trên trang Google Research. Đúng như dự đoán, các bài hát kỹ thuật có xu hướng trở nên hay hơn những bài hát sao chép các bài hát cổ điển được chơi trên các nhạc cụ thực.
Hệ thống được dạy để tạo ra âm nhạc bằng cách đào tạo nó trên 28.000 giờ bài hát do con người chơi. Và nó có thể tạo ra các bài hát có độ dài thay đổi. Ví dụ, nó có thể tạo ra một đoạn riff nhanh hoặc toàn bộ bài hát. Và thậm chí nó có thể tạo ra các bài hát có nhiều phần, như thường thấy trong các bản giao hưởng, để tạo cảm giác về một câu chuyện. Hệ thống cũng có thể chấp nhận các chi tiết cụ thể, chẳng hạn như yêu cầu đối với một số nhạc cụ hoặc một thể loại cụ thể. Nó cũng có thể tạo ra giọng hát, nếu được hỏi, hoặc âm thanh giọng hát chính xác hơn, mặc dù kết quả có xu hướng giống như một dàn hợp xướng robot không biết lời bài hát.
Google sẽ không phát hành ứng dụng cho mục đích sử dụng chung. Thử nghiệm cho thấy rằng khoảng 1% âm nhạc do hệ thống tạo ra được sao chép trực tiếp từ một người nghệ sĩ. Vì vậy, họ cảnh giác với việc chiếm đoạt nội dung và các vụ kiện.