Удаляем вокал из любых композиций с помощью ИИ. Бесплатно, без регистрации и смс.

Здравствуйте, товарищи! В интернете много онлайн ресурсов, которые предлагают разделить музыкальную композицию на составляющие до сведения — гитара, барабаны, вокал, бас и т.д. В данной статье нас интересует конкретно удаление вокала для создания минусовок из любых композиций. До недавнего времени я пользовался сервисом FADR. Он бесплатный, доступен без VPN, удобный и быстрый. Он раскладывает композицию на дорожки, после чего можно скачать каждую из них, отдельно вокал или инструментал. Явных минусов у сервера два — это одновременная работа только с одной композицией и возможность скачать дорожки только в mp3 в бесплатной версии. К тому же, скорей всего, функционал этого сервиса бесплатный не навсегда, а временно — для привлечения клиентов, и скоро станет платным, как это было с множеством ИИ сервисов, например с Coze.

К счастью, в мире нейросетей всегда найдутся умельцы, способные создать оффлайн нейросеть с кучей моделей для достижения результата, который необходим именно тебе. Среди ИИ, генерирующих изображения , такой нейросетью является Stable Diffusion, которая использует мощности вашего компьютера для работы. Кстати, про нее у меня есть статья. А среди ИИ, разделяющих музыку на составляющие такой нейросетью является Ultimate Vocal Remover. Далее будет подробная инструкция по установке и настройке.

Заходите на страницу github, опускаетесь чуть ниже и ищете Main Download Link — качаете дистрибутив к себе на компьютер.

Устанавливаете UVR и запускаете. Сразу скажу, что с нужными нам моделями, папка с установкой будет весить около 6 гб. А если вы меломан-экспериментатор и хотите попробовать другие модели, то намного больше. Учтите это при выборе папки при установке. Я лично установил на отдельный SSD.

Далее необходимо настроить программу. Жмем разводной ключ слева от кнопки Start Processing. Заходим во вкладку Additional Settings и внизу GPU Device — выбираем свою видеокарту.

После этого необходимо скачать те модели, которые по мнению пользователей этой нейросети выдают наилучший результат. Скачиваются они во вкладке Download Center. Нам нужны следующие:

VR_ARC: 7_HP2-UVR
MDX_Net: UVR-MDX-NET-Inst_3
MDX_Net: UVR-MDX-NET-Inst_HQ_1
Demucs: v4 | htdemucs_ft

Когда все скачалось, можно приступить к главным настройкам.

Choose Process Method — выбираем Ensemble Mode. Этот метод позволит нам использовать сразу несколько моделей и комбинировать их результат для лучшего эффекта.

Main Stem Pair — Vocals/Instrumental. Тут все логично, выбираете те дорожки, которые хотите разделить.

Ensemble Algorithm — это качество разделенных дорожек. Ставим Max Spec/Max Spec.

Ставим галку GPU Conversion.

Available Models — выделяем только те модели, что скачали ранее.

Select Input — выбираете файлы для минусовок. Можно сразу несколько.

Select Output — выбираете папку для вывода.

Также формат выходного файла можно выбрать по желанию, я оставил mp3.

После этого можно жать кнопку Start Processing и ждать результат. Скорость зависит от мощности вашей видеокарты. На моей 2070 super одна композиция обрабатывается около 3х минут. На выходе вы получите 2 файла — с вокалом и без, скомбинированные из выбранных нами моделей. Не скомбинированные файлы, отдельно каждой модели будут лежать в соседней папке, ее можно сразу удалить, как и файл с вокалом.

Спасибо всем, кто дочитал, подписывайтесь на остальные мои соц. сети, там много всего интересного из мира 3д графики.

✅Группа в Telegram

✅Youtube

✅Группа ВК