Skip to content

Dica Hugging Face #2: Separar Voz dos Instrumentos

Se você mexe com edição de vídeo, faz jingles, montagens de zoeira, etc., pode ser que em algum momento você quis pegar uma música, retirar a voz, e adicionar outra coisa por cima… ou contrário, pegar somente a voz separada…

Para mim, que possuo pouco conhecimento do mundo de áudio, e das ferramentas (como o incrível Audacity), é bem difícil fazer isso… Até alguns dias atrás, onde vi um cara compartilhar no Hugging Face um Space que faz isso:

UVR5 UI – a Hugging Face Space by TheStinger

Esse é uma das poucas tarefas feitas por IA que realmente me surpreenderam…

Para usar é bem simples:

  1. Em Select Model, escolha um dos models. Os que possuem o nome Roformer são os melhores.
  2. Em Output Format, escolha o formato do arquivo… Eu escolho geralmente mp3.
  3. Informe o seu arquivo de áudio (pode ser wav, mp3, etc.) em Input Audio
  4. Depois é só apertar o botão “Separate” e aguardar! A música House Of The Rising Sun, que possui 4m20s, demorou pouco menos de 2 minutos!

Quando tiver concluído, os arquivos separados irão aparecer aqui:

À esquerda, está o instrumental! E à direita, a voz!

A qualidade é muito, muito, muito boa!

Quando eu descobri esse space, eu fiquei muito curioso para entender mais e vi que esse modelo é o Ultimate Vocal Remover… Além desse Space no Hugging Face, tem esse projeto, de um GUI que roda em qualquer lugar, inclusive Windows: Anjok07/ultimatevocalremovergui: GUI for a Vocal Remover that uses Deep Neural Networks. E funciona muito bem também! Na minha fraca NVIDIA RTX 2060, a mesma música levou menos de 1 minuto, e ainda separou vários instrumentos…

Tem muita coisa pra descobrir sobre esse projeto, mas fica aqui a dica rápida!

Leave a Reply

Your email address will not be published. Required fields are marked *