Remova os vocais de arquivos de áudio com o Ultimate Vocal Remover GUI (alimentado por IA)

13 de janeiro de 2023

ultimate-vocal-remover-gui

Ultimate Vocal Remover é uma ferramenta GUI gratuita e de código aberto para remover vocais (e muito mais) de arquivos de áudio usando redes neurais profundas. Está disponível para Windows, macOS e Linux.

A ferramenta, anunciada como "o melhor aplicativo de remoção vocal na internet" por seus desenvolvedores, usa modelos treinados pelos desenvolvedores da UVR em sua maior parte (exceto para os modelos Demucs v1, v2, v3 e v4 de 4 e 6 hastes).

Ultimate Vocal Remover é uma ferramenta alimentada por IA que é projetada para remover vocais de faixas de áudio. Isso pode ser útil para uma variedade de propósitos, como criar versões de karaokê de músicas, isolar partes instrumentais de uma faixa ou até mesmo remover vocais indesejados de uma gravação. 

Embora seu principal objetivo seja remover qualquer voz das faixas de áudio, o software também pode executar algumas outras tarefas, dependendo do modelo que você está usando. Por exemplo (usando o método de processo MDX-Net), ele também pode remover os instrumentos de um arquivo de áudio.

Ultimate Vocal Remover pode trabalhar com arquivos WAV nativamente, e com outros formatos, como MP3, FLAC, OGG, e muitos outros, graças ao FFmpeg, e pode saída para WAV, FLAC ou MP3. Isso significa que os usuários podem facilmente remover vocais de suas músicas favoritas, independentemente do formato, e sem ter que converter os próprios arquivos. 

O software também é fácil de usar, com uma interface simples que permite aos usuários remover rápida e facilmente os vocais de qualquer faixa de áudio.

Para usar o Ultimate Vocal Remover GUI para remover vocais ou instrumentos de arquivos de áudio:

  • selecione a entrada e saída desejadas na parte superior da GUI
  • escolha o método de processo, por exemplo, MDX-Net para obter uma faixa que tenha apenas vocais ou apenas instrumentos,
  • escolha o modelo (o Choose Model lista suspensa tem uma opção para baixar modelos; Aqui usamos UVR-MDX-NET Main no teste, e funcionou muito bem),
  • se você escolher o método de processo MDX-Net, marque a caixa para obter uma faixa que tenha Vocals Only ou Instrumental Only,
  • opcionalmente, marque a caixa ao lado de GPU Conversion se você estiver usando uma placa gráfica Nvidia suportada (veja abaixo),
  • e, finalmente, clique em Start Processing

Há também uma opção de modo de exemplo se você quiser fazer uma execução de teste (que tem como padrão 30 segundos da música). Você também pode alterar várias configurações clicando no ícone de chave inglesa que é mostrado à esquerda do botão Start Process.

Vale a pena notar que, para poder usar a GPU para processar arquivos de áudio enquanto estiver usando essa ferramenta alimentada por IA, você precisará da Nvidia RTX 1060 de 6 GB ou mais, com pelo menos 8 GB de V-RAM sendo recomendados. As GPUs AMD Radeon ainda não são suportadas, nem plataformas diferentes de 64 bits. O aplicativo funciona sem uma placa gráfica Nvidia, mas levará mais tempo para processar (para efeito de comparação, usando um meu antigo Asus Zenbook com CPU Intel i5-10210, levou cerca de 15 minutos para uma faixa de 3:40).

Baixar/Instalar Ultimate Vocal Remover GUI

Baixar Ultimate Vocal Remover

No Linux, você precisará instalar FFmpeg, Python3 PIP e TK e, em seguida, instalar os requisitos via PIP. Vale a pena notar que os requisitos instalados ocupam mais de 3 GB de espaço em disco, e você também precisará de algum espaço livre para baixar modelos para usar com este software alimentado por IA.

Para executar o Ultimate Vocal Remover GUI no Linux, você precisará ter alguns pacotes instalados: FFmpeg (para usar arquivos de áudio que não são WAV), python3-pip e python3-tk. Você pode instalá-los e executar o Ultimate Vocal Remover GUI seguindo as instruções abaixo.

Instale as dependências:

  • Debian/Ubuntu/Linux Mint/Pop!_OS/etc.:

Comandos para usar no terminal

sudo apt install ffmpeg python3-pip python3-tk

  • Fedora (primeiro você precisará ativar os repositórios RPMFusion para poder instalar o FFmpeg):

Comandos para usar no terminal

sudo dnf install ffmpeg python3-pip python3-tkinter

  • Arch Linux/Manjaro:

Comandos para usar no terminal

sudo pacman -S ffmpeg python-pip tk

Em seguida, baixe o mais recente zip do Ultimate Vocal Remover GUI a partir daqui (o arquivo de versão mais recente não inclui requirements.txt, ele pode funcionar se você copiar o do repositório), extraia, em seguida, abra um terminal e navegue até sua pasta (por exemplo, cd ~/Downloads/ultimatevocalremovergui-master), e execute o seguinte comando para instalar seus requisitos via PIP:

Comandos para usar no terminal

python3 -m pip install --user -r requirements.txt

Isso levará algum tempo, pois o software tem algumas dependências grandes. Uma vez feito, você pode executar o Ultimate Vocal Remover GUI usando o seguinte comando (na pasta onde você extraiu o zip):

Comandos para usar no terminal

python3 UVR.py

Você também pode gostar: SonoBus é um aplicativo de streaming de áudio peer-to-peer de baixa latência de código aberto

Relacionado à IA: Usar o ChatGPT a partir da linha de comando com este wrapper e a FFMPEG: FFmpeg: Extrair áudio de vídeo em formato original ou convertê-lo para MP3 ou Ogg Vorbis

Esse post foi traduzido do site LinuxUprising.com pela rtland.team.

Linux Uprising Blog

Confira a versão original desse post em inglês:

Remove Vocals From Audio Files With Ultimate Vocal Remover GUI (AI-Powered)
Propaganda
Propaganda