Ceci est une ancienne révision du document !


Stemspleet

Demucs

https://github.com/sevagh/demucs.cpp

Pour l'installer, les instructions sont correctes. J'ai eu une erreur au début sur la version de CMake ; il suffit de corriger CmakeLists.txt

Pour résumer, on clone le dépôt comme c'est dit, on compile (et si on a Arch en théorie on a depuis longtemps installé tout ce qu'il faut pour), on télécharge les modèles (ils ne sont pas lourds), puis on sépare les pistes.

Je compile en sollicitant moins le cpu de mon côté, je n'ai pas un foudre de guerre. Pour savoir combien de cœur sont dispo, on fait la commande nproc. Ou lscpu, les lignes “Thread(s) par cœur” et ““Cœur(s) par socket” indiquent plus de détail. Mais ce que dit nproc suffit.

git clone --recurse-submodules https://github.com/sevagh/demucs.cpp
mkdir -p build && cd build && cmake .. && make -j4
# les modèles
git clone https://huggingface.co/datasets/Retrobear/demucs.cpp

La commande : lien vers le soft, lien vers le modèle, liens vers la zik, lien vers le dossier où envoyer l'unmixage

./build/demucs.cpp.main ./ggml-demucs/ggml-model-htdemucs-4s-f16.bin /lienvers/machin.wav ./demucs-out-cpp/

Bon format en entrée

Si on n'a pas un wav échantilloné à 44100 Hz, ça râle. Hop, un coup de ffmpeg :

ffmpeg -i musik.mp3 -ar 44100 -ac 2 -acodec pcm_s16le sortie.wav

Choix du modèle

De base, sans autre précision, les modèles séparent en 4 pistes (basse, batterie, voix, autres). “4s” ou “6s” indiquent précisément si on va avoir 4 ou 6 pistes (stem).

Généraliste

  • ggml-model-hdemucs_mmi-v3-f16.bin : le plus rapide
  • ggml-model-htdemucs-4s-f16.bin : devrait être plus précis que le précédent mais plus lent
  • ggml-model-htdemucs-6s-f16.bin : sépare en 6 pistes (basse, batterie, guitare, piano, voix, autres), forcément encore plus lent.

Spécialisé : plus précis sur un type de piste.

  • ggml-model-htdemucs_ft_bass-4s-f16.bin
  • ggml-model-htdemucs_ft_drums-4s-f16.bin
  • ggml-model-htdemucs_ft_other-4s-f16.bin
  • ggml-model-htdemucs_ft_vocals-4s-f16.bin

Autres soft

 Ce texte est placé sous licence CC0

pratique/creatool/audio/stemspleet.1748683758.txt.gz · Dernière modification : 31/05/2025 11:29 de Zatalyz