Скачиваем питон, через официальный сайт или майкрасофтстор, не забываем поставь галочку на add to PATH. И скачаете git https://git-scm.com/download/win открываем повершел от имени администратора и пишем. (каждая отдельная строка, это отдельная команда, их надо по очереди вводить и прожимать ентер) Если у вас в коммандах не работает pip3 или python3 то убирайте тройки.
python3 -m venv anon_eblan
.\anon_eblan\Scripts\activate
у вас в терминале должна появиться приставка (anon_eblan) - это значит вы вошли в виртуально окружение, это нужно для чистоты, если приставки нет, то не надо писать команды.
Скачиваем торч, надо перейти по ссылки https://pytorch.org/ и в таблице выбрать Pip ну и ваш процессор я выбрал CUDA 11.6 и снизу появится команда, её надо вставить в повершелл.
pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116

Скачиваем нейронку:
git lfs install
git clone https://huggingface.co/spaces/Plachta/VITS-Umamusume-voice-synthesizer
Переходим в папку с ней:
cd VITS-Umamusume-voice-synthesizer
Докачиваем модули:
pip install -r requirements.txt

После этого у вас всё установилось. Попробуйте запустить сервак, напиши в повершелл  python app.py  и вам дадут локальную ссылку на интерфейс генерации, попробуйте сгенерировать чтонить.Но возможна ошибка. Я её фиксил так, писал тута же в повершелл:
mkdir audio_recording
потом находим файл VITS-Umamusume-voice-synthesizer\app.py и открываем с помощью текстового редактора и находим блок на 27 строке
```
def audio_postprocess(self, y):
if y is None:
return None

if gr_utils.validate_url(y):
file = gr_processing_utils.download_to_file(y, dir=self.temp_dir)
elif isinstance(y, tuple):
sample_rate, data = y
file = tempfile.NamedTemporaryFile(
suffix=".wav", dir=self.temp_dir, delete=False
)
gr_processing_utils.audio_to_file(sample_rate, data, file.name)
else:
file = gr_processing_utils.create_tmp_copy_of_file(y, dir=self.temp_dir)

return gr_processing_utils.encode_url_or_file_to_base64(file.name)
```
И заменяем на
```
def audio_postprocess(self, y):
if y is None:
return None

if gr_utils.validate_url(y):
file = gr_processing_utils.download_to_file(y, dir="audio_recording/")
elif isinstance(y, tuple):
sample_rate, data = y
file = tempfile.NamedTemporaryFile(
suffix=".wav", dir="audio_recording/", delete=False
)
gr_processing_utils.audio_to_file(sample_rate, data, file.name)
else:
file = gr_processing_utils.create_tmp_copy_of_file(y, dir="audio_recording/")

return gr_processing_utils.encode_url_or_file_to_base64(file.name)
```
Но сохраняем табуляцию(сдвиги) и возвращаемся в повершелл, и пишем python app.py Ждём, и переходим по ссылке и все наши аудио сохраняются в папку audio_recording. Поздравляю вы хакер.
Если у вас ошибки, то смотрите в повершел, и смотрите что пишут, если там ModuleNotFoundError: или AttributeError:  То это значит что у вас не все модули скочались. Их можно докачать с помощью команды pip install "название модуля". Одному челу это не помогло. То скачайте папки https://drive.google.com/drive/folders/1WY5kumfugiwYk-CJEU9eU2sEVAIOCqpr?usp=share_link и перенесёте их в anon_eblan\Lib\site-packages\

Если вы закроете консоль и потом заходите оного всё запустить, то вам нужно просто запустить повершелл и написать
.\anon_eblan\Scripts\activate
cd VITS-Umamusume-voice-synthesizer
python app.py

Если будут ошибки пишите, я может быть ошибся в чём-то или не до рассказал.