本文共622字,预计阅读需要2分钟

今日阅读:

今日软件:

so-vits-svc

Ai唱歌虽然火了一年了,但是我现在才抽出时间实践。目前的版本是4.1,简化了很多操作。

下载了个整合包开始搞,看一下已经弄好了底模和其他的,感觉没什么问题,但是实操的时候仍然错误频出。

1、音频预处理爆显存

一开始我以为是虚拟内存不够,我看指引里面也是这么写的,后面发现原来要先用内置小工具把音频素材切分为2s~15s的片才行,所以会爆显存。我以为这个“音频预处理”就是自动切分的过程,所以直接把音频素材都拉过去了

2、训练模型停止问题

训练了一晚上也没敢暂停,后面才发现会按照设定好的步数自动去保存模型,我试了下训练8000步的基本上算能用了。

3、推理部分基准素材音频处理

直接拿了首歌就开始推理,结果发现出来的结果也用人声去拟合了伴奏,所以素材也要提前分离出人声干音,然后再去做推理。

今日代码:

没写代码,请了一下午的假期也没怎么写东西。

今日见闻:

微软发文宣布将为 Windows 11 PC 引入 Copilot 键,微软表示Copilot 键的推出 “标志着 Windows PC 键盘近三十年来的首次重大变革… 我们将此视为 Windows 发展历程中的又一个变革性时刻,Copilot 将成为 PC 上人工智能世界的入口。“

image1

今日废话:

实操音声克隆才发现这个东西比想象中复杂很多,结合之前的SD本地部署,就发现一个非常有趣的现象。

不少群友没有计算机程序设计和深度学习经验,但是自己搞这些Ai绘画和Ai音声克隆却很上手,明明平时最基础的计算机原理也要到处问。

奇妙。