本文共622字,预计阅读需要2分钟
今日阅读:
- 100 年前的人们对 2024 年的各种预言,今天都应验了哪些? [译] 小结:准确度高的惊人,我之前在1993年的读者杂志上看过1893年一百年前的预言,那个把未来想的太过科幻了。
- So-VITS-SVC 4.1 整合包完全指南 小结:今天主要研究的就是这个东西,下面写。
今日软件:
Ai唱歌虽然火了一年了,但是我现在才抽出时间实践。目前的版本是4.1,简化了很多操作。
下载了个整合包开始搞,看一下已经弄好了底模和其他的,感觉没什么问题,但是实操的时候仍然错误频出。
1、音频预处理爆显存
一开始我以为是虚拟内存不够,我看指引里面也是这么写的,后面发现原来要先用内置小工具把音频素材切分为2s~15s的片才行,所以会爆显存。我以为这个“音频预处理”就是自动切分的过程,所以直接把音频素材都拉过去了
2、训练模型停止问题
训练了一晚上也没敢暂停,后面才发现会按照设定好的步数自动去保存模型,我试了下训练8000步的基本上算能用了。
3、推理部分基准素材音频处理
直接拿了首歌就开始推理,结果发现出来的结果也用人声去拟合了伴奏,所以素材也要提前分离出人声干音,然后再去做推理。
今日代码:
没写代码,请了一下午的假期也没怎么写东西。
今日见闻:
微软发文宣布将为 Windows 11 PC 引入 Copilot 键,微软表示Copilot 键的推出 “标志着 Windows PC 键盘近三十年来的首次重大变革… 我们将此视为 Windows 发展历程中的又一个变革性时刻,Copilot 将成为 PC 上人工智能世界的入口。“
今日废话:
实操音声克隆才发现这个东西比想象中复杂很多,结合之前的SD本地部署,就发现一个非常有趣的现象。
不少群友没有计算机程序设计和深度学习经验,但是自己搞这些Ai绘画和Ai音声克隆却很上手,明明平时最基础的计算机原理也要到处问。
奇妙。