2024年1月4日我学到了什么

本文共622字，预计阅读需要2分钟

100 年前的人们对 2024 年的各种预言，今天都应验了哪些？ [译] 小结：准确度高的惊人，我之前在1993年的读者杂志上看过1893年一百年前的预言，那个把未来想的太过科幻了。
So-VITS-SVC 4.1 整合包完全指南小结：今天主要研究的就是这个东西，下面写。

Ai唱歌虽然火了一年了，但是我现在才抽出时间实践。目前的版本是4.1，简化了很多操作。

下载了个整合包开始搞，看一下已经弄好了底模和其他的，感觉没什么问题，但是实操的时候仍然错误频出。

1、音频预处理爆显存

一开始我以为是虚拟内存不够，我看指引里面也是这么写的，后面发现原来要先用内置小工具把音频素材切分为2s~15s的片才行，所以会爆显存。我以为这个“音频预处理”就是自动切分的过程，所以直接把音频素材都拉过去了

2、训练模型停止问题

训练了一晚上也没敢暂停，后面才发现会按照设定好的步数自动去保存模型，我试了下训练8000步的基本上算能用了。

3、推理部分基准素材音频处理

直接拿了首歌就开始推理，结果发现出来的结果也用人声去拟合了伴奏，所以素材也要提前分离出人声干音，然后再去做推理。

没写代码，请了一下午的假期也没怎么写东西。

微软发文宣布将为 Windows 11 PC 引入 Copilot 键，微软表示Copilot 键的推出 “标志着 Windows PC 键盘近三十年来的首次重大变革… 我们将此视为 Windows 发展历程中的又一个变革性时刻，Copilot 将成为 PC 上人工智能世界的入口。“

实操音声克隆才发现这个东西比想象中复杂很多，结合之前的SD本地部署，就发现一个非常有趣的现象。

不少群友没有计算机程序设计和深度学习经验，但是自己搞这些Ai绘画和Ai音声克隆却很上手，明明平时最基础的计算机原理也要到处问。

奇妙。

🥝 NBXX的博客