声音大模型之音色克隆 博客介绍了声音大模型的两个主要分支:SVC(音色转换)和TTS(文字转语音)。SVC专注于复制原语音的音色特征,不模仿呼吸、语速等细节,常用于歌声替换;TTS则学习发音特点以生成更自然的语音,适用于语言描述或说话模仿。 文中列举了两个开源项目:SoftVC VITS 歌声转换模型需大量高质量人声 8月前 达达下雨不吃鱼 Technical 0
深度学习机大模型领域相关术语及解释 本博客系统梳理了深度学习与大语言模型(LLM)领域的核心概念与技术,共分为九大板块。文章首先介绍了以Transformer为核心的基础模型架构及其关键组件(如自注意力机制、位置编码),并对比了RNN、CNN等传统网络。随后详细阐述了模型的训练方法(如预训练、微调、RLHF)、优化压缩技术(如知识蒸馏 8月前 达达下雨不吃鱼 Technical 1
Mysql慢查询优化 MySQL慢查询的核心原因有两点:一是未合理使用索引(如未建主键索引、索引不合理导致B+树过深),二是数据表过大导致扫描数据量过多。优化方法主要针对这两点:首先优化索引,包括创建主键、唯一、组合等各类索引,并删除不合理索引;其次对于海量数据表,必须采用分区分表策略,如按时间范围(RANGE)、列表( 8月前 达达下雨不吃鱼 Technical 0
Zerotier自建Moon节点 本文介绍了在Linux主机上配置ZeroTier Moon服务器的步骤。首先安装依赖(wget、gcc等)并执行官方脚本安装ZeroTier。然后进入ZeroTier目录,导出并编辑moon.json配置文件,指定stableEndpoints的IP和端口。接着生成moon文件,将其移动到moons 8月前 达达下雨不吃鱼 Technical 0
LLM Prompt相关 该博客定义了一个画图类提示词,其核心功能是指导AI作为图表绘制专家,根据用户需求使用Mermaid语法生成专业图表。支持的图表类型广泛,包括流程图、时序图、类图、甘特图、架构图等二十余种。关键要求是:AI需自主解析用户问题,选择最合适的图表类型进行输出,且回复应仅为纯粹的Mermaid代码,不含任何 8月前 达达下雨不吃鱼 Technical 0