LLM

深度学习机大模型领域相关术语及解释

本博客系统梳理了深度学习与大语言模型(LLM)领域的核心概念与技术,共分为九大板块。文章首先介绍了以Transformer为核心的基础模型架构及其关键组件(如自注意力机制、位置编码),并对比了RNN、CNN等传统网络。随后详细阐述了模型的训练方法(如预训练、微调、RLHF)、优化压缩技术(如知识蒸馏

LLM Prompt相关

该博客定义了一个画图类提示词,其核心功能是指导AI作为图表绘制专家,根据用户需求使用Mermaid语法生成专业图表。支持的图表类型广泛,包括流程图、时序图、类图、甘特图、架构图等二十余种。关键要求是:AI需自主解析用户问题,选择最合适的图表类型进行输出,且回复应仅为纯粹的Mermaid代码,不含任何