大模型与训练 14

语言模型训练中的熵指标：如何理解模型预测的不确定性 2026/04/28
CoT-Self-Instruct：思维链引导的高质量数据合成方法 2026/03/26
图提示学习综述：Graph Prompting 最新进展与未来方向 2026/03/26
SCOTT：自洽思维链蒸馏 - 让小型模型学会忠实推理 2026/03/26
DC-CoT：数据为中心的思维链蒸馏基准研究 2026/03/26
llama1 技术报告 2025/04/03
Encoder-Decoder、Encoder-Only、Decoder-Only和Prefix-LM 2025/03/25
Transformer源码-位置编码(PositionalEncoder) 2025/02/22
LLM 从训练到部署 2025/02/12
DeepSeek系列 2025/02/12
LLM 微调框架 2025/02/12
大语言模型（LLM）技术框架详解 2024/10/11
Transformer系列 2024/10/11
大规模数据集加载解决方案 2024/10/10