← 返回文章列表

大模型学习笔记：从 Transformer 到 RAG

自学 AI 大模型过程中的要点整理与困惑记录。

发布于 2026年5月10日

主题

标签

阅读英文版 →

大模型的学习曲线陡峭，但拆开来看，核心模块是清晰的。

目前理解的框架

Transformer：自注意力机制是基石
预训练 + 微调：通用能力从哪来
RAG：当参数记忆不够用时的外挂知识库

尚未想通的问题

上下文窗口扩大后，RAG 的边界在哪里？
小模型 + 好工具，能否逼近大模型体验？

这些会陆续写成更细的笔记。

评论

表态按钮仅支持 GitHub 固定的 👍 👎 😄 🎉 😕 ❤️ 🚀 👀；评论正文可使用系统输入法输入任意表情符号。