# 小林大模型AI应用开发训练营（校招、社招）

大家好，我是小林。

我想先问你一个问题：你现在距离大模型AI应用开发岗位，差的到底是什么？

不是努力，不是智商，也不是运气。

我见过太多人自学了半年，LangChain 用得很熟，RAG Pipeline 跑通了，但面试一追问就哑火，因为他们做的项目，是 Demo，不是工程。而面试官要的，是一个能在生产环境撑起来的系统，以及一个能把每个技术决策讲清楚的人。

得知同学们的痛点，小林哥联合好几位「前阿里巴巴高级大模型工程师」一起搞了小林coding大模型应用开发/Agent开发训练营（想要报名咨询，可滑到文章底部加小林微信咨询，+vx：xiaolincoding）

大模型训练营是三位资深大厂搞大模型的导师，带你扎实拿下「大模型应用开发/AI Agent开发岗位」。

按照我们的课程规划，每个季度，大模型训练营的内容都会不断的更新和迭代，截止到 2026 年 2 月份，训练营的内容已经更新了 4 个大的版本，有7～8八个原创落地的商业级大项目，同时删除了一些 2024 年讲的但现如今已经过时的技术知识点，训练营里面还是有接近 30 周的内容。

简单总结一下我们的大模型训练营：

课程是录播体系课，经过两年的持续迭代，目前涵盖了将近30周的内容，每个季度原创项目直播
持续迭代更新，通过专属小群继续答疑服务，提供2次1v1线上会议，大厂面试官1v1指导
定制学习路线、求职路线，简历优化指导，面试mock，从面试官的角度告诉你如何拿到offer

从 0 到 Offer，14周（3 个月+）掌握大模型应用开发的核心能力，在大模型课程方面，课程开班以来，已为 600+学员服务，口碑爆棚，从学习方式到学习效果，收获了超多学员认可，很多人已经拿到了高薪offer！

说实话，训练营这种事情，如果没有真实结果，其实很难长期做下去，但恰恰相反，这两年我们最不缺的就是学员拿到 offer 的反馈。

我整理了一下最近一段时间的真实案例，很多确实挺有代表性的。（为了避免泄露同学隐私，在争得同学允许的情况下，我们分享一些去年的offer数据）

下面是大模型训练营 offershow，全部都是真实学员案例！（想要报名咨询，可滑到文章底部加小林微信咨询）

那到底大模型训练营是怎么样的呢？

# 一、课程定位

这是为「想要转入大模型AI应用开发或者Agent开发工程师Offer」的同学打造的一套全流程陪跑课程不同于市面上“只讲知识点、不管结果”的课程，我们提供的是从学习到上岸的一整条闭环：

✅从0基础到系统掌握大模型核心技术
✅从底层原理知识到项目实战落地
✅从简历打磨到面试拿Offer
✅全程1v1答疑、定制学习路线，直到你真正入职

我们相信：知识不值钱，成长路径和实战陪伴才是核心壁垒。

按照我们的课程规划，每个季度，大模型训练营的内容都会不断的更新和迭代，截止到 2026 年 2 月份，训练营的内容已经更新了 4 个大的版本，有七八个原创落地的商业级大项目，同时删除了一些 2024 年讲的但现如今已经过时的技术知识点，训练营里面还是有接近 30 周的内容。

同时，按照我一直以来的做法和你们都可以看得到我已经做到的，每个季度后续都会按照这个频率去更新内容。

比如，Claude Code源码泄漏了，大模型训练营的导师火速就用python复刻一个版本，然后也更新了课程，这效率实在太高了！

再比如，我们为了让学员学习体验更好，专门打造了大模型训练营的学习平台！学习效率至少提升两倍以上，更短时间超过更多的竞争对手，拿到最满意的offer！学起来就完事了，导师们非常给力！

报名咨询

请直接扫码添加小林的微信（微信号：xiaolincoding），记得要加备注「大模型」 ，然后发送您的个人情况，我们会帮你进行评估，看看是否适合加入。

# 二、训练营学习内容

接下来这一节，我把整个 99 天的学习路径完整地铺开讲一遍。注意，这是通用框架，你报名当天会有一次 1v1 会议，根据你的具体背景定制属于你自己的节奏。

# 阶段一：大模型必备基础速通（第 1 周）

很多同学问基础不好能不能学，能。前两周我们就是用来打底的。

这一周主要内容包括 Python 进阶（函数式编程、面向对象、NumPy / Pandas）、神经网络核心概念（前向反向传播、损失函数、梯度下降、激活函数）、PyTorch 框架速通（Tensor 操作、自动求导、模型搭建、数据加载），以及 AutoDL 平台使用、Hugging Face / ModelScope 模型下载这些工程上的准备工作。

这周结束你需要能用 PyTorch 从零手撕一个完整的神经网络训练流程。

# 阶段二：手撕 Transformer 与 MOE（第 2 周）

整个大模型的根基就在这里。我们不背公式，而是用 EXCEL 把 Transformer 所有关键模块的矩阵计算过一遍，让你看清楚数据是怎么流动的。

这一周覆盖 Dense 架构（Encoder / Decoder、Self-Attention、Multi-Head Attention、Positional Encoding、LayerNorm、FFN）和 MOE 架构（专家网络、门控路由、Top-K 激活、负载均衡）的全部核心组件。手撕环节是必经之路：Multi-Head Attention、FFN、MOE-FFN，从头实现一遍。

这周结束你应该能完整讲清楚 BERT、T5、GPT 三种结构的模型结构、推理方法、训练方法、下游任务应用。

# 阶段三：手撕 LLaMA、Qwen、DeepSeek（第 3 周）

主流开源模型这一周走完。Llama 与标准 Transformer 的差异（GQA、RMSNorm、SwiGLU、RoPE）原理与实现，加上 Llama3 论文带读和手撕 llama3-8B。KV Cache、解码采样策略（Top-k、Top-p、Temperature、BeamSearch）也在这里讲透。

Qwen 系列和 DeepSeek 系列都配有万字详解文档，DeepSeek 里面 MTP、MLA、双端流水线设计、稀疏激活和负载均衡是重点，DeepSeek-R1 的论文我们也会一行一行精读。

这周走完，Transformer 类的面试八股加手撕题基本就不再是障碍。

# 阶段四：大模型部署、压测、应用开发实战（第 4 周）

到这一周开始进入工程。

FastAPI 框架（路由、依赖注入、异步 I/O、Streaming）作为后端底座，vLLM 部署 Qwen3 模型并暴露推理接口，并发与压测（TPS、首字延迟、吞吐、P99），这是把一个模型变成服务的全流程。

应用层会讲高级提示词工程（多角色系统提示、CoT、Self-Consistency、动态上下文窗口裁剪）、JSON Schema 结构化输出技巧、Function Calling 协议与工具链整合。

本周产出：完成「深学 AI 助手」项目，一个可以线上演示的 AI Chat 服务。

# 阶段五：RAG 从入门到工业级（第 5 - 6 周）

RAG 这两周是真正的硬骨头。

第 5 周走原理：RAG 核心价值、Naive RAG 流程、Chunking 策略、Embedding 模型选型、向量数据库（ChromaDB / FAISS / Milvus）、LlamaIndex 核心组件。然后我们会带你手撕 20 种 RAG 优化方案——语义分块、上下文增强、查询转换、重排序、上下文压缩、自适应 RAG、命题分块、多模态 RAG、图 RAG、融合检索、HyDE、动态纠正 RAG……每一种都是一个 Notebook，跑完你就知道它适合什么场景、不适合什么场景。

第 6 周直接进项目：金融研报 RAG 系统。

# 工业级项目：金融研报 RAG 系统

应用场景是金融保险公司内部知识问答，覆盖公司制度、销售策略、产品信息、市场研报等多类文档。这个项目的价值不是搭一个 Pipeline 就结束，而是有明确优化目标、有可量化指标、有迭代路径的 RAG 工程案例。

文档解析层的工程挑战：金融文档以 PDF 为主，表格密集、跨页内容频繁、层级结构复杂，通用解析方案在这类文档上表现往往很差。我们的方案是 10+ 文件格式支持（PDF、Word、Excel、HTML，结合 OCR 增强处理扫描件），引入表格识别和版面分析模型把整体解析准确率提升 15%，针对金融表格跨页断行问题设计专用切分逻辑把信息缺失率降低 85%，并在 Chunk 中保留章节标题、表格标注等结构元数据供检索时使用。

检索层的混合策略：单一向量检索在实际业务中存在明显局限——对关键词精确匹配不敏感、对短查询效果差。我们采用并行 BM25 关键词索引 + 向量检索的动态混合机制，根据 Query 特征自动调整权重，短查询命中率提升 40%；"宽召回 + 精排序"两阶段设计将整体召回率提高 10%，前 3 页结果相关度达到 92%。

系统化优化矩阵：这是这个项目区别于一般 RAG 课程的核心部分。我们把优化维度拆解成一张矩阵

阶段	模块	优化方向	效果
召回	解析	跨页 Chunk 策略	信息缺失率 ↓85%
召回	Query	查询扩展与改写	短查询命中率 ↑40%
召回	匹配	动态混合检索权重	召回率 ↑10%
生成	解析	结构元数据注入	解析准确率 ↑15%
生成	匹配	动态阈值过滤	前3页相关度 92%

在召回阶段和生成阶段、在解析模块、Query 理解模块和匹配模块这个 2 × 3 矩阵里，我们覆盖了 20 个具体可落地的优化方案，每一项都有对应的实现思路、适用条件和预期收益。

这种结构化的方法论，在面试中能够清晰地呈现你对 RAG 系统的系统性理解，而不是"遇到问题查文档试一试"。

项目的行业迁移价值：知识库内容和工具链调整后，同一套系统可以直接应用于法律合规、医疗知识库、企业内部制度查询等场景。项目本身就是一个可复用的工业级 RAG 基础框架。

# 阶段六：Agent 全栈开发（第 7 周）

Agent 这一块是目前面试问得最深的方向，所以我们在这里下了重本，配了三个工业级项目。

学完项目完成后，你将拥有可展示、可部署、可答辩的项目成果，并且是可以直接写到简历上去面试的用的。

# 工业级项目 1：企业培训 Agent · 多模态 Multi-Agent 系统

应用场景是新能源车企智能销售培训助手，覆盖车辆参数知识库、竞品实时对比、个性化话术生成。

系统整合了三大核心能力模块：

RAG 问答模块：基于本地文档向量化的知识库检索，覆盖车辆参数、配置说明、常见问题等结构化与非结构化文档，支持混合检索策略。
实时 Web 搜索模块：集成搜索引擎 API 与网页解析技术，实时获取竞品对比信息、行业政策动态、用户口碑评价等时效性强的外部内容，突破大模型知识截止日期的限制。
智能 Agent 模块：基于 ReAct 框架，实现用户画像分析（背景、需求偏好、购车阶段）、多工具动态调度、跨轮次对话记忆管理，并根据分析结果生成针对性的销售话术。

完整的 Multi-Agent 循环涵盖五个核心环节——Plan（根据用户意图制定执行计划，决定调用哪些工具）、Memory（维护跨轮次用户偏好和对话摘要）、Action（执行具体工具调用）、Tool（统一工具注册与调用接口，支持动态扩展）、Reflection（对结果自我评估，决定是否重规划）。这套架构的工程挑战在于各环节之间的状态传递、工具调用失败时的降级策略、以及如何在保证输出质量的前提下控制响应延迟。

行业迁移上，这套架构通过调整知识库内容和工具链配置可以直接迁移到金融客户理财顾问、医疗智能问诊辅助、教育个性化学习、电商智能导购等多个场景。

# 工业级项目 2：DeepResearch · 生产级深度研究 Agent

系统规模：33,885 行代码 · 165 个文件模块 · 25+ 服务组件 · 12 张数据表

这是一套完整的深度研究系统，功能层面对标 Kimi 深度研究、智谱等产品的同类能力，但以工程可解释性为核心目标构建——每一个技术选型都有明确的动机，适合在面试中完整讲述。

1. 多 Agent 编排：LangGraph 状态机

系统由 6 个专职 Agent 组成协作网络，分别承担规划、检索、编码、审计等职责，通过 LangGraph 状态机进行编排。任务调度采用 DAG 结构，支持复杂逻辑依赖与并行执行。

与简单的顺序 Chain 相比，这套架构的优势在于：单个 Agent 失败不会导致整个流程崩溃，审计 Agent 可以异步介入任意节点，且整个执行过程的状态是可持久化和可恢复的。

2. 代码安全沙箱与自愈机制

当 Agent 在执行过程中生成并运行代码时，存在两个核心问题：安全隔离（防止恶意或意外的系统操作）和执行容错（代码报错后如何处理）。

我们的解决方案是：在隔离沙箱中运行 Agent 生成的代码，自动捕获 StackTrace，并将错误信息反馈给 Agent 触发递归自愈修复，最终实现无需人工干预的复杂任务执行。这是一个在面试中非常有说服力的技术亮点，因为它涉及安全、工程容错和 Agent 能力三个维度。

3. 全链路流式架构

系统采用 SSE + RabbitMQ 的组合实现流式输出。SSE 负责将服务端事件实时推送到前端，RabbitMQ 作为消息队列在各服务之间解耦，保证即使后端处理时间较长，前端也能感知到毫秒级的首字响应。

这个设计解决的是深度研究场景中一个实际的用户体验问题：一次完整的研究流程可能持续几分钟，如果没有流式反馈，用户无法感知进度，体验极差。

4. 企业级断点续传

基于 PostgreSQL + 前端 UI 的双重状态持久化（Checkpointer 机制），系统能够在网络中断、页面刷新等异常情况下完整保存 Agent 的中间状态，恢复后从断点继续执行，而不是从头重来。

这是本项目中工程复杂度较高的一个模块，也是绝大多数候选人的项目中缺失的能力——因为大多数 Demo 级项目根本不考虑状态持久化。

5. 工业级 RAG：可信度评级 + 混合检索

检索模块采用 Milvus + Elasticsearch + Redis 的混合架构，通过 Cross-Encoder 对候选结果进行交叉验证和重排序。在此基础上，系统引入了 Evaluator Agent 对每个检索来源进行实时可信度评分，并支持递归深度搜索：当初步检索结果的置信度不足时，系统会自动触发更深层的搜索策略，并在最终输出中附带完整的信源追溯链路。

这套设计直接回应了 RAG 系统最常被追问的问题：幻觉怎么控制？答案不是"加了重排序"，而是有一套从检索到生成全链路的质量保障机制。

6. FC-SFT 微调闭环（Function Calling 专项微调）

这是本课程在全网同类内容中较为稀缺的部分。完整流程包括：

样本构造：5000+ 高质量 Function Calling 样本，涵盖多种工具调用场景
训练策略：针对工具调用任务的学习率、数据配比等调优经验
生产级评估：基于实际业务指标（工具选择准确率、参数提取正确率等）的评估框架
迭代优化：根据评估结果定向补充数据并重训的完整闭环

微调的价值不只是"让模型更听话"，而是在特定工具调用场景下，通过微调使小参数模型的表现达到甚至超过通用大模型，同时大幅降低推理成本。

7. 生产环境一键部署

完整的 Docker Compose 编排，覆盖 PostgreSQL、Milvus、Redis、Elasticsearch 全部依赖服务，遵循 IaC 标准，任何有 Docker 环境的机器均可一键启动。

# 工业级项目 3：Agent SKILL（本月新开讲）

这是我们最新的原创落地项目，围绕 Agent Skills 这个最新方向，本月正式开讲。具体内容会在直播中讲解。

# 阶段七：SFT 微调实战（第 8 - 9 周）

微调这一块两周时间，从原理到工程到简历。

第 8 周走全景：Full FT、PEFT 系列（LoRA、QLoRA、Adapter、IA³、Compacter）、Prefix-Tuning / Prompt-Tuning / P-Tuning v2、指令微调 SFT 的目标和数据构建，再到 Hugging Face transformers / trl / peft / unsloth / LlamaFactory 这套全家桶的接口怎么用。

第 9 周直接上手三个微调项目：基于 LlamaFactory 微调 Qwen3 法律大模型、基于 Unsloth 微调 DeepSeek-R1-Distilled Llama 8B、基于 trl 手撕全流程微调（从数据集构建、模型量化、peft LoRA 注入、SFTTrainer 训练循环、指标回调到模型评估）。

本周产出是一条可放入简历的微调项目经历（含量化指标），加上一份覆盖显存估计、数据格式、灾难性遗忘、数据量曲线等 9 个核心主题的《微调工程手册》。

# 阶段八：RLHF 实战，PPO / DPO / GRPO（第 10 周）

强化学习这一块面试里被问得越来越多，但很多人卡在"原理一知半解、代码完全没动过手"。

我们的做法是三种算法都要手撕：PPO 从策略损失、价值损失到 KL 散度的训练循环；DPO 从损失函数推导到训练逻辑实现，理解为什么能绕过显式奖励模型；GRPO 作为 DPO 的泛化形式，理解它和 DPO 的差异点。

实战项目同样配三个：基于情感奖励模型的 Qwen2.5-0.5B PPO 训练、基于 PyTorch 原生实现 + 10 万条偏好数据的 DPO 训练、基于 Qwen2.5-0.5B / Qwen3-4B 的 GRPO 复现。

走完这周，DPO / PPO / GRPO 的损失函数你应该能现场推导，前世今生能完整口述。

# 阶段九：多模态大模型实战（第 11 周）

多模态这一周从基础走到实战：文本-视觉信息融合的意义和跨模态对齐挑战、ViT 结构、Patch-Embedding 和全局注意力，然后是多模态预训练范式（CLIP 对比学习、BLIP/BLIP-2 的 Q-Former 机制、LLaVA 两阶段训练）。

实战部分两个项目：从零到一训练多模态大模型、Qwen2.5-VL 多模态微调。这周结束你会拥有一份独立的多模态微调项目经历。

# 阶段十：分布式训练实战（第 12 周）

分布式训练是大模型工程里的硬骨头，也是社招高级岗位必问的点。

这一周覆盖数据并行（DP、DDP、DeepSpeed-ZeRO 1/2/3、ZeRO-Offload）、模型并行（TP、PP、SP、EP）、混合并行（DP + TP + PP）、分布式通信（NCCL）、混合精度训练（FP16 / BF16）、FSDP 和 DeepSpeed 下的 checkpoint 与断点续训。

实战项目是基于 Qwen2.5-14B 的分布式训练和微调，让你真正用过 Accelerate + DeepSpeed 这一套，而不是只看过文档。

# 阶段十一：大模型预训练实战（第 13 周）

预训练我们不要求每个人都能从零跑一遍 671B 的训练，但你需要理解每一个环节。

这一周覆盖预训练的数据引擎（数据获取、清洗、配比、Tokenizer 训练）、主流架构演进（从 Transformer 到现代大模型）、Scaling Laws 和涌现能力。实战项目是从零到一实现 nano Qwen 预训练，加上 DeepSeekV3、Qwen3、LLaMA3 三套预训练全流程的技术解析。

# 阶段十二：面试冲刺与 Offer 收割（第 14 周）

到这一周，技术已经齐全了，剩下的就是怎么把内功变成 offer。

这一周包括简历终审 + 大模型项目深挖式包装、500+ 大模型面试真题精讲、大厂连环炮模拟面试、力扣算法高频题路径，以及拿到 offer 之后的选择咨询——这一项被很多同学反馈是"避开了大坑"的关键环节。

# 吃透这些项目，面试官问什么你都有话说

工业级项目的价值不只体现在代码量上，更体现在面试时能够清晰讲述每个技术决策的背景、方案和权衡。

很多人面试的时候最怕被问"为什么这么设计"——因为他们的项目根本没有"为什么"，只是跟着教程跑通了。

吃透我们训练营的项目之后，以下这些面试官最爱追问的问题，你都能答上来，而且能展开讲：

#	技术模块	典型面试问题
1	信源可信度评级系统	RAG 怎么保证信息质量？评分依据是什么？
2	递归深度搜索 + 信源追溯	检索结果置信度不够怎么处理？
3	代码安全沙箱 + 自愈机制	Agent 执行代码怎么保证安全性？执行失败怎么恢复？
4	对抗式幻觉检测	LLM 幻觉问题你们怎么系统性处理？
5	SSE 流式输出 + 消息队列	长任务场景下用户体验怎么保障？
6	断点续传系统	任务执行中途异常退出如何恢复？状态怎么存储？
7	分层过滤混合检索	向量检索和关键词检索怎么融合？权重怎么确定？
8	Text2SQL 智能查询	Text2SQL 在多表关联时有哪些坑？怎么处理歧义？
9	知识图谱自动构建	非结构化文本到知识图谱的构建流程是什么？
10	长期记忆系统	跨会话的用户记忆怎么管理？存储结构是什么？
11	Agent 工具调用 SFT 微调	为什么要微调而不是提示词工程？怎么评估效果？
12	双版本架构 V1 ReAct + V2 Multi-Agent	架构演进的动机是什么？怎么做 A/B 评估？

这不是背题，是真正做过之后的自然输出。这是做 Demo 的人永远给不了你的东西。

# 专属平台上交互式学习 + 动画演示

# 三、课程使命

在过去三年里，小林大模型团队已经帮助近1000+名学员成功转向AI赛道，有人从传统后端岗转型为大模型应用开发工程师，也有人在99天内实现了从Python小白到入职AI公司的突破。

这门课程的目标不是让你“听懂概念”，而是让你能写项目、能讲思路、能拿Offer。

我们要做的，是让你靠实力拿下大模型应用开发/Agent开发岗位。

同时，我们花了半年时间，自研了一个大模型训练和学习的平台（即将上线），目的只有一个：让学员们的学习效率能更加高效！

哪怕能节省一天的时间，在校招过程中也能比竞争者多学一天。

同时，我们还额外新增了两个助教，来辅助解决一些零基础同学在诸如环境配置等地方容易卡克的问题。

# 四、训练营服务

学习内容只是这件事的一半，另一半是怎么把学到的东西变成 offer。我们围绕这个目标配了一整套陪跑服务。

1v1 简历和面试辅导

我会从简历、算法、八股、项目四个方向，把你已经掌握的东西落实到求职环节。具体来说：

简历优化：怎么把大模型项目的细节和工程亮点呈现在简历上，让面试官第一眼就有追问的兴趣，而不是被淹没在一堆相似简历里
力扣算法：大厂高频题路径——该刷哪些题、按什么顺序刷，不做无用功
大模型八股：精选 500+ 道面试真题，直接瞄准高频考点，不用大海捞针
大模型项目：你简历上的每个项目，面试官会怎么追问、追问到第几层、什么时候会切场景题，我都会提前给你拆开讲

1v1 答疑辅导

学习过程中卡住是常事，尤其基础薄弱的同学，一个问题死磕一两天是非常常见的。但很多问题其实有人指点一下马上就通了。1v1 答疑就是让你不要在小问题上消耗整体进度。

1v1 职业发展规划

技术之外，offer 怎么选、要不要跳槽、当前阶段适合冲什么样的公司，这些问题也都可以问我。我的建议大概率会让你少走一些弯路、避开一些大坑。

配套学习资源

资源类型	说明
视频课程	直播 + 录播双轨，不限次数回看，两年有效期
配套文档	详细的技术文档与架构说明，配合代码使用
完整代码	项目完整源码，包含环境配置、部署脚本
云服务器	24G 显存云服务器 + 4090 独享算力（课程期间 6 个月），免去本地环境配置成本
求职社群	内推岗位实时发布，同方向学员经验共享

目前取得的成果

模型训练营自开设以来，已累计帮助近千名学员完成职业转型，覆盖传统算法工程师转大模型方向、应届生进入 AI 公司、非 CS 背景从业者系统补课等多种路径。

学员去向覆盖：字节、阿里、腾讯、百度、华为、美团、讯飞、淘天，以及上海 AI Lab、智谱、MiniMax、月之暗面、壁仞科技、理想智能座舱 AI、蚂蚁 AI 研发等国内外中大厂与独角兽。

（全部都是真实学员案例，有时间线和背景记录）

报名咨询

# 五、试听课

试听课1：Agent场景介绍 (opens new window)

试听课2：简历要什么技能 (opens new window)

试听课3：就业市场介绍 (opens new window)

# 规划时间线

规划时间线

# 确保每个同学清晰自己的规划

确保每个同学清晰自己的规划

# 明确指出不行的方向，不走弯路

明确指出不行的方向，不走弯路

# 详细分析当前状态，并且给出确定的路径

分析优势劣势，扬长避短，明确后续4个月具体动作

# 明确具体路径

# 六、4大核心技能 × 3大工业项目

# 技能矩阵

RAG（检索增强生成）
├── 向量数据库与Embedding
├── 多路召回与重排序
├── 20种工业级优化方案
└── 【项目落地】金融研报RAG系统

Agent（智能体开发）
├── ReAct决策循环
├── Memory记忆机制
├── Function Calling / MCP
└── 【项目落地】企业培训Agent，DeepResarch系统

SFT（指令微调）
├── 数据构造方法论
├── LoRA / QLoRA实战
├── 训练策略与评估
└── 【项目落地】Functioncall微调

RL（强化学习对齐）
├── RLHF核心原理
├── PPO / DPO / GRPO
├── Reward Model训练
├── 数据构造、评估迭代
└── 【项目落地】RLVR-GRPO微调Reward Model

# 🏆 3大工业级项目

项目1：金融研报RAG系统

项目2：企业培训Agent

项目3：行业咨询DeepResearch |

# 七、短期8周冲刺路线

注意：以下为通用路线框架，你的具体安排将在报名当天1v1会议中根据个人情况定制

# 第1周：破冰 + 定制路线

事项	内容
Day 1	报名当天1v1会议：背景评估 + 路线定制
Day 2-4	基础速通（根据你的背景跳过或精学）
Day 5-7	LLM调用 + 提示词工程

本周产出：个人专属8周学习计划 + 简历初版框架

# 第2-3周：RAG从入门到工业级

事项	内容
Week 2	RAG核心原理 + 实现
Week 3	20种进阶优化 + 工业级项目实战

本周产出：完成「金融研报RAG系统」，第一个简历项目到手

# 第4-5周：Agent全栈开发

事项	内容
Week 4	Agent架构 + ReAct + Memory + Tool
Week 5	Multi-Agent + MCP + 项目实战

本周产出：完成「企业培训Agent」+DeepResearch，第二个简历项目到手

# 第6周：SFT微调实战

事项	内容
全周	数据构造 → LoRA微调 → 评估迭代

本周产出：掌握微调全流程 + Functioncall微调项目（必杀技）

# 第7周：RL强化学习

事项	内容
全周	PPO/DPO/GRPO原理 + Reward Model训练

本周产出：掌握前沿对齐技术 + GRPO项目（必杀技）

# 第8周：面试冲刺 + Offer收割

事项	内容
Day 1-3	八股速记 + 项目深挖准备
Day 4-5	第二次1v1：简历终审 + 模拟面试
Day 6-7	查漏补缺 + 心态调整

本周产出：面试制胜宝典 + 完整简历 + 上战场

# 八、你将获得

# ✅ 课程资源

20周系统课程（视频 + 代码 + 笔记）
3大工业级项目完整代码
2个必杀项目（Functioncall微调 + GRPO）
500+大模型面试真题库

# ✅ 1v1深度辅导

报名当天：背景评估 + 路线定制
第8周：简历终审 + 模拟面试
1v1答疑

# ✅ 直播课程

每周直播：技术精讲 + 答疑
必杀项目专场：视频带做

# ✅ 配套服务

4090独享算力（课程期间，6个月）
春招岗位每日更新
技术社群答疑

我们不仅讲Transformer的结构，更会带你从零手撕Attention、FFN、RoPE、MOE，理解每个细节的计算原理。所有内容均配备视频课、课件、Notebook代码、实战ZIP包与直播拆解。

我们的课程从25年1月开始，到目前已经到了第4期，每一期都会根据最新的tech出全新的内容；后续会以季度为单位进行不断更新，一次报名，享受2年内课程更新内容。

# 九、适合人群

🎓 校招/实习生：希望补足项目经历、提升简历竞争力，想往AI Agent开发岗位发展
💼 社招转岗选手：想从传统后端开发转向AI Agent开发/大模型应用开发岗位
🧑💻 零基础学习者：有编程基础但缺少AI Agent项目经验
🧭 迷茫选手：学习方向不清晰、缺少系统路径和监督

不论你是想进入AI大厂、创业公司，还是研究型岗位，这门课程都能让你拥有落地能力与求职自信。

我们不太适合的人：

抱着两三周速成想法、没有 4 个月时间投入的同学
只想买课，但不愿意完成项目、不愿意参加 1v1 规划会议的同学

# 十、课程价格与服务

我们的价格，是基于“长期陪跑 + 全流程辅导”的正规教学服务，我做这个课程的初衷是一步步带你真正掌握大模型知识点、面试表达与项目经验，确保你靠自己的实力，稳定拿到中小厂或者大厂的Offer。

课程价格与服务说明：课程原价：¥14999，限时学员价：¥8999 （即将恢复原价），还支持多期复训，其实是不到 100 元/天，能换来一个新职业的敲门砖，这投资太值了。

这个价格大约相当于入职后一个月工资的三分之一，但能帮你拿到高薪Offer、夯实算法能力、改变职业轨迹。

相比于动辄上万甚至数万元的机构课程，我们的课程没有中间商差价、没有虚假广告成本，每一分钱都花在教学、辅导和服务上。

大家如果对大模型训练营感兴趣，想要报名、或者想进一步咨询，或者想看大模型的试听课程。

# 大模型学员真实案例

以下均为100%真实学员案例，真实可查

# 智谱算法Offer

背景：QS300本硕，原自动驾驶岗离职1年，

Offer：社招拿下某大厂大模型算法Offer

时间线：4.14-6.2

4月14日-6月2日，自动驾驶岗离职后在一家校企合作小型工作一年，经过2个月学习，和不断的简历打磨，拿下多家头部企业大模型算法Offer

# 理想智能座舱Agent

背景：工业设计本科，设计学硕士

Offer：某大厂智能座舱Agent算法

时间线：4.17-6.3

其实刚来的时候我是劝退的，设计学转大模型算法跨度太大了，当时我觉得aigc+设计方向不错，未必要转

但是同学很坚持也很努力

4月17日还在看tramsformer架构，6月2日已经拿到Agent offer了，整个过程见证努力💪，真的非常棒

# 土木转LLM算法

背景：土木本硕

Offer：某大厂大模型初创pretrain+toolcalling，创始人亲自带

时间线：5.13-5.28

2周时间，真从零开始，【土木转大模型】，卷也是真的卷，综述我当时看了一周，一天刷完，还给我讲了一遍，算是从土木坑里爬出来了

# 零基础淘天LLM

背景：零LLM基础、零实习、零项目

Offer：某大厂大模型Offer

时间线：2.26-5.27

从2月几乎没有llm基础开始。到5月拿到淘天offer，我是亲眼见到了同学一路走来的努力，第一次见准备hr面写了十几页的word

# 三本本985硕上海AI Lab

背景：三本本科，985硕士

Offer：某人工智能研究院、中国电信研究院大模型

时间线：3.10-5.21

从3月零大模型基础报名，到5月2个月时间，拿到了上海人工智能研究院等不少心仪的offer

也是我见过的执行力最强的同学之一，从学历一般到大厂算法的路不是没有可能

# 双非本国央企大模型

背景：双非本，211硕士

Offer：某国创研究院

时间线：4.17-6.22

从4月零大模型基础报名，到6月2个月时间，拿到了南京国创等多家国央企offer，目前还在不断学习，准备秋招冲刺大中厂

# 双非本硕华为AI工程师

背景：双非本硕

Offer：华为AI工程师

时间线：3.30-6.11

从3月零大模型基础报名，到6月底3个月时间，拿到了华为AI工程师、美团等大厂offer

同学非常喜欢钻研，中间一度非常焦虑，投出的简历都没有回应，也经过多次线上会议沟通，明确学习方向和路径，不断优化简历和面试，最终拿下多家大厂offer

# 法国本硕Offer收割机

背景：法国本硕

Offer：阿里bravo计划

时间线：2.16-6.15

从2月报名，有一定基础，但是rag经历没有深度，只有最基础的流程，到6月底3个月时间，拿到了阿里、vivo、同花顺等等多家大厂offer

感觉是同学非常聪明，一点就通，1个半月的时候简历就已经改的非常好了，但是因为人在法国经常错过HR电话，否则offer会更多

# 金融转LLM-高德春招offer

背景：金融双非本海硕

Offer：高德春招正式岗Offer

时间线：4.16-6.26

真完全零基础，不会print（“hello world”），4月16报名，2个月时间拿下高德正式岗位Offer

非常聪明，结合课程里面的技术，改写自己的经历，后面已经能非常清晰地说出不同场景下的解决方案，中间也经历了被美的毁offer等等一系列情况，最终拿下高德offer！从春招0金融offer到大厂大模型！

# 双非大二拿下初创实习offer

背景：双飞本科大二

Offer：环界云

时间线：1.18-6.21

大二，双非零基础，5个月时间拿下多家中小厂、初创实习offer

中途会怀疑双非能不能做算法，也有很多质疑的声音，但是多次会议沟通鼓励，最终拿下第一个实习offer（包括中厂+融资非常好的创业公司），后面的路会越来越顺。

只要有时间和决心，路都是人走出来的

# 蚂蚁AI研发

背景：研二

Offer：蚂蚁AI研发工程师

时间线：3.30-6.21

研二，科班背景，顺利拿下蚂蚁**AI研发工程师，**在沟通中继续进行多模态LLM训练研究

# 机械转LLM-大厂AI coding

背景：机械本硕研一

Offer：多家大厂LLM算法offer

时间线：3.3 - 6.9

研二，机械本说，做时间序列，无LLM背景，3个月顺利那家多家LLM算法offer，最终入职一家做AI coding的大厂，研一拿到大厂offer，后续可冲ssp

# 货拉拉大模型Offer

背景：211本985硕士

Offer：货拉拉大模型算法

时间线：3.3-6.12

研二，电子信息，3月3日加入训练营的时候非常焦虑，简历空空拿不出手，经过3个月的时间拿下货拉拉、华为、中长AIGC、广东人工智能实验室Offer

# 华为AI工程师

背景：双飞本硕

Offer：华为AI工程师

时间线：3.19 - 6.12

刚入营只会基础的RAG，只有小厂的offer，经过3个月之后拿到华为AI工程师offer，但是入职后仍然有些迷茫，经过沟通明确以后方向，又信心满满投入到工作中

# 二本开发转LLM

背景：二本

Offer：北京大模型开发offer

时间线：5.13-7.11

二本非科班，后端开发转LLM，2个月转LLM，薪资涨幅50%

# 独角兽LLM算法offer

背景：研二

Offer：独角兽LLM算法offer

时间线：6.27-7.10

同学入营时间已经比较紧了，制定了2周学习计划，在两周速成计划后，拿到独角兽算法offer

# 土木转图谱+LLM

背景：双非土木本+海外地理硕士

Offer：中厂图谱大模型

时间线：6.13-7.05

同学是土木本科，地理硕士，几乎可以说毫不相关，经过RAG+Agent强化练习，丝滑接到中厂图谱大模型offer

# 开发转LLM算法

背景：双非本

Offer：千人创业公司大模型算法

时间线：2.20-3.31

同学是双飞本科，目前在一家几个人公司做全栈开发，有调用大模型API写提示词经验，经过课程中RAG、Agent、SFT强化训练，1个半月拿到创业公司（“国家高新技术企业”和北京市“专精特新”中小企业，公司员工规模为 500–999 人左右）大模型算法Offer

# 美团、科大讯飞飞星计划

背景：211本海硕

Offer：美团offer

时间线：4.7 - 6.3

211本海外硕，错过了实习，经过2个月的集中训练，拿到美团offer

**最新更新：**现在又拿到了科大讯飞飞星计划

# 淘天AI工程师

背景：985硕-研1

Offer：淘天AI工程师

时间线：5.11 - 5.31

基于零LLM经验，1个月拿到淘天AI工程师offer，现在才研1，后续可冲大厂SSP，60-80w的总包

# 课程大纲公开版

以下内容是我们 2025 年 6 月份规划的一个课程学习计划，截止 2025 年 10 月份，这个课程计划已经迭代了 4 个版本，最新版本新增了至少五个大项目，训练营的学员可以免费查看。

这里并不是把实战项目生搬硬套到你的简历里，而是会根据你的实际情况，定制化地合理地让你拥有自己的专属的实战项目经历

【项目1】企业培训Agent
【项目2】金融研报RAG系统
【项目3】行业资讯助手DeepResearch
【项目4】深学AI助手

# 添加微信，了解是否合适报名

# 训练营99天学习计划

大模型算法工程师养成计划：14周通关！

导语：本训练营由浅入深，理论与实战并重，覆盖从基础 Python、神经网络到前沿的Transformer结构、0-1预训练、微调、强化学习（RLHF）、RAG、Agent 、多模态、分布式部署、量化蒸馏、推理加速等技术。
学习方法：学习计划以天为单位，每周一个模块，【每一周】都将解锁核心技能、掌握关键模块、完成硬核项目，助你系统掌握大模型全栈知识，具备大厂算法工程师的核心竞争力，自信应对面试，斩获心仪 Offer！
配套资料：🎯主线视频 +配套笔记+Notebook 实操+工业级实战+大厂leader指导