从0到1掌握AI大模型开发,涵盖模型训练、RAG、Agent,助力转行AI开发

课程概览:从零开始,系统掌握AI大模型开发
这门课程专为希望转行AI开发的学习者设计,内容覆盖了从基础理论到实战项目的完整路径。无论你是刚入门的新手,还是有一定基础想进阶的开发者,都能在这里找到适合自己的内容。课程从人工智能的发展脉络讲起,逐步深入到模型训练、RAG(检索增强生成)以及Agent(智能体)等前沿技术,帮助你真正实现从0到1的跨越。
课程的第一部分带你了解人工智能的迭代路径、大模型进化树和技术分类,让你对整个领域有一个宏观的认知。紧接着,你会接触到“柏拉图表征假说”与“Scaling Law”等核心理论,理解大模型背后的缩放定律,为后续的学习打下坚实的理论基础。
环境搭建与基础准备:
在正式进入开发之前,课程专门安排了一节课来指导你搭建AI开发环境,包括Python、Conda和VSCode的配置。这部分内容非常实用,能帮助你避免很多初学者容易遇到的“环境配置”问题,让你能更快地投入到实际编码中。
有了环境之后,你会学习如何使用llama-factory进行大模型微调的环境准备。这是后续所有模型训练和微调工作的基础,确保你能顺利地进行实验和项目开发。
模型训练与微调实战:
课程在模型训练方面提供了非常详细的指导。你会学习如何准备微调数据集,包括SFT(监督微调)、继续预训练和偏好优化等不同策略。通过Lora微调和QLora微调的实战讲解,你能掌握高效微调大模型的核心技巧。
训练完成后,课程还会带你进行模型评估,包括批量推理和自动评估benchmark的使用。此外,模型合并、导出、量化以及本地部署的步骤也会一一展开,让你真正拥有一个可用的、属于自己的模型。
RAG技术深度解析:
RAG是当前大模型应用中的热门技术,课程对此进行了系统性的拆解。从Naive RAG的基础原理与Langchain实践,到高级RAG技术如层次索引、句子窗口、子查询和HyDE,你都能学到。课程还涵盖了模块化RAG的多种模式,包括顺序模式、条件模式和分支模式,帮助你应对不同的业务场景。
为了提升RAG系统的效果,课程专门讲解了Rerank技术,包括交叉编码与双编码的原理,以及RankGPT的微调实践。此外,向量数据库的相关知识也是重点,你会学习到相似性搜索算法(如k-means、肘部法则)、近似邻近算法(如HNSW、LSH)以及Chroma和Qdrant等向量数据库的代码示例。
课程最后还分享了RAG行业落地的实践心得、落地经验和业务场景,并介绍了如何通过RAGAs和TruLens等工具对RAG系统进行评估,确保你的应用既高效又可靠。
Agent原理与设计模式:
Agent是课程的另一大亮点。你会从原理层面理解Agent的Planning(规划)、Memory(记忆)和Tool Use(工具使用)等核心组件。课程还介绍了国内外主流的Agent平台,并指导你如何使用Coze搭建智能客服。
在Agent设计模式方面,课程涵盖了Fewshot、ReAct、REWOO、LLMCompiler、Reflexion等经典模式,以及Single Agent和Multi-Agent架构的设计思路。通过Langgraph、AutoGen和CrewAI等项目的原理与实战,你能亲手搭建出具备协作能力的多Agent系统,真正体验智能体的强大能力。
知识图谱与GraphRAG:
为了进一步拓展你的知识面,课程还引入了知识图谱和GraphRAG的内容。你会学习RDF、RDFS、OWL等知识图谱架构,并掌握GraphRAG的索引原理、Leiden算法以及全局查询和局部查询的实现方式。LightRAG的使用、参数解读以及与Neo4j的结合,也会通过代码示例一一呈现。
通过这部分学习,你将能够利用图结构来增强大模型的检索和生成能力,解决更复杂的业务问题。
Embedding与相似性搜索:
课程深入讲解了Embedding的原理,包括word2vec、CBOW等经典模型,并教你如何使用llamaindex进行Embedding模型的微调。你还会学习到如何通过MRR和MTEB等评测指标来评估Embedding模型的效果。
在相似性搜索部分,课程介绍了欧式距离、余弦相似度等基本测量方法,以及k-means、PQ量化、HNSW等算法。这些内容将帮助你构建高效的检索系统,为RAG和Agent应用提供底层支持。
会员资源
会员用户免费查看此资源升级会员
