第一天
大模型的网络架构
控制LLM输出的一些配置:输出长度、温度、TOP-K、TOP-P、其依赖于具体的模型。
提示词工程:了解零样本、多样本提示词;系统提示词(System)、语境提示词(Contextual)、角色提示词(Role);Chain of Thought (CoT)、Tree Of Thoughts (ToT) 、Reason&act (ReAct),以及一些对代码编写的提示方式。
教程文档:大模型和文本生成的基础 提示词工程
第二天
多模态数据的嵌入:文本、图像、声音、结构化数据、图数据
向量数据库
RAG架构
代码练习:构建简单智能体,从向量数据库中进行检索匹配操作,从而丰富prompt信息
教程文档:嵌入和向量存储
第三天
生成式AI智能体:介绍了智能体跟模型的区别,重点在于智能体能根据用户输入,自觉的采取行动(如检索、执行函数、调用API等等)。下图对Tool的类型做了一个总结。
代码练习1:构建AI智能体以进行SQL查询:利用了谷歌AI的Tool功能,使智能体可以调用函数
代码练习2:通过LangGraph搭建了一个简单的咖啡店对话下订单智能体,用了LangGraph和LangChain,较为复杂,涉及到状态、节点、边、执行Tool等等,还在理解的当中
教程文档:智能体
第四天
介绍了LLM在特定领域的应用,以网络安全和医疗系统为例
其中,提到了应用到特定领域,需要在原始大模型基础上,加入领域知识进行下一阶段的预训练,之后进行监督微调(涉及到更加权威的领域的知识),PET特制化(PET似乎就是再用专业知识对参数进行微调),之后在查询过程中利用RAG增强数据,最后得到准确结果
教程文档:大模型在特定领域应用
第五天
介绍(营销)了一下谷歌自己的Vertex AI平台
介绍了一个AI产品构建的全过程,包括开发、实验、部署三个大流程。而其中开发和实验过程中,又包括基础模型的选取、提示词模版搭建、模型链构建(让智能体能够执行动作)、微调训练、数据管理、模型评估等流程。在部署过程中,又需要区分基础大模型,和生成式AI系统,其中基础大模型一般要评估硬件条件等等(普通人劝退),生成式AI系统则需要做好版本控制、单元测试和集成测试、以及针对不同的用途做延迟评估、整体评估与组件评估等等。部署完之后,还需做好模型的监测和管理工作。
教程文档:MLOps
相关资料:
所有视频讲解:(Daily Livestreams for 5-Day Gen AI Intensive Course - YouTube)
申明:以上资料均源自Google官方5-Day Gen AI活动,仅供学习使用。