5-Day Gen AI

第一天

大模型的网络架构
控制LLM输出的一些配置：输出长度、温度、TOP-K、TOP-P、其依赖于具体的模型。
提示词工程：了解零样本、多样本提示词；系统提示词(System)、语境提示词(Contextual)、角色提示词(Role)；Chain of Thought (CoT)、Tree Of Thoughts (ToT) 、Reason&act (ReAct)，以及一些对代码编写的提示方式。
教程文档：大模型和文本生成的基础提示词工程

第二天

多模态数据的嵌入：文本、图像、声音、结构化数据、图数据
向量数据库
RAG架构
代码练习：构建简单智能体，从向量数据库中进行检索匹配操作，从而丰富prompt信息
教程文档：嵌入和向量存储

第三天

生成式AI智能体：介绍了智能体跟模型的区别，重点在于智能体能根据用户输入，自觉的采取行动（如检索、执行函数、调用API等等）。下图对Tool的类型做了一个总结。
代码练习1：构建AI智能体以进行SQL查询：利用了谷歌AI的Tool功能，使智能体可以调用函数
代码练习2：通过LangGraph搭建了一个简单的咖啡店对话下订单智能体，用了LangGraph和LangChain，较为复杂，涉及到状态、节点、边、执行Tool等等，还在理解的当中
教程文档：智能体

第四天

介绍了LLM在特定领域的应用，以网络安全和医疗系统为例
其中，提到了应用到特定领域，需要在原始大模型基础上，加入领域知识进行下一阶段的预训练，之后进行监督微调（涉及到更加权威的领域的知识），PET特制化（PET似乎就是再用专业知识对参数进行微调），之后在查询过程中利用RAG增强数据，最后得到准确结果
教程文档：大模型在特定领域应用

第五天

介绍（营销）了一下谷歌自己的Vertex AI平台
介绍了一个AI产品构建的全过程，包括开发、实验、部署三个大流程。而其中开发和实验过程中，又包括基础模型的选取、提示词模版搭建、模型链构建（让智能体能够执行动作）、微调训练、数据管理、模型评估等流程。在部署过程中，又需要区分基础大模型，和生成式AI系统，其中基础大模型一般要评估硬件条件等等（普通人劝退），生成式AI系统则需要做好版本控制、单元测试和集成测试、以及针对不同的用途做延迟评估、整体评估与组件评估等等。部署完之后，还需做好模型的监测和管理工作。
教程文档：MLOps

相关资料:

所有代码练习：(https://www.kaggle.com/markishere/code)
所有视频讲解：(Daily Livestreams for 5-Day Gen AI Intensive Course - YouTube)
申明：以上资料均源自Google官方5-Day Gen AI活动，仅供学习使用。