大家好，我是Edison。

在这个已经被AI大模型包围的时代，不了解一点大模型的基础知识和相关概念，可能出去聊天都接不上话。刚好近期我也一直在用GPT和GitHub Copilot，也刚好对这些基础知识很感兴趣，于是学习了一下，做了如下的整理总结，分享与你！

一句话描述GPT

GPT：Generative Pre-Training Transformer，即三个关键词：生成式 预训练 变换模型。

GPT模型通过在大量数据上学习到的语言模式，预测下一个字（token），生成自然语言文本。

大模型的6大关键技术

大模型

类似于人类的大脑，通过思考和规划来完成任务；

Prompt（提示词工程）

类似于人类的沟通，上级通过布置任务来让下级完成一项任务；

RAG（检索增强生成）

类似于人类想要暂时完成一件任务，但是这件任务暂时不会做。例如马上要大学期末考试了，我们需要临时抱佛脚突击一周，以求得考试及格分数，但是考完试以后，这些知识就忘得一干二净了。或者说类似于大学期末的开卷考试，反正知识点都在书里，你平时都没学过，得先找一找，找到了就把相关答案写在试卷上，考完了还是忘得一干二净，但是你的目标达到了：考试及格60分万岁！

Fine-tunig（微调）

类似于人类想要彻底学会一个技能，例如想要学会大模型的技术，我们需要通过系统的培训以及通过实战去真正的掌握大模型技术。

Function Calling（函数调用）

类似于人类使用工具完成一件任务，例如想要查询成都的天气情况，我们要么直接打开天气预报的App，要么直接在百度上搜索，总之是通过工具来完成这件事。

Agent

类似于人类通过沟通、分工和协作来完成一件复杂的任务，通常会结合使用到上面提到的五个技术来完成任务，而且大模型时代的Agent也不是单兵作战而是多个Agent之间合作来完成任务。例如想要开发一个客服项目，需要产品经理Agent、架构师Agent、开发者Agent、测试者Agent、运维Agent 和项目管理Agent 像人类一样去沟通协作，最后才能把这个项目自动地完成。

知识问答的3种主要方式

大模型直答

最常见的方式：直接向LLM提问，LLM给出回答。

大模型微调（Fine-Tuning）

首先，将企业私有知识加给通用大模型进行微调形成私有大模型；然后，再将问题给到私有大模型进行回答。

大模型RAG（检索增强生成）

首先，对企业的知识库进行检索得到相关的知识片段；然后，将知识片段和原问题组合成新的提示词发给通用大模型得到回答；

3种方式的效果对比：

总结：在企业落地知识问答库时，如果为了追求成本和回答准确度，推荐使用RAG方案。

AI Agent到底是什么？

在产品层面：AI Agent是AGI时代新的应用形态

这其实是应用形态的演进：在AGI时代之前是移动互联网时代，它的产品形态是APP。

在进入AGI时代后，产品形态变为了AI Agent。未来现有的部分高级程序员写的应用就不再会是App，而是AI Agent了！

在技术层面：面向过程架构 → 面向目标架构的转变（软件架构的范式迁移）

比如，在App时代写一个用户系统，需要把整个用户从注册到登录再到回放，一步一步地把整个流程结合if-else把它开发出来。这个生成的过程我们叫做面向过程的架构，需要预定义指令、逻辑和规则。

但是，在AI Agent时代，很多情况下不需要把这些指令一个一个地指出来，只需要一句话就行了，比如说提供一个prompt“请帮我完成一个用户系统，它包含用户注册、登录、查询等功能”，然后大模型就会帮你去完成。这个生成的过程我们叫做面向目标的架构，具有目标导向和动态规划的特点，由AI Agent自主生成。

大模型和Agent有啥区别？

Agent会在大模型的推理结果基础之上，使用一些工具（如调用API）完成某个特定的任务，这个技术也被称为Function Calling（函数调用）。

当下大模型的参数量提升AI Agent的理解力和泛化能力，使其能够更好地处理多种任务和上下文信息，这增强了AI代理的自然语言处理能力，从而提供更加个性化、连贯的交互体验，是当下Agent的构建关键！

总结：大模型时代下的 AI Agent = LLM × (规划+记忆+工具+行动)

AI Agent的应用场景通常与特定任务或环境紧密相关。例如，在智能家居系统中，AI Agent可以根据用户的生活习惯和偏好自动调节家庭设备的运行状态。在游戏中，AI Agent能够提供具有挑战性的对手或复杂的游戏环境动态。

Agent架构的核心流程

Agent架构有三个重要的模块：规划模块（Planning）、执行模块（Action）和观察模块（Observation），如下图所示：

举个例子，假设我们有一个prompt“请用python画一个圆心”。

首先，在规划模块，Agent会将这个需求拆解为三个子项：写Python代码、调用IPython解释器、调用Docker运行环境；

其次，在执行模块，Agent会分别执行拆解的事项，也就是去调用各种工具；

最后，在观察模块，Agent会对每一步的执行结果做观测，如果check完毕没问题，就给到用户最终的答案。如果觉得有问题，比如执行的过程中出现了Timeout之类的错误，就会做一些Retry的操作。如果Retry次数超过了最大重试次数，这时候就可能会把这个进程Kill掉，然后重新进入规划模块重新规划。

在这三个模块或者说能力中，最重要的当属规划模块！

大模型和程序员的关系

目前ChatGPT对程序员到底有哪些实质性的帮助？

第一点：Code Review

ChatGPT能够理解代码，并针对代码给出针对性的建议和优化方案；

第二点：写测试用例、单元测试、集成测试等，这些ChatGPT都很擅长！

第三点：对线上问题的定位和分析

线上问题的各种疑难杂症，ChatGPT都能胜任！

第四点：SQL的翻译

实现两种数据库的SQL语言转换，比如将Oracle的SQL脚本转换成MySQL的SQL脚本。

有了AI编程，还需要程序员吗？

第一，在冯诺依曼架构体系下，程序需要的是确定性计算；

第二，由于大模型本身的概率性，目前大模型生成的代码还具备一定的随意性和不确定性；

第三，目前大模型更擅长的是一些抽象层次比较低的工作，比如一段代码或一个算法的实现，写一个单元测试等等。而一些抽象层次比较高的工作，比如需求分析、架构设计、领域设计、架构选型等，这些工作反而是大模型不擅长的，而这些工作是比较具备有竞争力的，这恰恰是一些高级程序员以及系统架构师的价值所在。

应用实践AIGC有几层境界？

第一层境界：简单对话；

通过ctrl-c/v出结果，人人都会。

第二层境界：系统掌握Prompt Engineering；

通过系统掌握好提示词工程，真正赋能工作提效。

目前，Edison还处于这一层。

第三层境界：将AIGC融入业务流程，指挥AIGC完成复杂的任务；

通过掌握AIGC的技能，并完成业务领域知识的深入结合。

第四层境界：拥有自己的大模型；

熟悉大模型的架构原理，通过开源大模型微调，最好能够拥有一定的行业数据壁垒。

第五层境界：参与设计训练大模型；

比如从事ChatGPT等研发工作。

如何掌握AI大模型开发技能？

第一步：掌握开发AGI时代新应用程序的技能；

比如：大模型应用内核、LangChain开发框架、向量数据库等；

第二步：搞定开发企业级AI Agent的应用技能；

比如：AI Agent、大模型缓存、算力等；

第三步：驾驭开发企业级专有大模型的技能；

比如：RAG、微调等；

第四步：深入应用大模型技术成为开发大师；

比如：大模型预训练、LLMOps等；

小结

大模型应用开发学习实践之路漫漫，我们IT开发者也会逐渐从Application的开发转向Agent的开发的范式的转变，一起加油吧！

参考资料

玄姐聊AGI：https://space.bilibili.com/412720389 （推荐观看玄姐的视频）

甲子光年，《2024年AI Agent行业报告》

作者：周旭龙

出处：https://edisonchou.cnblogs.com

本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文链接。

LLM大模型基础知识学习总结的更多相关文章

OSI七层模型基础知识及各层常见应用
OSI Open Source Initiative(简称OSI,有译作开放源代码促进会.开放原始码组织)是一个旨在推动开源软件发展的非盈利组织.OSI参考模型(OSI/RM)的全称是开放系统互 ...
(转)Linux基础知识学习
Linux基础知识学习原文:http://blog.csdn.net/ye_wei_yang/article/details/52777499 一.Linux的磁盘分区及目录 Linux的配置是通过 ...
GCC基础知识学习
GCC基础知识学习一.GCC编译选项解析常用编译选项命令格式:gcc [选项] [文件名] -E:仅执行编译预处理: -S:将C代码转换为汇编代码: -c:仅执行编译操作,不进行连接操作: -o ...
Vue2基础知识学习
Vue2基础知识学习 01.初识 new Vue({ el: '#root', //用于指定当前Vue实例为哪个容器服务,值通常为css选择器符 data () { return { } } }); ...
Objective-c基础知识学习笔记
Objective-c基础知识学习笔记(一) 一直有记录笔记的习惯.但非常久没分享一些东西了,正好上半年開始学习IOS了,如今有空写点.因开发须要,公司特意为我们配置了几台新MAC.还让我们自学了2周 ...
【数据库上】第四讲 E-R模型基础知识
第四讲 E-R模型基础知识一.数据库设计过程数据库设计的关键阶段? 各个阶段设计的主要任务? 基础条件:清楚一个应用系统的功能需求与数据需求(直接与用户交互.数据流程图示例/UML类图等) 核心阶 ...
AXAJ基础知识学习
AXAJ基础知识学习博客首页 Ajax简介 ajxa全称是Asynchronous Javascript And XML ,就是异步的JS 和XML 通过Ajax可以再浏览器中向服务器发送异步请求, ...
大数据基础知识问答----spark篇，大数据生态圈
Spark相关知识点 1.Spark基础知识 1.Spark是什么? UCBerkeley AMPlab所开源的类HadoopMapReduce的通用的并行计算框架 dfsSpark基于mapredu ...
〖前端开发〗HTML/CSS基础知识学习笔记
经过一天的学习,把慕课网的HTML/CSS基础知识学完了,笔记整理: 1. 文件结构: HTML文件的固定结构: <html> <head>...</head> & ...
韩天峰博客 php基础知识学习记录
http://rango.swoole.com 写好PHP代码真的不容易,给大家几个建议: 慎用全局变量,全局变量不好管理的,会导致你的代码依赖于全局变量,而耦合度太高. 一定不要复制粘贴代码,可重用 ...

随机推荐

.Net Core 2.2 Areas 路由，第一个MapAreaRoute 设置匹配多个Controller
.h2 { background-color: rgba(78, 110, 242, 1); color: rgba(255, 255, 255, 1); padding: 10px } 在.Net ...
Spark3学习【基于Java】2. Spark-Sql核心概念
SparkSession 从Spark2开始,Spark-SQL引入了SparkSession这个核心类,它是处理DataSet等结构数据的入口.在2.0之前,使用的是spark-core里的Spar ...
yb课堂核心数据库表字段设计和测试数据准备《一》
设计对应的表字段(统一使用Innodb引擎,mysql5.7) video_banner video chapter episode video_order user 数据库脚本 CREATE TAB ...
SQLserver中的存储过程
变量分为: ->局部变量: •局部变量必须以标记@作为前缀 ,如@Age int •局部变量:先声明,再赋值 1 -- 语法:声明一个变量,然后赋值,打印出来 2 -- 第一步 3 declar ...
全网最适合入门的面向对象编程教程：03 类和对象的Python实现-为自定义类添加属性
摘要: 本文主要介绍了,当使用 Python 创建自定义类时,如何为其添加属性,包括为类和实例添加属性两种,以及如何获取自定义的属性等内容. 往期推荐: 学嵌入式的你,还不会面向对象??! 全网最适合 ...
12 二次打开pdf失败
h5 安卓 iOS均出现pdf二次打开失败
2 手机号登录时，调的不是login接口，而是注册的一个接口
手机号登录时,调的不是login接口,而是注册的一个接口
oeasy教您玩转vim - 20 - 显示标尺
显示标尺回忆上节课内容定义标记 a ma 删除标记 a :delm a 跳转到标记 a 'a `a 跳到 a 对应的行和列 'a 跳到 a 对应的行查看所有标记 :marks 各种标记类型 '' ...
oeasy教您玩转vim - 69 - # 折叠folding入门
折叠入门回忆上次上次学习了一种新的容器 tabs选项卡 tabs选项卡包含多个选项卡tab 可以列两个tab 一个编写文件一个执行指令互不影响每个 tab选项卡还可以对应多个wind ...
Day 7 - 哈希与 KMP
字符串哈希定义我们定义一个把字符串映射到整数的函数 \(f\),这个 \(f\) 称为是 \(\text{Hash}\) 函数. 我们希望这个函数 \(f\) 可以方便地帮我们判断两个字符串是否相 ...

LLM大模型基础知识学习总结