二次元绘画创作
56.21M · 2026-02-04
2022 年 11 月 30 日,OpenAI 正式发布 ChatGPT,人类自此迈入真正可用的 AI 工具时代。在此之前,AI 仅局限于专业研究领域,普通人很少听过或者使用 AI 工具,日常接触最多的也只是车牌识别(文字识别)、语音识别等基础应用;而从 ChatGPT 诞生起,大模型的广泛应用让普通人得以在日常生活中受益,无论是利用 AI 生成视频、辅助写作、编写代码,还是进行智能对话,AI 都已深度融入各类日常场景。
自 1956 年 AI 概念正式诞生以来,行业先后经历了黄金年代、第一次 AI 寒冬、繁荣期、第二次 AI 寒冬与冷静发展期,如今已正式步入大模型时代。当下,大量 AI 应用持续造福人类,正深刻改变着人们的生活方式。
大模型究竟是什么?复杂来说,大模型是基于海量数据训练而成的巨型人工智能模型,其核心原理是通过海量参数学习数据中的复杂模式,采用“预训练+微调”的框架,先通过无监督学习掌握通用知识,再针对具体任务进行优化,最终形成真正可用的 AI 工具。简单来讲,大模型就是一个通过数学计算模拟人类认知推理过程的工具,它并没有多数人想象中那么强大——没有意识,并非无所不知,甚至可以将其看作一个函数,接受输入、产生输出,只是多数情况下,输出内容能贴合我们的预期而已。比如我们向模型输入问题:“地球和太阳之间有哪些行星?”,大模型会输出:“根据太阳系行星的轨道顺序,在地球和太阳之间的行星有两颗,按照距离太阳由近到远的顺序,分别是水星和金星。” 事实上,大模型未必能完全理解这个问题,甚至不清楚自己输出的内容是否正确,它只是机械地根据此前的训练数据,逐一生成对应的 token 而已。
但无论如何,大模型(像 GPT 系列、文心一言、豆包、通义千问、Grok、DeepSeek)确实能帮我们解决不少问题,至少可以辅助甚至替代人类完成一些简单或机械化的任务,并且它必将持续深刻地改变人类的生活。
接下来,我们就一起来了解大模型时代必备的一些 AI 相关术语。
英文全称:Artificial Intelligence
解释:直译为人工智能,即通过技术手段让机器模拟人类的智能行为,涵盖思考、学习、决策及执行各类任务的能力。
英文全称:Artificial Intelligence Generated Content
解释:直译为人工智能生成内容,指由人工智能系统自动生成或创造的各类内容,常见的有文本、图片、音频、视频等。
英文全称:Large Language Model
解释:直译为大语言模型,是指在海量数据上训练而成、拥有数十亿甚至万亿级参数的深度学习模型。例如我们熟悉的ChatGPT-3.5(参数量约200亿)、DeepSeek-V3.2(参数量约6850亿)、豆包1.5(参数量约2000亿)。
基座模型:指未经过特定任务微调、具备通用能力的原始大模型。
多模态:目前许多 LLM 不仅能处理文本信息,还能兼容图像、音频等多种格式的信息,这类模型被称为“多模态大模型”。
解释:直译为提示词,是用户与LLM进行交互的核心指令和输入内容,也是引导模型生成特定、高质量输出的关键。
一个优质的提示词通常包含:角色、任务、上下文、输出格式等要素,如:
英文全称:Supervised Fine-Tuning
解释:直译为监督微调,指在通用大模型(即基座模型)的基础上,利用特定领域、高质量的标注数据对其进行额外训练,使其能更好地适配特定任务或应用领域。
解释:是大模型理解和处理文本的基本单位。大模型生成内容时,会先将用户输入转换成一个个 Token,通常一个英文单词或一个汉字是一个 Token(具体取决于词汇本身及分词器的设计),再逐一生成 Token,最终形成可正常阅读的文本。大模型对输入和输出的处理存在限制,单次交互中能够读取和考量的 Token 数量有上限,这一上限被称为 Token 窗口(也叫上下文窗口)。窗口大小直接决定了单次可向模型输入的信息量,GPT-3 最初的窗口仅为 2K Tokens,而目前最新的部分模型已支持 200K 甚至 1M 以上的窗口规模了。
英文全称:Retrieval-Augmented Generation 解释:直译为检索增强生成,其核心逻辑是:当用户提出问题时,系统会先从外部知识库(如文档、数据库等)中检索出与问题相关的信息,再将这些信息作为上下文,与用户的问题一同提交给大模型,由模型结合检索到的信息生成最终答案。
英文全称:Model Context Protocol
解释:直译为模型上下文协议,是由 Anthropic 公司(Claude 的研发机构)提出的一种开放协议标准。它规范了应用程序向大语言模型提供上下文的方式,通过标准化接口,可实现大模型与各类外部工具、数据源的高效联动。
解释:译为智能体,是一种更高级的 AI 应用模式。它不仅具备生成回复的能力,还能自主感知环境、规划任务目标、调用相关工具,进而完成一系列复杂的任务。AI Agent 是 AI 应用的最终形态,可以帮助人类完成复杂的任务,如可以帮助程序员写代码的 Agent,可以自动回答和处理订单的客服 Agent。
以上便是大模型时代核心 AI 术语的系统解析,从 AI 的基础定义的到 Agent 的高级应用形态,从 ChatGPT 开启的 AI 工具新时代,到大模型“预训练+微调”的核心逻辑,我们梳理了入门必备的关键知识。这些术语不仅是理解 AI 技术的基础,更是我们高效运用大模型、把握其发展趋势的前提,而随着技术的不断迭代,大模型与各类 AI 应用的深度融合,也必将持续深刻地重塑我们的生活与工作方式。
彩蛋:这篇文章/视频也是在 AI 润色等辅助下进行的