“5天追上AI潮流”之大语言模型篇

前言

本文写于2024年5月，信息可能落后。

自从2022年12月ChatGPT横空面世以来，AI领域获得了十足的关注和资本，其实AI的概念在早些年也火过一波，本轮AI热潮相比于之前的AI，最大的区别在于：生成式。

我从23年初开始写AI资讯日报来学习和记录AI发展轨迹，积累了很多有效的知识，但是在甄别信息上花费了不少时间。为了方便后续的学习者快速入门AI，我计划写一个系列文章，来全面介绍AI的发展现状，系列名为：5天追上AI潮流。

这些文章会写的比较浅显，适合小白入门，并且提供了各种AI工具的使用地址，对大多数人来说，把AI工具先用起来更重要。

本文是“5天追上AI潮流”系列的第一篇文章，介绍大语言模型（Large Language Model，简称LLM）。

通过海量文本训练的、能识别人类语言、执行语言类任务、拥有大量参数的模型，称之为大语言模型。GPT、LLaMA、Mistral、BERT等都是LLM，LLM是对训练文本信息的压缩，同时拥有了泛化能力，不同于数据库和搜索引擎，LLM能创造性地生成历史上没有出现过的文本内容。

总体可以概括为：创作内容、处理和分析数据、自动化任务、智能客服