本文写于2024年5月,信息可能落后。
自从2022年12月ChatGPT横空面世以来,AI领域获得了十足的关注和资本,其实AI的概念在早些年也火过一波,本轮AI热潮相比于之前的AI,最大的区别在于:生成式。
我从23年初开始写AI资讯日报来学习和记录AI发展轨迹,积累了很多有效的知识,但是在甄别信息上花费了不少时间。为了方便后续的学习者快速入门AI,我计划写一个系列文章,来全面介绍AI的发展现状,系列名为:5天追上AI潮流。
这些文章会写的比较浅显,适合小白入门,并且提供了各种AI工具的使用地址,对大多数人来说,把AI工具先用起来更重要。
本文是“5天追上AI潮流”系列的第一篇文章,介绍大语言模型(Large Language Model,简称LLM)。
通过海量文本训练的、能识别人类语言、执行语言类任务、拥有大量参数的模型,称之为大语言模型。GPT、LLaMA、Mistral、BERT等都是LLM,LLM是对训练文本信息的压缩,同时拥有了泛化能力,不同于数据库和搜索引擎,LLM能创造性地生成历史上没有出现过的文本内容。
总体可以概括为:创作内容、处理和分析数据、自动化任务、智能客服