GPT-3

GPT是Generative Pre-training Transformer的简称，是由Alec Radford编写的语言模型，2018年由埃隆·马斯克的人工智能研究实验室OpenAI发布。

它采用了生成式语言模型（两个神经网络通过竞争相互完善），通过对不同的书面材料集与长篇连载文本的预训练，能够获取世界知识并处理长程依赖关系。 GPT-2于2019年2月宣布，是一个无监督的转化语言模型，它是在800万份文档上训练出来的，共40GB的文本，来自通过Reddit提交分享的文章。埃隆·马斯克并不愿意发布它，因为他担心它可能被用来向社交网络发送假新闻。

2020年5月，OpenAI发布了GPT-3，这个模型包含的参数比GPT-2多了两个数量级（1750亿vs 15亿个参数），它比GPT-2有了极大的改进。