GPT是”Generative Pre-trained Transformer“生成型預(yù)訓(xùn)練變換模型的縮寫,目的是為了使用深度學(xué)習(xí)生成人類可以理解的自然語(yǔ)言。目前我們討論的GPT一般指的是GPT-3,顯而易見,在之前還有GPT-2和GPT。
GPT-3是由人工智能公司OpenAI訓(xùn)練與開發(fā),該模型設(shè)計(jì)基于谷歌開發(fā)的變換語(yǔ)言模型。GPT-3的神經(jīng)網(wǎng)絡(luò)包含1750億個(gè)參數(shù),為有史以來(lái)參數(shù)最多的神經(jīng)網(wǎng)絡(luò)模型。OpenAI于2020年5月發(fā)表GPT-3的論文,微軟在2020年9月22日宣布取得了GPT-3的獨(dú)家授權(quán)。
按照OpenAI官方的說(shuō)法“我們已經(jīng)訓(xùn)練了一個(gè)名為 ChatGPT 的模型,它以對(duì)話的方式進(jìn)行交互。對(duì)話模式使 ChatGPT 能夠回答連續(xù)的問(wèn)題、承認(rèn)錯(cuò)誤、質(zhì)疑不正確的前提并拒絕不恰當(dāng)?shù)恼?qǐng)求。ChatGPT 是InstructGPT的兄弟模型,InstructGPT模型被訓(xùn)練為遵循對(duì)話中的指令并提供詳細(xì)的響應(yīng)?!?/span>
聯(lián)系客服