環(huán)球熱消息：GPT-4來(lái)了，這個(gè)“史上最強(qiáng)AI模型”將顛覆多少職業(yè)？

2023-03-16 16:43:20 來(lái)源：手機(jī)網(wǎng)易網(wǎng)

格雷格·布羅克曼在筆記本上潦草手繪了一張“笑話網(wǎng)站”的網(wǎng)頁(yè)設(shè)計(jì)，拍照后發(fā)送給GPT-4模型，僅過(guò)幾秒鐘，GPT-4便生成一段代碼，一個(gè)頁(yè)面簡(jiǎn)單的網(wǎng)站隨后亮相，和草圖結(jié)構(gòu)完全相同——兩行笑話，以及點(diǎn)擊后可以顯示笑點(diǎn)的互動(dòng)按鈕。

上圖是OpenAI 總裁格布羅克曼手繪的網(wǎng)頁(yè)設(shè)計(jì)，下圖是GPT-4生成的代碼及其轉(zhuǎn)成的網(wǎng)頁(yè) 圖/OpenAI關(guān)于GPT-4 的開(kāi)發(fā)者直播視頻截圖

不用懂編程語(yǔ)言就能創(chuàng)建網(wǎng)頁(yè)，讓一些人感慨“前端程序員要失業(yè)”。這一場(chǎng)景發(fā)生在北京時(shí)間3月15日凌晨，OpenAI正式推出新一代語(yǔ)言模型GPT-4，該公司總裁格布羅克曼在面向開(kāi)發(fā)者的直播中，演示了新模型的諸多應(yīng)用，還包括描述圖片內(nèi)容、模擬公民納稅等。

【資料圖】

OpenAI宣稱，GPT-4雖然在諸多現(xiàn)實(shí)世界場(chǎng)景中不如人類，但在一些為人類設(shè)計(jì)的標(biāo)準(zhǔn)考試，以及為機(jī)器學(xué)習(xí)模型設(shè)計(jì)的基準(zhǔn)評(píng)估中，表現(xiàn)出了人類水平。

OpenAI 推出的GPT-4 圖/視覺(jué)中國(guó)

從聊天到“看圖說(shuō)話”

“安德魯在上午11點(diǎn)到下午3點(diǎn)有空，喬安妮中午12點(diǎn)到下午2點(diǎn)、下午3點(diǎn)半到5點(diǎn)有空，漢娜中午12點(diǎn)到12點(diǎn)半、下午4點(diǎn)到6點(diǎn)有空。他們?nèi)水?dāng)天將進(jìn)行一場(chǎng)30分鐘的會(huì)議，開(kāi)始時(shí)間有哪些選擇？”

將這一問(wèn)題發(fā)給ChatGPT，它建議會(huì)議安排在下午4點(diǎn)。答案是錯(cuò)誤的，不懂推理、做不好簡(jiǎn)單的算術(shù)題，這也是過(guò)去一段時(shí)間以來(lái)ChatGPT最受使用者詬病的問(wèn)題之一。GPT-4給出了正確答案：中午12點(diǎn)。在OpenAI的測(cè)試中，GPT-4的推理能力得到提升，也更難被欺騙。

用戶可以通過(guò)ChatGPT的付費(fèi)版本率先體驗(yàn)GPT-4的對(duì)話功能。如果僅是漫談，一些使用者發(fā)現(xiàn)，兩者區(qū)別不大。但OpenAI表示，當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠閾值時(shí)，差異就會(huì)出現(xiàn)——GPT-4比上一代“更可靠、更有創(chuàng)意，并且能夠處理更細(xì)微的指令”。

OpenAI在一些為人類設(shè)計(jì)的標(biāo)準(zhǔn)考試中進(jìn)行實(shí)驗(yàn)，GPT-4的考試能力明顯高于此前發(fā)布的GPT-3.5。兩個(gè)月前，網(wǎng)友們還在感慨ChatGPT可以通過(guò)美國(guó)大學(xué)入學(xué)考試SAT，但如今，GPT-4的成績(jī)優(yōu)異到能沖刺名校，比如SAT數(shù)學(xué)拿到700分，超過(guò)約9成的應(yīng)試者。

模擬律師考試中，GPT-4分?jǐn)?shù)也排在10%前后，GPT-3.5表現(xiàn)則在倒數(shù)10%。但GPT-4有些“偏科”，美國(guó)大學(xué)先修課程（AP）考試中，GPT-4在理化生、歷史、經(jīng)濟(jì)學(xué)甚至心理學(xué)科目中拿到滿分5分，但在英語(yǔ)語(yǔ)言與寫作中，卻只拿到2分。

GPT-4和GPT-3.5在一些人類標(biāo)準(zhǔn)化考試中的表現(xiàn) 圖/OpenAI官網(wǎng)

無(wú)論是Siri、小冰還是此前發(fā)布的GPT-3.5模型，人們熟知的對(duì)話機(jī)器人多是固定的語(yǔ)言風(fēng)格。OpenAI開(kāi)發(fā)者提升了GPT-4的“可操縱性”，即事前通過(guò)詳細(xì)描述，給人工智能規(guī)定一個(gè)明確的“角色”或場(chǎng)景。比如開(kāi)發(fā)者告訴GPT-4是一名“以蘇格拉底風(fēng)格回應(yīng)的導(dǎo)師”，從不給學(xué)生確定答案，而是將問(wèn)題拆分更簡(jiǎn)單部分，幫助學(xué)生獨(dú)立思考。在這一模式下，GPT-4通過(guò)循循善誘，能幫助使用者解出一個(gè)二元一次方程組。

此外，此前ChatGPT與用戶交流時(shí)，只能處理8000多個(gè)單詞，這相當(dāng)于約四五頁(yè)英文書的文字?jǐn)?shù)。GPT-4做了提升，記憶儲(chǔ)存由上一代4096個(gè)tokens（服務(wù)端生成的字符串）擴(kuò)大到32700多個(gè)，可以處理25000個(gè)單詞。這意味著，這一語(yǔ)言模型有更強(qiáng)的上下文理解能力，可以記住用戶更長(zhǎng)的表達(dá)，或者處理更長(zhǎng)的文章。

但這些只是對(duì)ChatGPT所用模型的優(yōu)化，GPT-4最大的突破在于，不再只是文字對(duì)話，而是一個(gè)多模態(tài)模型，可以輸入圖像，生成說(shuō)明和分析文本。布羅克曼在演示中輸入一張松鼠拍照?qǐng)D，并詢問(wèn)其有趣之處是什么。GPT-4描述了圖片內(nèi)容，準(zhǔn)確地指出邏輯的反差感，“松鼠通常只吃堅(jiān)果，我們并沒(méi)料到它會(huì)用相機(jī)或表現(xiàn)得像人類”。GPT-4還可以通過(guò)一張包含雞蛋、牛奶、面粉、黃油的照片，告訴你可以做出哪些食物。不過(guò)，目前圖像輸入功能仍處在調(diào)試環(huán)節(jié)，尚未在ChatGPT付費(fèi)版和候補(bǔ)API（應(yīng)用編程接口）中應(yīng)用。

實(shí)際上，過(guò)去近十年，國(guó)內(nèi)外已有科研機(jī)構(gòu)和AI公司研發(fā)和應(yīng)用過(guò)視覺(jué)問(wèn)題問(wèn)答（VQA）。“但從目前OpenAI發(fā)布的信息看，GPT-4是第一次將VQA的看圖對(duì)話功能做到了大規(guī)模應(yīng)用?！鼻迦A大學(xué)智能產(chǎn)業(yè)研究院首席研究員聶再清對(duì)《中國(guó)新聞周刊》說(shuō)。不過(guò)他強(qiáng)調(diào)，實(shí)際的讀圖能力如何，目前還沒(méi)有更多評(píng)測(cè)，需要更多應(yīng)用才能判斷。

OpenAI創(chuàng)始人薩姆·阿爾特曼介紹，GPT-4“比以前的模型更有創(chuàng)意，幻覺(jué)明顯減少，偏見(jiàn)也更少”，被公司稱為“OpenAI迄今為止功能最強(qiáng)大的模型”。

盡管如此，GPT-4仍與早期GPT模型具有相似的局限性。最重要的是，它還是會(huì)“幻想事實(shí)”，并一本正經(jīng)地胡說(shuō)八道。

聶再清解釋，ChatGPT，也包括最新的GPT-4是開(kāi)放域?qū)υ捪到y(tǒng)，一些提問(wèn)會(huì)超出事實(shí)范疇，如果讓它強(qiáng)行答復(fù)，就會(huì)出現(xiàn)失控狀況。所以在技術(shù)上，更關(guān)鍵的是要不斷調(diào)試參數(shù)，讓模型掌握“知之為知之，不知為不知”的能力，這也是未來(lái)大模型迭代必須要解決的問(wèn)題。

OpenAI表示，GPT-4在迭代中已盡量減少這種幻覺(jué)，表現(xiàn)要比GPT3.5優(yōu)異40%。但OpenAI提醒，使用模型時(shí)，對(duì)結(jié)果仍要“格外小心”。此外，該公司開(kāi)源了用于自動(dòng)評(píng)估AI模型性能的框架，允許任何人報(bào)告模型中的缺點(diǎn)，以幫助指導(dǎo)模型進(jìn)一步改進(jìn)。

更少技術(shù)披露，更多商業(yè)應(yīng)用

“史上最強(qiáng)”的GPT-4是如何誕生的？

早在2022年8月，GPT-4的模型已被訓(xùn)練完成，開(kāi)發(fā)者經(jīng)過(guò)6個(gè)月的調(diào)試后進(jìn)行了迭代。早期GPT-4會(huì)有更多倫理問(wèn)題，比如問(wèn)它“如何制造導(dǎo)彈”，用戶會(huì)得到一些可能的步驟和注意事項(xiàng)，此前發(fā)布的ChatGPT也出現(xiàn)過(guò)類似漏洞。過(guò)去3個(gè)月，全球上億用戶使用ChatGPT的數(shù)據(jù)也被用于改進(jìn)GPT-4的行為，此外，研究者納入了更多人工反饋，改善模型的安全性。

“但從目前公開(kāi)的報(bào)告和網(wǎng)頁(yè)信息看，只有指標(biāo)和使用理念的變化，GPT-4的模型規(guī)模、如何被訓(xùn)練等，都沒(méi)有太多技術(shù)細(xì)節(jié)的披露?！庇ミ_(dá)的工程師王帥告訴《中國(guó)新聞周刊》，他在AI領(lǐng)域從業(yè)20多年。

大模型的原理，某種意義上可以理解為“大力出奇跡”，把大量數(shù)據(jù)輸入大黑盒子中得出更多可能性?！都~約時(shí)報(bào)》3月15日的相關(guān)報(bào)道寫到，OpenAI的GPT-4學(xué)習(xí)的數(shù)據(jù)規(guī)模要比GPT3.5大得多，但OpenAI高管拒絕透露更多數(shù)據(jù)信息，總裁布羅克曼只表示，數(shù)據(jù)集是“互聯(lián)網(wǎng)規(guī)?！钡摹?/p>

王帥注意到，早期，OpenAI更愿意公開(kāi)技術(shù)信息，比如驗(yàn)證了一個(gè)新想法會(huì)迅速發(fā)論文，讓同行信服。2020年OpenAI推出GPT-3時(shí)，曾公布模型參數(shù)為1750億，遠(yuǎn)超其他模型十倍以上，震驚國(guó)內(nèi)外科技圈。但近一兩年，OpenAI更多是公開(kāi)一些宣傳稿，“能看出有意在隱藏一些技術(shù)信息”。有關(guān)GPT-4的關(guān)鍵數(shù)據(jù)，只提到上述有關(guān)上下文參數(shù)的token信息。

3月15日的發(fā)布會(huì)上，OpenAI呈現(xiàn)更多的是GPT-4的實(shí)用功能和應(yīng)用場(chǎng)景。比如，語(yǔ)言學(xué)習(xí)網(wǎng)站“多鄰國(guó)”使用GPT-4提升軟件的對(duì)話能力，摩根士丹利利用GPT-4，改變其管理人員查找相關(guān)信息的方式。丹麥一家?guī)椭と撕鸵暳Φ拖氯耸孔R(shí)別物體的App公司“Be My Eyes”也正與OpenAI合作，借助最新的圖片輸入功能，開(kāi)發(fā)由GPT-4驅(qū)動(dòng)的新應(yīng)用。

丹麥這家公司的首席技術(shù)官提到，該模型優(yōu)勢(shì)在于，此前一些圖片識(shí)別應(yīng)用只能告訴你眼前的物體什么，但通過(guò)GPT-4的分析能力，在未來(lái)可以試圖告訴使用者，眼前東西的性質(zhì)，比如“地上不僅是一個(gè)球，而是一個(gè)會(huì)被絆倒的危險(xiǎn)信號(hào)”。

OpenAI在公開(kāi)信息上的微妙變化，釋放出加快商業(yè)化的信號(hào)。過(guò)去一段時(shí)間，OpenAI通過(guò)ChatGPT向全世界證明大規(guī)模這一路徑能夠走通，谷歌、微軟、阿里等大公司開(kāi)始傾注更多資源在這一領(lǐng)域?！斑@一變化是巨大的，而且不大可逆?！甭櫾偾逭f(shuō)。

王帥分析，OpenAI更關(guān)注商業(yè)應(yīng)用，一方面，OpenAI可能認(rèn)為，作為技術(shù)研發(fā)者，有責(zé)任推廣這一最前沿的技術(shù)，希望保持自己的競(jìng)爭(zhēng)優(yōu)勢(shì)。另外，推廣應(yīng)用，“不僅為了盈利或者融資”，更希望能采集到更多數(shù)據(jù)。

ChatGPT得到的海量數(shù)據(jù)具有極大價(jià)值，是之后技術(shù)迭代的先決條件，“這是OpenAI與其他公司競(jìng)爭(zhēng)的’法寶’，幾乎是其他公司難以匹敵的優(yōu)勢(shì)?！蓖鯉泴?duì)《中國(guó)新聞周刊》說(shuō)。

但模型不可避免地輸出錯(cuò)誤信息，是否會(huì)制約商業(yè)應(yīng)用？實(shí)際上，GPT-3推出時(shí)，不少國(guó)外初創(chuàng)公司運(yùn)用該模型進(jìn)行創(chuàng)新性應(yīng)用。去年，摩根士丹利已經(jīng)在系統(tǒng)內(nèi)使用了GPT-3。在王帥看來(lái)，恰恰是因?yàn)榇蠹抑来竽Ｐ偷膯?wèn)題，對(duì)它的預(yù)期會(huì)更清晰，也會(huì)想辦法降低出錯(cuò)的概率，但這并不是導(dǎo)致其商業(yè)化無(wú)法推進(jìn)的根本性問(wèn)題。

多位專家提到，GPT-4的確在技術(shù)上有顯著的突破，在業(yè)內(nèi)無(wú)可置疑，而且讓更多人意識(shí)到AI的能力，但快速商業(yè)化的關(guān)鍵是，找到更多應(yīng)用場(chǎng)景?！澳壳笆且粋€(gè)百花齊放的狀態(tài)。如果一項(xiàng)技術(shù)使用的范圍不夠大，就不會(huì)對(duì)社會(huì)產(chǎn)生巨大的影響?！?/p>

GPT-4推出后，不少人在網(wǎng)絡(luò)上感慨，“在這場(chǎng)AI風(fēng)暴中，人類何以生存？”多位受訪者坦言，人工智能的發(fā)展的確會(huì)導(dǎo)致一些崗位消失，但它從一個(gè)新技術(shù)誕生到真正顛覆人類生活，還有很長(zhǎng)一段路要走。

（應(yīng)受訪者要求，王帥為化名）

作者：楊智杰

關(guān)鍵詞：

環(huán)球熱消息：GPT-4來(lái)了，這個(gè)“史上最強(qiáng)AI模型”將顛覆多少職業(yè)？

環(huán)球熱消息：GPT-4來(lái)了，這個(gè)“史上最強(qiáng)AI模型”將顛覆多少職業(yè)？