當?shù)貢r間3月14日,OpenAI 宣布正式發(fā)布 GPT-4,它擁有圖像識別功能、高級推理技能、以及處理25000個單詞的能力,在單詞處理能力上是 ChatGPT 的八倍,并可以用所有流行的編程語言寫代碼。OpenAI 還表示 GPT-4大大優(yōu)于現(xiàn)有的大型語言模型、以及大多數(shù)下一代(SOTA,State Of The Arts)模型。
【資料圖】
(來源:資料圖)
據(jù)介紹,GPT-4在模擬律師考試中的成績超出90% 的人類考生,在 SAT(Scholastic Aptitude Test,俗稱“美國高考”)的閱讀考試中超出93% 的人類考生,在 SAT 數(shù)學考試中超出89% 的人類考生。
而同樣面對律師資格考試,GPT-4的上一版 GPT-3.5的得分,僅僅超出10% 左右的人類應試者。在現(xiàn)場演示中,GPT-4還生成了關于復雜稅務查詢的答案,盡管無法驗證其答案。
在美國,每個州的律師考試都不一樣,但一般包括選擇題和作文兩部分,涉及合同、刑法、家庭法等知識。GPT-4參加的律師考試,對于人類來說即艱苦又漫長,需要兩天才能完成。而 GPT-4卻能在專業(yè)律師考試中脫穎而出。
通過律師考試并不意味著它已準備好取代真正的律師。畢竟通過司法考試的人大有人在,因此 GPT-4不能成為真正的律師,但它確實展示了一定的本領,也能快速啟動一些法律任務。
(來源:資料圖)
圖像識別、高級推理、龐大的單詞掌握能力,是 GPT-4的三大特點。
就圖像識別功能來說,GPT-4可以分析圖像并提供相關信息,例如它可以根據(jù)食材照片來推薦食譜,為圖片生成圖像描述和圖注等。但是,出于對潛在濫用的擔憂,OpenAI 推遲了圖像描述功能的發(fā)布。也就是說,GPT-4的圖像輸入功能還處于尚未公開的預覽階段,目前僅能在 OpenAI 的直播中觀看效果。
就高級推理功能來說,GPT-4能夠針對3個日程做出會議時間安排,回答存在上下文關聯(lián)性的復雜問題。
就詞匯量來說,由于最多可以處理25000個單詞,因此在理解和生成長篇內(nèi)容上,GPT-4的能力更強。
GPT-4和上一代就有哪些區(qū)別?
OpenAI 聲稱 GPT-4是其“最先進的人工智能系統(tǒng)”,是該公司在擴展深度學習系統(tǒng)上的最新里程碑,并表示該模型比以往任何時候都更具有創(chuàng)造性和協(xié)作性,因為它可以更準確地解決復雜問題。
OpenAI 表示其花費了六個月的時間,來讓 GPT-4比上一代更安全。該公司通過改進監(jiān)控框架,并與醫(yī)學、地緣政治等敏感領域的專家進行合作,以確保 GPT-4所給答案的準確性和安全性。
GPT-4的參數(shù)量更多,這意味著它將比上一版更接近人類的認知表現(xiàn)。 GPT-4還接受了各種多模態(tài)信息的訓練,這讓它不僅可以理解和解釋輸入數(shù)據(jù),還可以理解輸入數(shù)據(jù)所在的上下文。 此外,當同時執(zhí)行多任務時,GPT-4的表現(xiàn)也更加出色。
與舊版本一樣,GPT-4由深度學習技術開發(fā)而來,是在公開可用和已被許可數(shù)據(jù)上進行的訓練,并使用強化學習和人工反饋進行微調(diào)。不過,GPT-4是在全新的深度學習堆棧上訓練的,并由 OpenAI 和微軟 Azure 團隊一起構建。毫無疑問的是,GPT-4比上一代模型接受了更多數(shù)據(jù)訓練和計算訓練。
如果你使用過 ChatGPT 就會發(fā)現(xiàn),它的輸入類型是純文本,輸出則是語言文本和代碼。而 GPT-4的多模態(tài),意味著用戶可以輸入不同類型的信息,例如視頻、聲音、圖像和文本。同樣的,具備多模態(tài)能力的 GPT-4可以根據(jù)用戶提供的信息,來生成視頻、音頻、圖片和文本。哪怕你同時將文本和圖片發(fā)給 GPT-4,它也能根據(jù)這兩種不同類型的信息生出文本。
(來源:資料圖)
OpenAI 表示 GPT-4“離經(jīng)叛道”的可能性要小得多,對于不被允許的內(nèi)容請求,GPT-4的響應可能性降低了82%。在 OpenAI 的內(nèi)部對抗性真實性評估中,GPT-4得分比 GPT-3.5高40%。
當任務復雜性達到足夠的閾值時,兩代模型之間的差異就會出現(xiàn)。整體來看,GPT-4比 GPT-3.5更可靠、更有創(chuàng)意,并且能夠處理更細微的指令。
百奧幾何公司創(chuàng)始人[1]、加拿大魁北克省人工智能研究中心(Mila)副教授、加拿大高等研究院(CIFAR)人工智能講席教授唐建表示:“GPT-4最重要的是做了 multi-modality training(多模態(tài)訓練),之前主要用的是文本和代碼數(shù)據(jù),現(xiàn)在還利用了圖像數(shù)據(jù);另外,GPT-4還用了 ChatGPT 收集到的一些數(shù)據(jù)?!?/p>
可以確定的是,GPT-4的穩(wěn)健性已經(jīng)得到保障,而 OpenAI 的主要挑戰(zhàn)是確保它可以準確地解決所遇到的每個問題。
此外,OpenAI 表示將把 GPT-4的文本輸入功能加入 ChatGPT 中,由付費用戶優(yōu)先使用,并通過等候名單發(fā)布 API。其將允許開發(fā)者把 AI 集成到自己的應用程序中,同時 OpenAI 將對約750個單詞的提示收取約3美分,對約750個單詞的回復收取6美分。
此外,OpenAI 使用了 Azure Translate 來訓練 GPT-4,從而實現(xiàn)用多語種回答問題。
然而,OpenAI 以“競爭”為由,沒有公布有關具體模型大小、以及訓練 GPT-4的硬件詳細信息。而有了這些信息,對手們就可以重新創(chuàng)建模型,這也是 OpenAI 不公開的主要原因。
微軟:新 Bing 正在 GPT-4上運行
在 OpenAI 推出 GPT-4之后,其合作伙伴兼投資股東微軟也立馬有所回應。微軟表示:“新的 Bing 正在 GPT-4上運行,這是我們?yōu)樗阉鞫ㄖ频摹!?/p>
如果你在過去五周的任何時間里使用過新 Bing 的預覽版,那么就已經(jīng)體驗過這個強大模型的早期版本。隨著 OpenAI 對 GPT-4以及更高版本進行更新,Bing 也從這些改進中受益。所以 Bing 搜索引擎早已經(jīng)用上 GPT-4了,因此用戶可以使用 Bing 編寫文本、回復消息等。
目前來看,GPT-4將專門開放給 ChatGPT Plus 用戶,每月支付20美元之后可以獲得高級訪問權限,總而言之目前暫不支持免費使用。
對于 ChatGPT,美國伊利諾伊大學香檳分校計算機系教授李博表示,短期來看她覺得 ChatGPT 作為文章寫作、代碼生成的輔助查錯工具還不錯,但是還不能完全依賴 ChatGPT 來做回答和搜索,因為它的回答不能保證正確性。長期來看,她認為 ChatGPT 可以和不同的 AI 模型工具結合,做更友好的自動問答系統(tǒng)、學習工具等輔助性工具。此外李博認為,如果要長久發(fā)展并用于重要領域中,ChatGPT 的可信賴性保證、糾錯能力等非常重要。
另據(jù)悉,OpenAI 還宣布與語言學習應用程序 Duolingo 、以及專為視障人士設計的應用程序 Be My Eyes 的背后公司建立合作,以便為殘障人士提供支持。
美國非營利教育機構可汗學院,將使用 GPT-4為學生創(chuàng)建人工智能導師(名為“Khanmigo”);冰島政府將用其幫助維護冰島本土語言;金融公司摩根士丹利,則使用 GPT-4來管理、搜索和組織其龐大的內(nèi)容庫。
概括來說在具體應用上,GPT-4的高級推理技能,可以為用戶提供更準確、更詳細的回答;鑒于 GPT-4具備更強大的語言能力和圖像識別能力,因此可以簡化市場營銷、新聞和社交媒體內(nèi)容的創(chuàng)建過程;在教育領域,GPT-4可以通過生成內(nèi)容、以及以類似人類的方式來回答問題,故能在一定程度上幫助學生和教育工作者。不過,對于將 GPT-4用于學術目的,人們的看法并不一致,因為學生可能會在沒有完全理解相關知識的情況下依靠它來完成作業(yè),而這和我們接受教育的目的是相悖的。
OpenAI 創(chuàng)始人 Sam Altman 也表示,盡管 GPT-4的未來非常令人期待,但是仍然存在缺陷,所生成的內(nèi)容仍然存在一定的偏見性,也仍然存在一定的“幻覺”,也就是 GPT-4會創(chuàng)建“不正確但聽起來似是而非”的虛構信息。
事實上,Sam Altman 一直對于 GPT-4持有相對務實的評價,在1月份接受關于 GPT-4的采訪時他說:“人們的期望越高,失望就越大,”“現(xiàn)在有很多炒作...... 我們沒有實現(xiàn)真正的 AGI,但這似乎是對我們的期望?!?/p>
(來源:資料圖)
“狂潮”與隱憂相伴相生
回顧歷史,最早描述 GPT 的論文發(fā)表于2018年,GPT-2于2019年公布、GPT-3則于2020年公布。這些模型基于巨大的文本數(shù)據(jù)集訓練而來,其中大部分是從互聯(lián)網(wǎng)上抓取的數(shù)據(jù)。
事實上,OpenAI 原本推遲了 GPT-4的發(fā)布,因為擔心會被用于惡意目的,例如生成垃圾郵件和錯誤信息。但在2022年底,該公司推出了 ChatGPT——一種基于 GPT-3.5的對話式聊天機器人,并可以被任何人免費試用。
ChatGPT 的推出在科技界引發(fā)了一場狂潮,谷歌也緊隨其后。
在大模型上,對手們一直在積極回應 OpenAI。幾乎在同一時間,OpenAI 的競爭對手——一家名為 Anthropic 的初創(chuàng)公司推出了一款名為 Claude 的聊天機器人。Anthropic 最近從谷歌籌集了3億美元。與 GPT-4一樣,名為 Claude 的聊天機器人支持廣泛的文本處理。它可以匯總文檔、生成新文本、回答搜索查詢和編寫代碼,以及執(zhí)行其他任務。Anthropic 表示其已將這款聊天機器人提供給許多早期客戶。同時在視頻生成大模型上,Meta 有 Make-A-Video,谷歌則有 Imagen Video,它們都能根據(jù)用戶輸入來制作視頻。而在北京時間3月16日,百度也將推出文心一言大模型。
隨著 AI 語言模型的日益突出,對其潛在濫用的擔憂也有所增加。批評者認為,OpenAI 等公司正急于利用未經(jīng)測試、不受監(jiān)管和不可預測的技術,這些技術可能會欺騙人們、威脅藝術家的作品并造成現(xiàn)實世界的傷害。盡管存在這些擔憂,但 GPT-4和類似的 AI 模型,確實提供了巨大的經(jīng)濟潛力。
支持:Ren
排版:羅以
參考資料:
1. https://www.biogeom.com/
https://voonze.com/discover-openais-revolutionary-ai-gpt-4-the-most-advanced-model-yet/
https://www.gizmochina.com/2023/03/14/gpt-4-aces-professional-exams/
https://siliconangle.com/2023/03/14/openai-debuts-gpt-4-rival-anthropic-rolls-new-claude-chatbot/
https://www.theverge.com/2023/3/14/23638033/openai-gpt-4-chatgpt-multimodal-deep-learning
https://openai.com/
關鍵詞: