出品|虎嗅科技組
作者|齊健
編輯|陳伊凡
(資料圖)
頭圖| 視覺中國
ChatGPT加入搜索后,會顛覆Google嗎?
這是過去幾周里,在科技產(chǎn)業(yè)圈里熱議的話題。
1月3日,科技媒體The Information爆料了人工智能研究實驗室OpenAI與微軟Bing最新的合作計劃。兩位直接參與該計劃的人士稱,微軟正與OpenAI一起研究一款具備AI對話能力的新版Bing搜索引擎,預(yù)計將于3月底前公布。該版本將融合了OpenAI最新推出的對話大模型ChatGPT,與以往單純羅列網(wǎng)頁鏈接的搜索模式不同,ChatGPT可以直接回答搜索查詢。
DA Davidson分析師甚至因此給予了微軟“買入”評級,并稱,短期內(nèi)OpenAI的ChatGPT,將會轉(zhuǎn)化為Azure的增量。從長遠(yuǎn)來看,將ChatGPT功能整合到必應(yīng)(Bing)可能會為微軟提供十年一次的推翻谷歌搜索主導(dǎo)地位的機會。
在此合作之前,微軟一直出錢出力,支持OpenAI業(yè)務(wù)。2020年,微軟以10億美元投資OpenAI。同年,微軟Azuer云也成為了OpenAI的獨家算力伙伴。在此之前OpenAI曾一度成為Google云的五大企業(yè)客戶之一,年單1.2億美元。不過,微軟收購OpenAI之后,似乎從微軟拿到了極低的云計算折扣。有數(shù)據(jù)顯示,在2021財年中,OpenAI在微軟產(chǎn)品上的開支僅為92000美元,而以O(shè)penAI運維、研發(fā)GPT-3和GPT-3.5等大模型的進度來看,云計算用量并未有明顯下降。
與Bing的合作被曝出之后,OpenAI在1月6日早些時候又傳出出售股票的消息。據(jù)《華爾街日報》報道,OpenAI正在與Thrive Capital、Founders Fund兩家基金談判,以290億美元的估值出售至少價值3億美元的股票。2021年,OpenAI員工向紅杉資本、老虎環(huán)球出售股票時的估值約為200億美元。
AI對于搜索行業(yè)太超前?
既然通用大模型如此厲害,為何在搜索上積累最深的Google不做,畢竟要論搜索,Google在業(yè)內(nèi)有絕對優(yōu)勢。
據(jù)《紐約時報》報道,ChatGPT發(fā)布之后不久,Google首席執(zhí)行官Sundar Pichai就在內(nèi)部動員研究人員團隊想辦法應(yīng)對ChatGPT,并宣布這種情況是“紅色代碼”的威脅。
其實Google也并非沒有嘗試,在2021年5月的I/O大會上Google就展示了語言類通用大模型LaMDA,并持續(xù)對其進行迭代研發(fā)。然而直至目前,Google都沒有向公眾發(fā)布LaMDA,Google方面稱,部分原因在于LaMDA目前尚不完美,其中存在較多錯誤。
事實上,在大模型尚未成熟的時代,搜索引擎就已開始嘗試AI技術(shù)了。在查詢過程中,搜索引擎利用自然語言處理(Natural Language Processing,NLP)分析和理解用戶輸入的查詢詞語。在搜索過程中,利用深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN),解決“隱式搜索”問題。
“隱式搜索是百度內(nèi)部的說法,也可以叫做‘真正的語義搜索’?!币晃话俣人阉骷夹g(shù)專家告訴虎嗅,隱式搜索不再是單純的字面搜索,而是利用AI分析用戶關(guān)鍵詞語的深層意思。例如,搜索“現(xiàn)實版鋼鐵俠”,得到的搜索結(jié)果就都是馬斯克相關(guān)的內(nèi)容。
此外,Google、百度、Bing等還利用AI實驗了類似ChatGPT的AI功能,使搜索呈現(xiàn)出的結(jié)果不只是羅列網(wǎng)頁,更能從搜索結(jié)果中篩選內(nèi)容,直接回答用戶的問題。
例如搜索“ChatGPT是什么”。
Google會在側(cè)邊欄直接引用維基百科:“ChatGPT是由OpenAl開發(fā)的一個人工智能聊天機器人程序,于2022年11月推出……”
百度則會篩選搜索內(nèi)容,并摘取答案直接回答在第一條的顯著位置:“聊天機器人,chatgpt是OpenAl開發(fā)的一個大型預(yù)訓(xùn)練語言模型……”
不過這種技術(shù)在搜索行業(yè)并沒有得到廣泛認(rèn)可,甚至沒有統(tǒng)一的名字。“你可以管這種技術(shù)叫精準(zhǔn)搜索,也可以叫唯一答案或阿拉丁?!?/p>
即便是ChatGPT搜索,也仍存在一些問題。
首先,AI挑選出的內(nèi)容很難確保準(zhǔn)確性,連OpenAI的CEO Sam Altman都認(rèn)為,“現(xiàn)在依賴它(ChatGPT)來做任何重要的事情都是錯誤的。”如果把ChatGPT提供的搜索結(jié)果作為“唯一答案”呈現(xiàn)給用戶,卻無法保證其準(zhǔn)確性的話,那么在錯誤的答案面前,再好的交互體驗,都會成為笑話。
此外,有的時候用戶使用搜索引擎的目的是直接得到答案,比如你搜“ChatGPT是什么”時,你想看到的就是一個定義。但當(dāng)你搜“關(guān)于AI通用大模型的技術(shù)文章”時,你可能需要的是搜集廣泛、全面的資料,如果AI篩選了部分內(nèi)容,則可能影響你在搜索結(jié)果中博采眾長。
更重要的是經(jīng)濟賬
不過,雖然搜索引擎很早就融入了AI技術(shù),但卻很難有更深入的應(yīng)用,其中的原因就是算不好經(jīng)濟賬。
通用AI大模型的研發(fā)、運維投入都不是小數(shù)目,更別說加入了搜索。
“搜索”是一項開銷巨大的業(yè)務(wù),要利用爬蟲從互聯(lián)網(wǎng)海量數(shù)據(jù)中抓取搜索結(jié)果,背后需要大量的算力支持。據(jù)業(yè)內(nèi)人士透露,百度搜索處理的網(wǎng)頁數(shù)量在七八年前就已達到千億級別。服務(wù)器用量超過一萬臺,每年純設(shè)備成本超50億。如果算上研發(fā)、運營和維護的人工成本,總開銷可能會接近100億。雖然近兩年服務(wù)器成本或有下滑,但人力成本會一直隨著通脹逐年上升。
而這只是不包含ChatGPT情況下的純搜索成本。
數(shù)據(jù)顯示,GPT-3的訓(xùn)練成本約1200萬美元,而ChatGPT的運行成本大概是單輪回答(Single Turn)幾美分,聽起來不多,但疊加到搜索引擎每天處理的數(shù)億、數(shù)十億次搜索中,產(chǎn)生的開銷就高得過分了。如果按照每天10億次搜索量來計算,把ChatGPT的回答成本壓到最低的1美分,那么按照現(xiàn)在的匯率看,這樣一個搜索引擎2天的“答題成本”就要一個半“小目標(biāo)”。
由于ChatGPT的訓(xùn)練并不是基于非實時更新的數(shù)據(jù)庫(數(shù)據(jù)皆采集于2021年以前),它的搜索功能無法解答2021年以后的新問題。目前要對ChatGPT進行實時訓(xùn)練,就要面臨新的技術(shù)挑戰(zhàn)和成本問題。
不過也有AI行業(yè)專家認(rèn)為,實時更新的AI搜索引擎實用價值并沒有想象中那么大。雖然互聯(lián)網(wǎng)中每天新增的數(shù)據(jù)量很大,但真正有價值,值得沉淀下來的知識非常有限。用戶對于這些知識的需求,也是隨時間推移階段性增長的。這樣就可以把重新訓(xùn)練大模型或更新數(shù)據(jù)庫的時間拉長,從而攤薄成本。
那么花大價錢融入搜索引擎的ChatGPT能帶來多少回報呢?
與上邊提到過的“精準(zhǔn)搜索、唯一答案、阿拉丁”技術(shù)相似,ChatGPT也無法直接提供經(jīng)濟效益。曾經(jīng)的谷歌廣告團隊負(fù)責(zé)人Sridhar Ramaswamy就表示,ChatGPT的使用,從一定程度上阻止了用戶點擊帶有廣告的谷歌鏈接。Google在2021年的廣告業(yè)務(wù)收入為2080億美元,占Alphabet總收入的81%。
為何Bing可以去做與ChatGPT結(jié)合的嘗試?
“單看搜索業(yè)務(wù),國內(nèi)頭部搜索引擎的利潤率大概在65%左右?!币晃凰阉餍袠I(yè)專家向虎嗅透露,雖然成本會隨著服務(wù)器和人員的多少增減,但要保證搜索引擎可用,單個服務(wù)器的成本差距不大,廣告規(guī)模卻會差很多。因此營收規(guī)模越大,利潤率也越高。放在任何一個成熟的海外市場,頭部搜索引擎的利潤率也都差不多是這個數(shù)。
據(jù)微軟財報顯示,在截至2022年6月的財年數(shù)據(jù)中,搜索、MSN.com和其他新聞產(chǎn)品的廣告收入共116億美元,其中搜索業(yè)務(wù)占比較大。相比之下,Google搜索業(yè)務(wù)的同期收入至少是Bing的10倍。
據(jù)海外多家調(diào)研機構(gòu)的統(tǒng)計顯示,Bing在美國本土的市場占有率遠(yuǎn)低于Google,目前全球搜索市場中Bing的市占率不超過10%,而Google的市占率保守估計也不低于80%。從市占率看來,Bing和Goggle二者的競爭關(guān)系似乎并不明顯。
因為市場占比小,搜索利潤率相對較低,Bing很自然地不承擔(dān)過多的營收壓力,也就可以放心大膽地嘗試ChatGPT這種未來的顛覆式創(chuàng)新,而不需要考慮太多成本。
技術(shù)創(chuàng)新的故事就是如此充滿戲劇性和殘酷性。有時候賭對了一個技術(shù)路線,就能贏下未來十年甚至幾十年的商業(yè)戰(zhàn)爭。而原有技術(shù)路線的優(yōu)勢者,往往由于自身的路徑依賴,反過來被自己的優(yōu)勢地位掣肘,難以在新技術(shù)上勇往直前。正如曾經(jīng)的光刻機霸主尼康賭錯了技術(shù)路線,在浸潤式光刻機上被荷蘭ASML公司捷足先登,喪失了此后幾十年的市場領(lǐng)先地位;諾基亞在智能手機時代被后繼者超越,跌下神壇。ChatGPT大規(guī)模商用后會怎么樣,誰也不知道,而一旦爆發(fā),將是顛覆式創(chuàng)新,誰贏下了這場賭注,誰就能贏下下一個人工智能時代。
推薦閱讀