我說(shuō)的倒不是自己對(duì)發(fā)布會(huì)失望,因?yàn)槲覜](méi)有什么預(yù)期,就是放空大腦地看,看完也沒(méi)有什么感覺(jué)。打開(kāi)雪球,百度股價(jià)已經(jīng)跌慘了,還在轉(zhuǎn)折,剛寫(xiě)到這,又跌下去了。
(資料圖片)
微信群、朋友圈乃至微博和即刻,也是負(fù)面的聲音居多,各種梗圖又都出來(lái)了。這是市場(chǎng)的整體情緒:很失望。
為什么失望呢?我觀察了一下,大概有幾方面。
第一,沒(méi)有新東西。
這次文心一言(文心大模型基礎(chǔ)上的對(duì)話產(chǎn)品是文心一言,圖片產(chǎn)品是文心一格)的對(duì)話方式甚至包括 UI 界面,就是完全復(fù)制的 ChatGPT,這個(gè)當(dāng)然不好詬病什么,畢竟大家都差不多。
但這里面演示的內(nèi)容,都是舊的,別人已經(jīng)做過(guò)的。
比如多模態(tài),輸入圖片或者輸出聲音,本是挺亮眼的,可惜昨天 GPT-4 發(fā)布的內(nèi)容里,也有了多模態(tài)。本來(lái)微軟那篇多模態(tài)的論文在小范圍已經(jīng)火了,GPT-4 的發(fā)布會(huì)上的演示讓人有更直接的沖擊(可以參考這篇:GPT-4 有哪些進(jìn)步,以及問(wèn)了它 6 個(gè)關(guān)心的話題)。
發(fā)布會(huì)中也有文字轉(zhuǎn)語(yǔ)音的部分,這當(dāng)然也是在內(nèi)容平臺(tái)上早就玩剩下的。短視頻里那種「注意眼前這個(gè)男人,他沒(méi)有手」的語(yǔ)音生成,大都是 AI 制作的了。
對(duì)于一鍵轉(zhuǎn)視頻的,確實(shí)讓人眼前一亮。不過(guò)這也是成熟技術(shù),有的平臺(tái)支持這樣的功能(如 aigc.yizhentv.com)。
而作為搜索引擎公司,沒(méi)有 New Bing 這樣的功能介紹,更沒(méi)有新的與現(xiàn)有業(yè)務(wù)結(jié)合的新產(chǎn)品出現(xiàn),就難免讓人的高預(yù)期落空了。
相當(dāng)于百度總結(jié)了一句:他們有的,我們也都有。他們沒(méi)有的,我們也沒(méi)有。
第二,沒(méi)有顯著的亮點(diǎn)。
亮點(diǎn)指的是,哪怕是同樣的功能,或者同樣的服務(wù),是不是能有格外出色的表現(xiàn)?目前看,也沒(méi)有。
假如說(shuō) ChatGPT 只能使用英文,或者說(shuō)中文特別拉胯,那也就罷了。重要的是,GPT-4 的多語(yǔ)言加強(qiáng)之后,語(yǔ)言之間幾乎沒(méi)有壁壘了。這樣百度的中文優(yōu)勢(shì)就不存在了,且他們自己都講過(guò),模型在英文領(lǐng)域還比較缺乏數(shù)據(jù)。
所以中文沒(méi)有優(yōu)勢(shì),在回答的水平上就很難比較了。再者,在 demo 里呈現(xiàn)的效果,由于是錄制好的,是否能真實(shí)給出好的結(jié)果,這也是存疑的。這也就來(lái)到了第三點(diǎn)。
第三,沒(méi)有誠(chéng)意。
發(fā)布會(huì)的演示最重點(diǎn)的就是實(shí)際使用的演示,從喬布斯的年代開(kāi)始都是如此。老羅的李姐萬(wàn)歲言猶在耳。百度這次選擇了全錄制,很難不讓人聯(lián)想到是擔(dān)心出現(xiàn)老羅一樣的事故,也就代表著有很強(qiáng)烈的不自信;也可能是被 Google 演示的小錯(cuò)誤事故嚇怕了。
對(duì)話里的答案是不是專(zhuān)挑出好的那些,這是不好證實(shí)的;但一鍵生成視頻只要幾秒鐘,這絕對(duì)是讓人信任度大打折扣的。哪怕你把實(shí)際生成的時(shí)間放在屏幕上,讓人看到也可以。明顯是忽悠不懂行的觀眾,以為有了黑科技,這就有點(diǎn) PPT 畫(huà)餅的意思了。
整體的時(shí)間很短,而且在講產(chǎn)品不久后,立馬就開(kāi)始聊商業(yè)合作了。就像手機(jī)發(fā)布會(huì)剛開(kāi)一會(huì)兒,就說(shuō)在哪能買(mǎi)到了,而手機(jī)的實(shí)機(jī)還沒(méi)給大家伙看過(guò)。
第四,姿態(tài)有些急。
在發(fā)布會(huì)之前,就聽(tīng)身邊很多朋友講,百度的市場(chǎng)來(lái)聯(lián)系,期待能接入。當(dāng)然實(shí)際上是在隊(duì)列里,相當(dāng)于有了很多潛在合作對(duì)象撐場(chǎng)子。
這次發(fā)布會(huì),也很明顯是背著很重的銷(xiāo)售 KPI 的(雖然不知道是誰(shuí),以及為什么要背這么重),在聊后面的部分,都是 toB 銷(xiāo)售的話術(shù),講技術(shù)的抽象概念和商業(yè)合作的價(jià)值。
聽(tīng)不出一丁點(diǎn)對(duì)產(chǎn)品的自豪感,和對(duì)真實(shí)需求的興奮表述,這跟 OpenAI 的總裁 Greg Brockman 在 GPT-4 發(fā)布會(huì)上很興奮地說(shuō)它可以畫(huà)網(wǎng)頁(yè)、可以幫自己解決某些生活上的問(wèn)題,形成了鮮明的對(duì)比。(再次推薦這個(gè)發(fā)布會(huì):www.bilibili.com/video/BV1gv4y177rX)
總的來(lái)說(shuō),還是沒(méi)有真正的讓大家用上的產(chǎn)品(目前文心一言的 toC 都還沒(méi)有開(kāi)放),難免會(huì)讓人往負(fù)面去猜測(cè)。就像 ChatGPT 也不是在捧得很高,自稱是全球最吊的對(duì)話機(jī)器人之后才給大家用的,而是開(kāi)放后,被驚訝到的用戶人傳人推到如今的熱度的。
文心一言還沒(méi)有開(kāi)放,不過(guò)基于文心大模型的文心一格,這個(gè)畫(huà)圖的工具是可以用的。正好 Midjourney 在今晨提供了全新的 v5 版本,這個(gè)對(duì)比就更加強(qiáng)烈了。
需要說(shuō)在前面的是,文心一格是在去年 8 月就發(fā)布的繪圖工具,很可能中間沒(méi)有任何迭代,用的還是舊的模型。不過(guò)它也自稱是當(dāng)時(shí)很先進(jìn)的模型了:
「當(dāng)前該領(lǐng)域世界最好效果。在語(yǔ)義可控性、圖像清晰度、中國(guó)文化理解等方面展現(xiàn)出了顯著優(yōu)勢(shì)?!?/p>
這是我用這個(gè)模型畫(huà)的一批圖:
我的繪畫(huà)群的群友分享了移動(dòng)端的這張圖,不太確定是不是最新的文心大模型:
同樣的提示詞,在最新的 Web 端是這樣的,效果略好一些:
那我們看 Midjourney v5 的效果:
說(shuō)到 Midjourney V5,他們的新版本已經(jīng)可以消除所謂的「AI 感」了,寫(xiě)實(shí)方面有很大的提升。這里有幾張示意 ,都是我自己剛畫(huà)的:
話題扯得有點(diǎn)兒遠(yuǎn)了。還是想表達(dá),作為用戶,我們期待真正落地的、效果好的產(chǎn)品出來(lái)。
我不是旗幟鮮明要反對(duì)百度,更不是覺(jué)得國(guó)內(nèi)做不出大模型。我作為用戶和潛在的創(chuàng)業(yè)者視角,當(dāng)然很期待國(guó)內(nèi)有自己的大模型。從更善意的視角出發(fā),也許百度這次是發(fā)布會(huì)準(zhǔn)備失當(dāng),也許產(chǎn)品本身是質(zhì)量過(guò)硬的,都說(shuō)不好。我們也期待最新的產(chǎn)品效果的體現(xiàn),也期待國(guó)內(nèi)有更好的大模型出現(xiàn)。
來(lái)源:劉言飛語(yǔ)
關(guān)鍵詞:
最新資訊