為什么會(huì)對(duì)百度文心一言的發(fā)布會(huì)失望？

2023-03-16 17:46:49 來(lái)源：手機(jī)網(wǎng)易網(wǎng)

我說(shuō)的倒不是自己對(duì)發(fā)布會(huì)失望，因?yàn)槲覜](méi)有什么預(yù)期，就是放空大腦地看，看完也沒(méi)有什么感覺(jué)。打開(kāi)雪球，百度股價(jià)已經(jīng)跌慘了，還在轉(zhuǎn)折，剛寫(xiě)到這，又跌下去了。

(資料圖片)

微信群、朋友圈乃至微博和即刻，也是負(fù)面的聲音居多，各種梗圖又都出來(lái)了。這是市場(chǎng)的整體情緒：很失望。

為什么失望呢？我觀察了一下，大概有幾方面。

第一，沒(méi)有新東西。

這次文心一言（文心大模型基礎(chǔ)上的對(duì)話產(chǎn)品是文心一言，圖片產(chǎn)品是文心一格）的對(duì)話方式甚至包括 UI 界面，就是完全復(fù)制的 ChatGPT，這個(gè)當(dāng)然不好詬病什么，畢竟大家都差不多。

但這里面演示的內(nèi)容，都是舊的，別人已經(jīng)做過(guò)的。

比如多模態(tài)，輸入圖片或者輸出聲音，本是挺亮眼的，可惜昨天 GPT-4 發(fā)布的內(nèi)容里，也有了多模態(tài)。本來(lái)微軟那篇多模態(tài)的論文在小范圍已經(jīng)火了，GPT-4 的發(fā)布會(huì)上的演示讓人有更直接的沖擊（可以參考這篇：GPT-4 有哪些進(jìn)步，以及問(wèn)了它 6 個(gè)關(guān)心的話題）。

發(fā)布會(huì)中也有文字轉(zhuǎn)語(yǔ)音的部分，這當(dāng)然也是在內(nèi)容平臺(tái)上早就玩剩下的。短視頻里那種「注意眼前這個(gè)男人，他沒(méi)有手」的語(yǔ)音生成，大都是 AI 制作的了。

對(duì)于一鍵轉(zhuǎn)視頻的，確實(shí)讓人眼前一亮。不過(guò)這也是成熟技術(shù)，有的平臺(tái)支持這樣的功能（如 aigc.yizhentv.com）。

而作為搜索引擎公司，沒(méi)有 New Bing 這樣的功能介紹，更沒(méi)有新的與現(xiàn)有業(yè)務(wù)結(jié)合的新產(chǎn)品出現(xiàn)，就難免讓人的高預(yù)期落空了。

相當(dāng)于百度總結(jié)了一句：他們有的，我們也都有。他們沒(méi)有的，我們也沒(méi)有。

第二，沒(méi)有顯著的亮點(diǎn)。

亮點(diǎn)指的是，哪怕是同樣的功能，或者同樣的服務(wù)，是不是能有格外出色的表現(xiàn)？目前看，也沒(méi)有。

假如說(shuō) ChatGPT 只能使用英文，或者說(shuō)中文特別拉胯，那也就罷了。重要的是，GPT-4 的多語(yǔ)言加強(qiáng)之后，語(yǔ)言之間幾乎沒(méi)有壁壘了。這樣百度的中文優(yōu)勢(shì)就不存在了，且他們自己都講過(guò)，模型在英文領(lǐng)域還比較缺乏數(shù)據(jù)。

所以中文沒(méi)有優(yōu)勢(shì)，在回答的水平上就很難比較了。再者，在 demo 里呈現(xiàn)的效果，由于是錄制好的，是否能真實(shí)給出好的結(jié)果，這也是存疑的。這也就來(lái)到了第三點(diǎn)。

第三，沒(méi)有誠(chéng)意。

發(fā)布會(huì)的演示最重點(diǎn)的就是實(shí)際使用的演示，從喬布斯的年代開(kāi)始都是如此。老羅的李姐萬(wàn)歲言猶在耳。百度這次選擇了全錄制，很難不讓人聯(lián)想到是擔(dān)心出現(xiàn)老羅一樣的事故，也就代表著有很強(qiáng)烈的不自信；也可能是被 Google 演示的小錯(cuò)誤事故嚇怕了。

對(duì)話里的答案是不是專挑出好的那些，這是不好證實(shí)的；但一鍵生成視頻只要幾秒鐘，這絕對(duì)是讓人信任度大打折扣的。哪怕你把實(shí)際生成的時(shí)間放在屏幕上，讓人看到也可以。明顯是忽悠不懂行的觀眾，以為有了黑科技，這就有點(diǎn) PPT 畫(huà)餅的意思了。

整體的時(shí)間很短，而且在講產(chǎn)品不久后，立馬就開(kāi)始聊商業(yè)合作了。就像手機(jī)發(fā)布會(huì)剛開(kāi)一會(huì)兒，就說(shuō)在哪能買到了，而手機(jī)的實(shí)機(jī)還沒(méi)給大家伙看過(guò)。

第四，姿態(tài)有些急。

在發(fā)布會(huì)之前，就聽(tīng)身邊很多朋友講，百度的市場(chǎng)來(lái)聯(lián)系，期待能接入。當(dāng)然實(shí)際上是在隊(duì)列里，相當(dāng)于有了很多潛在合作對(duì)象撐場(chǎng)子。

這次發(fā)布會(huì)，也很明顯是背著很重的銷售 KPI 的（雖然不知道是誰(shuí)，以及為什么要背這么重），在聊后面的部分，都是 toB 銷售的話術(shù)，講技術(shù)的抽象概念和商業(yè)合作的價(jià)值。

聽(tīng)不出一丁點(diǎn)對(duì)產(chǎn)品的自豪感，和對(duì)真實(shí)需求的興奮表述，這跟 OpenAI 的總裁 Greg Brockman 在 GPT-4 發(fā)布會(huì)上很興奮地說(shuō)它可以畫(huà)網(wǎng)頁(yè)、可以幫自己解決某些生活上的問(wèn)題，形成了鮮明的對(duì)比。（再次推薦這個(gè)發(fā)布會(huì)：www.bilibili.com/video/BV1gv4y177rX）

總的來(lái)說(shuō)，還是沒(méi)有真正的讓大家用上的產(chǎn)品（目前文心一言的 toC 都還沒(méi)有開(kāi)放），難免會(huì)讓人往負(fù)面去猜測(cè)。就像 ChatGPT 也不是在捧得很高，自稱是全球最吊的對(duì)話機(jī)器人之后才給大家用的，而是開(kāi)放后，被驚訝到的用戶人傳人推到如今的熱度的。

文心一言還沒(méi)有開(kāi)放，不過(guò)基于文心大模型的文心一格，這個(gè)畫(huà)圖的工具是可以用的。正好 Midjourney 在今晨提供了全新的 v5 版本，這個(gè)對(duì)比就更加強(qiáng)烈了。

需要說(shuō)在前面的是，文心一格是在去年 8 月就發(fā)布的繪圖工具，很可能中間沒(méi)有任何迭代，用的還是舊的模型。不過(guò)它也自稱是當(dāng)時(shí)很先進(jìn)的模型了：

「當(dāng)前該領(lǐng)域世界最好效果。在語(yǔ)義可控性、圖像清晰度、中國(guó)文化理解等方面展現(xiàn)出了顯著優(yōu)勢(shì)。」

這是我用這個(gè)模型畫(huà)的一批圖：

我的繪畫(huà)群的群友分享了移動(dòng)端的這張圖，不太確定是不是最新的文心大模型：

同樣的提示詞，在最新的 Web 端是這樣的，效果略好一些：

那我們看 Midjourney v5 的效果：

說(shuō)到 Midjourney V5，他們的新版本已經(jīng)可以消除所謂的「AI 感」了，寫(xiě)實(shí)方面有很大的提升。這里有幾張示意，都是我自己剛畫(huà)的：

話題扯得有點(diǎn)兒遠(yuǎn)了。還是想表達(dá)，作為用戶，我們期待真正落地的、效果好的產(chǎn)品出來(lái)。

我不是旗幟鮮明要反對(duì)百度，更不是覺(jué)得國(guó)內(nèi)做不出大模型。我作為用戶和潛在的創(chuàng)業(yè)者視角，當(dāng)然很期待國(guó)內(nèi)有自己的大模型。從更善意的視角出發(fā)，也許百度這次是發(fā)布會(huì)準(zhǔn)備失當(dāng)，也許產(chǎn)品本身是質(zhì)量過(guò)硬的，都說(shuō)不好。我們也期待最新的產(chǎn)品效果的體現(xiàn)，也期待國(guó)內(nèi)有更好的大模型出現(xiàn)。

來(lái)源：劉言飛語(yǔ)

關(guān)鍵詞：