為什么會對百度文心一言的發(fā)布會失望？

2023-03-16 17:46:49 來源：手機網(wǎng)易網(wǎng)

我說的倒不是自己對發(fā)布會失望，因為我沒有什么預期，就是放空大腦地看，看完也沒有什么感覺。打開雪球，百度股價已經(jīng)跌慘了，還在轉(zhuǎn)折，剛寫到這，又跌下去了。

(資料圖片)

微信群、朋友圈乃至微博和即刻，也是負面的聲音居多，各種梗圖又都出來了。這是市場的整體情緒：很失望。

為什么失望呢？我觀察了一下，大概有幾方面。

第一，沒有新東西。

這次文心一言（文心大模型基礎(chǔ)上的對話產(chǎn)品是文心一言，圖片產(chǎn)品是文心一格）的對話方式甚至包括 UI 界面，就是完全復制的 ChatGPT，這個當然不好詬病什么，畢竟大家都差不多。

但這里面演示的內(nèi)容，都是舊的，別人已經(jīng)做過的。

比如多模態(tài)，輸入圖片或者輸出聲音，本是挺亮眼的，可惜昨天 GPT-4 發(fā)布的內(nèi)容里，也有了多模態(tài)。本來微軟那篇多模態(tài)的論文在小范圍已經(jīng)火了，GPT-4 的發(fā)布會上的演示讓人有更直接的沖擊（可以參考這篇：GPT-4 有哪些進步，以及問了它 6 個關(guān)心的話題）。

發(fā)布會中也有文字轉(zhuǎn)語音的部分，這當然也是在內(nèi)容平臺上早就玩剩下的。短視頻里那種「注意眼前這個男人，他沒有手」的語音生成，大都是 AI 制作的了。

對于一鍵轉(zhuǎn)視頻的，確實讓人眼前一亮。不過這也是成熟技術(shù)，有的平臺支持這樣的功能（如 aigc.yizhentv.com）。

而作為搜索引擎公司，沒有 New Bing 這樣的功能介紹，更沒有新的與現(xiàn)有業(yè)務(wù)結(jié)合的新產(chǎn)品出現(xiàn)，就難免讓人的高預期落空了。

相當于百度總結(jié)了一句：他們有的，我們也都有。他們沒有的，我們也沒有。

第二，沒有顯著的亮點。

亮點指的是，哪怕是同樣的功能，或者同樣的服務(wù)，是不是能有格外出色的表現(xiàn)？目前看，也沒有。

假如說 ChatGPT 只能使用英文，或者說中文特別拉胯，那也就罷了。重要的是，GPT-4 的多語言加強之后，語言之間幾乎沒有壁壘了。這樣百度的中文優(yōu)勢就不存在了，且他們自己都講過，模型在英文領(lǐng)域還比較缺乏數(shù)據(jù)。

所以中文沒有優(yōu)勢，在回答的水平上就很難比較了。再者，在 demo 里呈現(xiàn)的效果，由于是錄制好的，是否能真實給出好的結(jié)果，這也是存疑的。這也就來到了第三點。

第三，沒有誠意。

發(fā)布會的演示最重點的就是實際使用的演示，從喬布斯的年代開始都是如此。老羅的李姐萬歲言猶在耳。百度這次選擇了全錄制，很難不讓人聯(lián)想到是擔心出現(xiàn)老羅一樣的事故，也就代表著有很強烈的不自信；也可能是被 Google 演示的小錯誤事故嚇怕了。

對話里的答案是不是專挑出好的那些，這是不好證實的；但一鍵生成視頻只要幾秒鐘，這絕對是讓人信任度大打折扣的。哪怕你把實際生成的時間放在屏幕上，讓人看到也可以。明顯是忽悠不懂行的觀眾，以為有了黑科技，這就有點 PPT 畫餅的意思了。

整體的時間很短，而且在講產(chǎn)品不久后，立馬就開始聊商業(yè)合作了。就像手機發(fā)布會剛開一會兒，就說在哪能買到了，而手機的實機還沒給大家伙看過。

第四，姿態(tài)有些急。

在發(fā)布會之前，就聽身邊很多朋友講，百度的市場來聯(lián)系，期待能接入。當然實際上是在隊列里，相當于有了很多潛在合作對象撐場子。

這次發(fā)布會，也很明顯是背著很重的銷售 KPI 的（雖然不知道是誰，以及為什么要背這么重），在聊后面的部分，都是 toB 銷售的話術(shù)，講技術(shù)的抽象概念和商業(yè)合作的價值。

聽不出一丁點對產(chǎn)品的自豪感，和對真實需求的興奮表述，這跟 OpenAI 的總裁 Greg Brockman 在 GPT-4 發(fā)布會上很興奮地說它可以畫網(wǎng)頁、可以幫自己解決某些生活上的問題，形成了鮮明的對比。（再次推薦這個發(fā)布會：www.bilibili.com/video/BV1gv4y177rX）

總的來說，還是沒有真正的讓大家用上的產(chǎn)品（目前文心一言的 toC 都還沒有開放），難免會讓人往負面去猜測。就像 ChatGPT 也不是在捧得很高，自稱是全球最吊的對話機器人之后才給大家用的，而是開放后，被驚訝到的用戶人傳人推到如今的熱度的。

文心一言還沒有開放，不過基于文心大模型的文心一格，這個畫圖的工具是可以用的。正好 Midjourney 在今晨提供了全新的 v5 版本，這個對比就更加強烈了。

需要說在前面的是，文心一格是在去年 8 月就發(fā)布的繪圖工具，很可能中間沒有任何迭代，用的還是舊的模型。不過它也自稱是當時很先進的模型了：

「當前該領(lǐng)域世界最好效果。在語義可控性、圖像清晰度、中國文化理解等方面展現(xiàn)出了顯著優(yōu)勢?！?/p>

這是我用這個模型畫的一批圖：

我的繪畫群的群友分享了移動端的這張圖，不太確定是不是最新的文心大模型：

同樣的提示詞，在最新的 Web 端是這樣的，效果略好一些：

那我們看 Midjourney v5 的效果：

說到 Midjourney V5，他們的新版本已經(jīng)可以消除所謂的「AI 感」了，寫實方面有很大的提升。這里有幾張示意，都是我自己剛畫的：

話題扯得有點兒遠了。還是想表達，作為用戶，我們期待真正落地的、效果好的產(chǎn)品出來。

我不是旗幟鮮明要反對百度，更不是覺得國內(nèi)做不出大模型。我作為用戶和潛在的創(chuàng)業(yè)者視角，當然很期待國內(nèi)有自己的大模型。從更善意的視角出發(fā)，也許百度這次是發(fā)布會準備失當，也許產(chǎn)品本身是質(zhì)量過硬的，都說不好。我們也期待最新的產(chǎn)品效果的體現(xiàn)，也期待國內(nèi)有更好的大模型出現(xiàn)。

來源：劉言飛語

關(guān)鍵詞：