我說的倒不是自己對發(fā)布會失望,因為我沒有什么預期,就是放空大腦地看,看完也沒有什么感覺。打開雪球,百度股價已經(jīng)跌慘了,還在轉折,剛寫到這,又跌下去了。
(資料圖片)
微信群、朋友圈乃至微博和即刻,也是負面的聲音居多,各種梗圖又都出來了。這是市場的整體情緒:很失望。
為什么失望呢?我觀察了一下,大概有幾方面。
第一,沒有新東西。
這次文心一言(文心大模型基礎上的對話產(chǎn)品是文心一言,圖片產(chǎn)品是文心一格)的對話方式甚至包括 UI 界面,就是完全復制的 ChatGPT,這個當然不好詬病什么,畢竟大家都差不多。
但這里面演示的內(nèi)容,都是舊的,別人已經(jīng)做過的。
比如多模態(tài),輸入圖片或者輸出聲音,本是挺亮眼的,可惜昨天 GPT-4 發(fā)布的內(nèi)容里,也有了多模態(tài)。本來微軟那篇多模態(tài)的論文在小范圍已經(jīng)火了,GPT-4 的發(fā)布會上的演示讓人有更直接的沖擊(可以參考這篇:GPT-4 有哪些進步,以及問了它 6 個關心的話題)。
發(fā)布會中也有文字轉語音的部分,這當然也是在內(nèi)容平臺上早就玩剩下的。短視頻里那種「注意眼前這個男人,他沒有手」的語音生成,大都是 AI 制作的了。
對于一鍵轉視頻的,確實讓人眼前一亮。不過這也是成熟技術,有的平臺支持這樣的功能(如 aigc.yizhentv.com)。
而作為搜索引擎公司,沒有 New Bing 這樣的功能介紹,更沒有新的與現(xiàn)有業(yè)務結合的新產(chǎn)品出現(xiàn),就難免讓人的高預期落空了。
相當于百度總結了一句:他們有的,我們也都有。他們沒有的,我們也沒有。
第二,沒有顯著的亮點。
亮點指的是,哪怕是同樣的功能,或者同樣的服務,是不是能有格外出色的表現(xiàn)?目前看,也沒有。
假如說 ChatGPT 只能使用英文,或者說中文特別拉胯,那也就罷了。重要的是,GPT-4 的多語言加強之后,語言之間幾乎沒有壁壘了。這樣百度的中文優(yōu)勢就不存在了,且他們自己都講過,模型在英文領域還比較缺乏數(shù)據(jù)。
所以中文沒有優(yōu)勢,在回答的水平上就很難比較了。再者,在 demo 里呈現(xiàn)的效果,由于是錄制好的,是否能真實給出好的結果,這也是存疑的。這也就來到了第三點。
第三,沒有誠意。
發(fā)布會的演示最重點的就是實際使用的演示,從喬布斯的年代開始都是如此。老羅的李姐萬歲言猶在耳。百度這次選擇了全錄制,很難不讓人聯(lián)想到是擔心出現(xiàn)老羅一樣的事故,也就代表著有很強烈的不自信;也可能是被 Google 演示的小錯誤事故嚇怕了。
對話里的答案是不是專挑出好的那些,這是不好證實的;但一鍵生成視頻只要幾秒鐘,這絕對是讓人信任度大打折扣的。哪怕你把實際生成的時間放在屏幕上,讓人看到也可以。明顯是忽悠不懂行的觀眾,以為有了黑科技,這就有點 PPT 畫餅的意思了。
整體的時間很短,而且在講產(chǎn)品不久后,立馬就開始聊商業(yè)合作了。就像手機發(fā)布會剛開一會兒,就說在哪能買到了,而手機的實機還沒給大家伙看過。
第四,姿態(tài)有些急。
在發(fā)布會之前,就聽身邊很多朋友講,百度的市場來聯(lián)系,期待能接入。當然實際上是在隊列里,相當于有了很多潛在合作對象撐場子。
這次發(fā)布會,也很明顯是背著很重的銷售 KPI 的(雖然不知道是誰,以及為什么要背這么重),在聊后面的部分,都是 toB 銷售的話術,講技術的抽象概念和商業(yè)合作的價值。
聽不出一丁點對產(chǎn)品的自豪感,和對真實需求的興奮表述,這跟 OpenAI 的總裁 Greg Brockman 在 GPT-4 發(fā)布會上很興奮地說它可以畫網(wǎng)頁、可以幫自己解決某些生活上的問題,形成了鮮明的對比。(再次推薦這個發(fā)布會:www.bilibili.com/video/BV1gv4y177rX)
總的來說,還是沒有真正的讓大家用上的產(chǎn)品(目前文心一言的 toC 都還沒有開放),難免會讓人往負面去猜測。就像 ChatGPT 也不是在捧得很高,自稱是全球最吊的對話機器人之后才給大家用的,而是開放后,被驚訝到的用戶人傳人推到如今的熱度的。
文心一言還沒有開放,不過基于文心大模型的文心一格,這個畫圖的工具是可以用的。正好 Midjourney 在今晨提供了全新的 v5 版本,這個對比就更加強烈了。
需要說在前面的是,文心一格是在去年 8 月就發(fā)布的繪圖工具,很可能中間沒有任何迭代,用的還是舊的模型。不過它也自稱是當時很先進的模型了:
「當前該領域世界最好效果。在語義可控性、圖像清晰度、中國文化理解等方面展現(xiàn)出了顯著優(yōu)勢?!?/p>
這是我用這個模型畫的一批圖:
我的繪畫群的群友分享了移動端的這張圖,不太確定是不是最新的文心大模型:
同樣的提示詞,在最新的 Web 端是這樣的,效果略好一些:
那我們看 Midjourney v5 的效果:
說到 Midjourney V5,他們的新版本已經(jīng)可以消除所謂的「AI 感」了,寫實方面有很大的提升。這里有幾張示意 ,都是我自己剛畫的:
話題扯得有點兒遠了。還是想表達,作為用戶,我們期待真正落地的、效果好的產(chǎn)品出來。
我不是旗幟鮮明要反對百度,更不是覺得國內(nèi)做不出大模型。我作為用戶和潛在的創(chuàng)業(yè)者視角,當然很期待國內(nèi)有自己的大模型。從更善意的視角出發(fā),也許百度這次是發(fā)布會準備失當,也許產(chǎn)品本身是質(zhì)量過硬的,都說不好。我們也期待最新的產(chǎn)品效果的體現(xiàn),也期待國內(nèi)有更好的大模型出現(xiàn)。
來源:劉言飛語
關鍵詞:
推薦閱讀