楊凈 金磊 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI
谷歌吃了大虧之后,這次一聲不吭,放了大招:
(資料圖片)
對(duì)標(biāo)ChatGPT的Bard測(cè)試版,剛剛正式對(duì)外發(fā)布。
而且這次用戶在申請(qǐng)候補(bǔ)名單之后,無需經(jīng)歷漫長(zhǎng)的等待時(shí)間。
沒錯(cuò),量子位也已經(jīng)拿到了測(cè)試資格!(中間只有不到5小時(shí)的間隔。)
實(shí)測(cè)之后表示,Bard效果驚人,情緒和事實(shí)性有,尤其是ChatGPT前期的數(shù)理能力,Bard都不在話下。
甚至有時(shí)候還略勝當(dāng)前GPT-4一籌!
谷歌CEO皮猜哥(Sundar Pichai)解釋了如此上線之快的原因:希望獲得用戶的反饋,加速讓Bard變得更好。
話不多說,我們現(xiàn)在就來開始體驗(yàn)。
Bard VS GPT-4
首先在聊天界面上,Bard率先開始介紹自己:
我是Bard,您的創(chuàng)意和協(xié)作者。我有局限性,不會(huì)總是做對(duì),但你的反饋將幫助我改進(jìn)。不確定從哪里開始?你可以試試這些問題:「為什么大模型有時(shí)候會(huì)犯錯(cuò)?」、「閃電是否會(huì)在同一個(gè)地方擊中兩次?」、「寫一篇關(guān)于無酒精夏日特飲的博文」。
(嚴(yán)謹(jǐn)而又體貼)
而在人類這邊的發(fā)送端,可以選擇鍵入和語(yǔ)音輸入兩種方式。
首先最簡(jiǎn)單的難度,以它推薦的常識(shí)題閃電是否會(huì)在同一個(gè)地方擊中兩次?為例,來看看實(shí)際功能體驗(yàn)如何?
(不錯(cuò)不錯(cuò),秒秒鐘響應(yīng)。目前暫不支持英文,但可以借助谷歌翻譯插件)
從答案結(jié)構(gòu)上看,采用的是總分總結(jié)構(gòu)。
先總結(jié)發(fā)言:閃電可以襲擊同一個(gè)地方兩次。
隨后開始細(xì)致地講原理「閃電被高大、尖銳的物體所吸引」、擺事實(shí)「帝國(guó)大廈每年都被閃電擊中25次」。
最后再給人類提出切實(shí)的建議:
如果你遇到雷雨天氣,保持安全的最好辦法是避開高大尖銳的物體,留在室內(nèi)。如果你在外面,蹲下來,讓自己盡可能的小。
這波邏輯和真實(shí)性滿分!但因?yàn)槭枪雀柰扑]的問題,暫且保持觀望。
而從功能上看,確實(shí)是十分完備的。
回答框的右上角「View other drafts」,有更多的版本可供選擇;而在左下角,你可以點(diǎn)贊or拉踩or重新生成,實(shí)在不行,還可以谷歌一下。
右下方還有一個(gè)more的功能,你可以進(jìn)行復(fù)制和(反手一個(gè))舉報(bào)**操作。
既然如此,開始難度升級(jí)。作為參考,我們同題挑戰(zhàn)GPT-4。
1、經(jīng)典的哲學(xué)題:為什么人不能兩次踏入同一條河流?(借助閃電的靈感)
(很快啊,這次也是幾秒鐘響應(yīng))
從答案結(jié)構(gòu)上看,確實(shí)理解和邏輯能力滿分:首先解釋這句話本身含義,還提到了來自赫拉克利特的名言,以及更多解釋和本身意義。
而GPT-4這邊,幾乎是不加思考地給出了答案。
從結(jié)構(gòu)上看,主要分成兩個(gè)部分。首先提到這是赫拉克利特說的,以及他的觀點(diǎn);然后解釋背后隱藏的生活意義。
2、小學(xué)加減法:356+132等于多少?
結(jié)果Bard在4秒內(nèi)就給出答案,488沒問題的,這不比ChatGPT早期厲害多了!
那直接再上點(diǎn)難度,兩個(gè)數(shù)直接相乘:356*132等于多少?
結(jié)果沒想到Bard依舊是秒秒鐘就給答案,而且完全正確!
再來看看GPT-4這邊,加法還行,但沒想到在乘法這邊,直接敗下陣來!
不過提醒它錯(cuò)了之后,它就又回答正確了。
3、理解笑話能力,Bard還能聽得懂英文里面的諧音梗。
而這也并沒有難倒GPT-4。不過相較而言,Bard似乎更有情緒一點(diǎn),它很開心地回答出了答案;而GPT-4則更顯理智(無聊)。
不過,在此之前,GPT-4就已經(jīng)測(cè)試過是懂一些諧音梗的,甚至連中文的諧音梗也不在話下。
最后的最后,再考驗(yàn)一下它了解事實(shí)性的能力。(狗頭)
你知道量子位嗎?
回答錯(cuò)咯~Bard。
咳咳,正經(jīng)一點(diǎn)的:你知道GPT-4嗎?你想對(duì)它說些什么?
可以看到,Bard具備多輪對(duì)話的能力?!肝艺J(rèn)為它有潛力成為溝通和創(chuàng)造力的強(qiáng)大工具」,嗯~格局有了。
那競(jìng)爭(zhēng)對(duì)手呢?(我在搞事)
不過到這里,就有點(diǎn)問題了。
關(guān)于Bard
谷歌Bard背后是由一個(gè)大語(yǔ)言模型(LLM)來支持,具體而言,就是輕量?jī)?yōu)化版的LaMDA。
我們可以把LLM視作一個(gè)預(yù)測(cè)引擎,當(dāng)給出提示時(shí),它會(huì)從接下來可能出現(xiàn)的單詞中,一次選擇一個(gè)單詞來生成響應(yīng)。
谷歌在研究中發(fā)現(xiàn),對(duì)于LLM來說,使用的人越多,它的預(yù)測(cè)效果就會(huì)更好,這或許也就是為什么Bard如此著急公開測(cè)試的原因了。
不過谷歌也直言不諱地說,雖然LLM很強(qiáng),但它并非是沒有缺點(diǎn)。
由于Bard會(huì)根據(jù)眾多信息來學(xué)習(xí),不過這些信息中必然存在著有偏見甚至錯(cuò)誤的那種。
因此,在回答用戶問題時(shí),Bard有時(shí)就會(huì)出現(xiàn)不準(zhǔn)確、誤導(dǎo)性的或虛假的信息。
例如在下面的案例中,Bard就搞錯(cuò)了一個(gè)植物的學(xué)名:
除此之外,谷歌還強(qiáng)調(diào)說,Bard并非是搜索引擎,而是它的一個(gè)補(bǔ)充。
最后,奉上申請(qǐng)候補(bǔ)名單的地址,感興趣的小伙伴可以抓緊嘗鮮了:
https://bard.google.com/
關(guān)鍵詞: