谷歌版ChatGPT公測炸了！比GPT-4數(shù)學能力還強，體驗名額發(fā)得很快全球百事通

2023-03-22 18:28:30 來源：手機網(wǎng)易網(wǎng)

楊凈金磊發(fā)自凹非寺量子位 | 公眾號 QbitAI

谷歌吃了大虧之后，這次一聲不吭，放了大招：

(資料圖片)

對標ChatGPT的Bard測試版，剛剛正式對外發(fā)布。

而且這次用戶在申請候補名單之后，無需經(jīng)歷漫長的等待時間。

沒錯，量子位也已經(jīng)拿到了測試資格?。ㄖ虚g只有不到5小時的間隔。）

實測之后表示，Bard效果驚人，情緒和事實性有，尤其是ChatGPT前期的數(shù)理能力，Bard都不在話下。

甚至有時候還略勝當前GPT-4一籌！

谷歌CEO皮猜哥（Sundar Pichai）解釋了如此上線之快的原因：希望獲得用戶的反饋，加速讓Bard變得更好。

話不多說，我們現(xiàn)在就來開始體驗。

Bard VS GPT-4

首先在聊天界面上，Bard率先開始介紹自己：

我是Bard，您的創(chuàng)意和協(xié)作者。我有局限性，不會總是做對，但你的反饋將幫助我改進。不確定從哪里開始？你可以試試這些問題：「為什么大模型有時候會犯錯？」、「閃電是否會在同一個地方擊中兩次？」、「寫一篇關(guān)于無酒精夏日特飲的博文」。

（嚴謹而又體貼）

而在人類這邊的發(fā)送端，可以選擇鍵入和語音輸入兩種方式。

首先最簡單的難度，以它推薦的常識題閃電是否會在同一個地方擊中兩次？為例，來看看實際功能體驗如何？

（不錯不錯，秒秒鐘響應。目前暫不支持英文，但可以借助谷歌翻譯插件）

從答案結(jié)構(gòu)上看，采用的是總分總結(jié)構(gòu)。

先總結(jié)發(fā)言：閃電可以襲擊同一個地方兩次。

隨后開始細致地講原理「閃電被高大、尖銳的物體所吸引」、擺事實「帝國大廈每年都被閃電擊中25次」。

最后再給人類提出切實的建議：

如果你遇到雷雨天氣，保持安全的最好辦法是避開高大尖銳的物體，留在室內(nèi)。如果你在外面，蹲下來，讓自己盡可能的小。

這波邏輯和真實性滿分！但因為是谷歌推薦的問題，暫且保持觀望。

而從功能上看，確實是十分完備的。

回答框的右上角「View other drafts」，有更多的版本可供選擇；而在左下角，你可以點贊or拉踩or重新生成，實在不行，還可以谷歌一下。

右下方還有一個more的功能，你可以進行復制和（反手一個）舉報**操作。

既然如此，開始難度升級。作為參考，我們同題挑戰(zhàn)GPT-4。

1、經(jīng)典的哲學題：為什么人不能兩次踏入同一條河流？（借助閃電的靈感）

（很快啊，這次也是幾秒鐘響應）

從答案結(jié)構(gòu)上看，確實理解和邏輯能力滿分：首先解釋這句話本身含義，還提到了來自赫拉克利特的名言，以及更多解釋和本身意義。

而GPT-4這邊，幾乎是不加思考地給出了答案。

從結(jié)構(gòu)上看，主要分成兩個部分。首先提到這是赫拉克利特說的，以及他的觀點；然后解釋背后隱藏的生活意義。

2、小學加減法：356+132等于多少？

結(jié)果Bard在4秒內(nèi)就給出答案，488沒問題的，這不比ChatGPT早期厲害多了！

那直接再上點難度，兩個數(shù)直接相乘：356*132等于多少？

結(jié)果沒想到Bard依舊是秒秒鐘就給答案，而且完全正確！

再來看看GPT-4這邊，加法還行，但沒想到在乘法這邊，直接敗下陣來！

不過提醒它錯了之后，它就又回答正確了。

3、理解笑話能力，Bard還能聽得懂英文里面的諧音梗。

而這也并沒有難倒GPT-4。不過相較而言，Bard似乎更有情緒一點，它很開心地回答出了答案；而GPT-4則更顯理智（無聊）。

不過，在此之前，GPT-4就已經(jīng)測試過是懂一些諧音梗的，甚至連中文的諧音梗也不在話下。

最后的最后，再考驗一下它了解事實性的能力。（狗頭）

你知道量子位嗎？

回答錯咯~Bard。

咳咳，正經(jīng)一點的：你知道GPT-4嗎？你想對它說些什么？

可以看到，Bard具備多輪對話的能力?！肝艺J為它有潛力成為溝通和創(chuàng)造力的強大工具」，嗯~格局有了。

那競爭對手呢？（我在搞事）

不過到這里，就有點問題了。

關(guān)于Bard

谷歌Bard背后是由一個大語言模型（LLM）來支持，具體而言，就是輕量優(yōu)化版的LaMDA。

我們可以把LLM視作一個預測引擎，當給出提示時，它會從接下來可能出現(xiàn)的單詞中，一次選擇一個單詞來生成響應。

谷歌在研究中發(fā)現(xiàn)，對于LLM來說，使用的人越多，它的預測效果就會更好，這或許也就是為什么Bard如此著急公開測試的原因了。

不過谷歌也直言不諱地說，雖然LLM很強，但它并非是沒有缺點。

由于Bard會根據(jù)眾多信息來學習，不過這些信息中必然存在著有偏見甚至錯誤的那種。

因此，在回答用戶問題時，Bard有時就會出現(xiàn)不準確、誤導性的或虛假的信息。

例如在下面的案例中，Bard就搞錯了一個植物的學名：

除此之外，谷歌還強調(diào)說，Bard并非是搜索引擎，而是它的一個補充。

最后，奉上申請候補名單的地址，感興趣的小伙伴可以抓緊嘗鮮了：

https://bard.google.com/

關(guān)鍵詞：

谷歌版ChatGPT公測炸了！比GPT-4數(shù)學能力還強，體驗名額發(fā)得很快 全球百事通

谷歌版ChatGPT公測炸了！比GPT-4數(shù)學能力還強，體驗名額發(fā)得很快全球百事通