天天要聞：ChatGPT-4發(fā)布，全方位碾壓老版本，甚至能懂網(wǎng)梗表情包為啥好笑

2023-03-15 10:38:48 來源：手機(jī)網(wǎng)易網(wǎng)

今天凌晨，OpenAI 發(fā)布了 GPT 模型的 GPT-4 版本。

它比早先大家使用的 ChatGPT 的 GPT-3.5 內(nèi)核強(qiáng)悍了一大截，再次刷新了知危編輯部對 AI 的認(rèn)知。

首先，非常非常重要的一點(diǎn)是，GPT-4 除了文字輸入，還可以接受圖像輸入了，并且支持文字與圖像的混合輸入。

(資料圖片)

在官方的示例中，用戶給 GPT 上傳了一張 Reddit 上的梗圖，問 GPT 這張圖為什么好笑：

GPT 非常詳細(xì)且精準(zhǔn)地描述出了圖片上的內(nèi)容，并且有思維條理的解釋了為什么這張圖會讓人覺得好笑。

這已經(jīng)不只是能通過圖靈測試的水平了，它簡直快成了圖靈本人。。。

當(dāng)然，這個功能并不只是能解釋梗圖那么簡單，它擁有無限的想象空間，比如：

在今天凌晨的官方直播視頻中，GTP 的開發(fā)人員演示了GPT-4 可以識別他手繪的一張網(wǎng)頁草圖，并且根據(jù)草圖寫出網(wǎng)頁的前端代碼。

雖然這個是示例里的網(wǎng)也非常簡單，但 GPT-4 的理解能力和創(chuàng)造力還是讓人覺得不可思議：

重要的不是它能不能做得很好，而是它能做到，這是一個質(zhì)的飛躍。

看到這個功能之后知危編輯部躍躍欲試，可惜官方表示該功能暫時不對公眾開放，也沒有給出何時可以試用的時間窗口。

而在文字問答方面，GPT-4 也有非常大的提升，它在專業(yè)領(lǐng)域上的回答，全方位碾壓了老版本。

比如，在統(tǒng)一律師考試（ Uniform Bar Exam ）中，GPT-4 可以超過 90% 的人類考生，而老版本只能超過 10% 的人類考生，相當(dāng)于一個是考第一名，一個是考倒數(shù)第一名。

在 GRE 數(shù)學(xué)考試中 GPT-4 可以考 163 分（ 170 分滿）超過 80% 的考生，老版本只能超過 25% 的考生。

在 GRE 語文（閱讀與填空）考試中 GPT-4 可以考 169 分（ 170 分滿）超過 99% 的考生，而老版本只能超過 63% 的考生。

單從這兩門的分?jǐn)?shù)來看，GPT-4 到了可以申請哈佛、麻省理工、斯坦福大學(xué)的水平。

不只是知識淵博，GPT-4 相較于老版本，還可以成為更好的導(dǎo)師。

如果你提出一個問題，老版本的 ChatGPT 會一股腦的回答，而 GPT-4 可以像一名真正的人類老師一樣一步一步引導(dǎo)、鼓勵你思考并獲得答案。

這個功能，一定會在教育領(lǐng)域大有可為，雖然他不太可能完全取代人類導(dǎo)師，但可以解決不少學(xué)生的時間，提高學(xué)習(xí)效率。

并且，“ ChatGPT 讓人思考能力退化 ” 的隱憂可能也不復(fù)存在了。

至于回答相對隨意的對話，GPT-4 也比老版本強(qiáng)，但感知不是很明顯，官方的形容是 “ 區(qū)別微妙，只有問題復(fù)雜度足夠高的時候能有所體現(xiàn)，GPT-4 比老版本更細(xì)、更可信、更富有創(chuàng)造力”。

這個版本已經(jīng)可以在 ChatGPT plus 中小規(guī)模試用了（每四個小時對話 100 次），所以知危編輯部連夜讓美國同事給賬號充錢試了試。（國內(nèi)信用卡和賬單地址不可用）

我們首先找了一道外科選擇題問 ChatGPT-4：

同樣的問題問老版本 ChatGPT 的回答如下：

新老版本的回答都是正確的，并且對答案的解釋程度相仿，區(qū)別不大。

所以，我們問了一些更需要 “ 創(chuàng)造性 ” 或是 “ 思考” 的問題，比如：

關(guān)于最近一次特斯拉投資者大會上 “ 實(shí)現(xiàn)全球可持續(xù)能源 ” 的計(jì)劃，你覺得是可行的嗎？為什么可行？

GPT-4 的答案如下圖，雖然 GPT-4 的知識庫還沒有覆蓋半個月前的那場投資者大會，但它給出的思路與特斯拉投資者大會上的思路驚人地相似。

而老版本 ChatGPT 的回答就遜色了很多，沒有條理，還有一堆車轱轆話，沒有建設(shè)性觀點(diǎn)。

隨后，我們又問了一個行業(yè)思考相關(guān)的問題：

請解釋量子計(jì)算對現(xiàn)有密碼學(xué)和密碼體系的潛在影響，并討論可能的解決方案。

ChatGPT-4 的回答如下：

老版本 ChatGPT 的回答如下：

兩個回答的主體思路相仿，但GPT-4 對問題的回答更加細(xì)致有條理，并且含有更多專業(yè)詞匯與內(nèi)容。

我們又繼續(xù)問了一個最近在國內(nèi)互聯(lián)網(wǎng)上比較火的社會現(xiàn)象問題：

現(xiàn)在越來越多的白領(lǐng)不想坐在寫字樓里上班，而是想辭職去干體力活，你覺得原因是？

ChatGPT-4 的回答是：

老版本 ChatGPT 的回答是：

ChatGPT-4 的回答明顯比老版本的回答要維度更寬、思考更深，老版本的回答有些浮于表面，而新版本則是 “ 更具有深度思考 ”。

我們又繼續(xù)問了一個關(guān)于互聯(lián)網(wǎng)文化的問題：

為什么人們熱衷于把某個網(wǎng)絡(luò)熱梗不斷地進(jìn)行抽象？

ChatGPT-4 的回答是：

老版本 ChatGPT 的回答是：

結(jié)果跟前幾個問題有些像，ChatGPT-4 相較于老版本，更具富含邏輯，更能深度剖析問題，似乎在試圖解構(gòu)問題中的互聯(lián)網(wǎng)文化。

總的來講，這次發(fā)布的 ChatGPT，無論是基礎(chǔ)功能、想象空間、邏輯能力、思考能力，都比之前強(qiáng)了一大截。

距離老版本 ChatGPT 顛覆我們的認(rèn)知，才沒過去幾個月，這個發(fā)展速度，我們只能說是：

恐怖如斯。

撰文：大餅、小陳編輯：大餅

聲明：

本文僅供交流，不構(gòu)成任何投資建議。

關(guān)鍵詞：

天天要聞：ChatGPT-4發(fā)布，全方位碾壓老版本，甚至能懂網(wǎng)梗表情包為啥好笑

天天要聞：ChatGPT-4發(fā)布，全方位碾壓老版本，甚至能懂網(wǎng)梗表情包為啥好笑