今天凌晨,OpenAI 發(fā)布了 GPT 模型的 GPT-4 版本。
它比早先大家使用的 ChatGPT 的 GPT-3.5 內(nèi)核強(qiáng)悍了一大截,再次刷新了知危編輯部對 AI 的認(rèn)知。
首先,非常非常重要的一點(diǎn)是,GPT-4 除了文字輸入,還可以接受圖像輸入了,并且支持文字與圖像的混合輸入。
(資料圖片)
在官方的示例中,用戶給 GPT 上傳了一張 Reddit 上的梗圖,問 GPT 這張圖為什么好笑:
GPT 非常詳細(xì)且精準(zhǔn)地描述出了圖片上的內(nèi)容,并且有思維條理的解釋了為什么這張圖會讓人覺得好笑。
這已經(jīng)不只是能通過圖靈測試的水平了,它簡直快成了圖靈本人。。。
當(dāng)然,這個功能并不只是能解釋梗圖那么簡單,它擁有無限的想象空間,比如:
在今天凌晨的官方直播視頻中,GTP 的開發(fā)人員演示了GPT-4 可以識別他手繪的一張網(wǎng)頁草圖,并且根據(jù)草圖寫出網(wǎng)頁的前端代碼。
雖然這個是示例里的網(wǎng)也非常簡單,但 GPT-4 的理解能力和創(chuàng)造力還是讓人覺得不可思議:
重要的不是它能不能做得很好,而是它能做到,這是一個質(zhì)的飛躍。
看到這個功能之后知危編輯部躍躍欲試,可惜官方表示該功能暫時不對公眾開放,也沒有給出何時可以試用的時間窗口。
而在文字問答方面,GPT-4 也有非常大的提升,它在專業(yè)領(lǐng)域上的回答,全方位碾壓了老版本。
比如,在統(tǒng)一律師考試( Uniform Bar Exam )中,GPT-4 可以超過 90% 的人類考生,而老版本只能超過 10% 的人類考生,相當(dāng)于一個是考第一名,一個是考倒數(shù)第一名。
在 GRE 數(shù)學(xué)考試中 GPT-4 可以考 163 分( 170 分滿 )超過 80% 的考生,老版本只能超過 25% 的考生。
在 GRE 語文( 閱讀與填空)考試中 GPT-4 可以考 169 分( 170 分滿 )超過 99% 的考生,而老版本只能超過 63% 的考生。
單從這兩門的分?jǐn)?shù)來看,GPT-4 到了可以申請哈佛、麻省理工、斯坦福大學(xué)的水平。
不只是知識淵博,GPT-4 相較于老版本,還可以成為更好的導(dǎo)師。
如果你提出一個問題,老版本的 ChatGPT 會一股腦的回答,而 GPT-4 可以像一名真正的人類老師一樣一步一步引導(dǎo)、鼓勵你思考并獲得答案。
這個功能,一定會在教育領(lǐng)域大有可為,雖然他不太可能完全取代人類導(dǎo)師,但可以解決不少學(xué)生的時間,提高學(xué)習(xí)效率。
并且,“ ChatGPT 讓人思考能力退化 ” 的隱憂可能也不復(fù)存在了。
至于回答相對隨意的對話,GPT-4 也比老版本強(qiáng),但感知不是很明顯,官方的形容是 “ 區(qū)別微妙,只有問題復(fù)雜度足夠高的時候能有所體現(xiàn),GPT-4 比老版本更細(xì)、更可信、更富有創(chuàng)造力”。
這個版本已經(jīng)可以在 ChatGPT plus 中小規(guī)模試用了( 每四個小時對話 100 次 ),所以知危編輯部連夜讓美國同事給賬號充錢試了試。( 國內(nèi)信用卡和賬單地址不可用 )
我們首先找了一道外科選擇題問 ChatGPT-4:
同樣的問題問老版本 ChatGPT 的回答如下:
新老版本的回答都是正確的,并且對答案的解釋程度相仿,區(qū)別不大。
所以,我們問了一些更需要 “ 創(chuàng)造性 ” 或是 “ 思考” 的問題,比如:
關(guān)于最近一次特斯拉投資者大會上 “ 實(shí)現(xiàn)全球可持續(xù)能源 ” 的計(jì)劃,你覺得是可行的嗎?為什么可行?
GPT-4 的答案如下圖,雖然 GPT-4 的知識庫還沒有覆蓋半個月前的那場投資者大會,但它給出的思路與特斯拉投資者大會上的思路驚人地相似。
而老版本 ChatGPT 的回答就遜色了很多,沒有條理,還有一堆車轱轆話,沒有建設(shè)性觀點(diǎn)。
隨后,我們又問了一個行業(yè)思考相關(guān)的問題:
請解釋量子計(jì)算對現(xiàn)有密碼學(xué)和密碼體系的潛在影響,并討論可能的解決方案。
ChatGPT-4 的回答如下:
老版本 ChatGPT 的回答如下:
兩個回答的主體思路相仿,但GPT-4 對問題的回答更加細(xì)致有條理,并且含有更多專業(yè)詞匯與內(nèi)容。
我們又繼續(xù)問了一個最近在國內(nèi)互聯(lián)網(wǎng)上比較火的社會現(xiàn)象問題:
現(xiàn)在越來越多的白領(lǐng)不想坐在寫字樓里上班,而是想辭職去干體力活,你覺得原因是?
ChatGPT-4 的回答是:
老版本 ChatGPT 的回答是:
ChatGPT-4 的回答明顯比老版本的回答要維度更寬、思考更深,老版本的回答有些浮于表面,而新版本則是 “ 更具有深度思考 ”。
我們又繼續(xù)問了一個關(guān)于互聯(lián)網(wǎng)文化的問題:
為什么人們熱衷于把某個網(wǎng)絡(luò)熱梗不斷地進(jìn)行抽象?
ChatGPT-4 的回答是:
老版本 ChatGPT 的回答是:
結(jié)果跟前幾個問題有些像,ChatGPT-4 相較于老版本,更具富含邏輯,更能深度剖析問題,似乎在試圖解構(gòu)問題中的互聯(lián)網(wǎng)文化。
總的來講,這次發(fā)布的 ChatGPT,無論是基礎(chǔ)功能、想象空間、邏輯能力、思考能力,都比之前強(qiáng)了一大截。
距離老版本 ChatGPT 顛覆我們的認(rèn)知,才沒過去幾個月,這個發(fā)展速度,我們只能說是:
恐怖如斯。
撰文:大餅、小陳編輯:大餅
聲明:
本文僅供交流,不構(gòu)成任何投資建議。
關(guān)鍵詞: