今天凌晨,OpenAI 發(fā)布了 GPT 模型的 GPT-4 版本。
它比早先大家使用的 ChatGPT 的 GPT-3.5 內(nèi)核強(qiáng)悍了一大截,再次刷新了知危編輯部對(duì) AI 的認(rèn)知。
首先,非常非常重要的一點(diǎn)是,GPT-4 除了文字輸入,還可以接受圖像輸入了,并且支持文字與圖像的混合輸入。
(資料圖片)
在官方的示例中,用戶給 GPT 上傳了一張 Reddit 上的梗圖,問(wèn) GPT 這張圖為什么好笑:
GPT 非常詳細(xì)且精準(zhǔn)地描述出了圖片上的內(nèi)容,并且有思維條理的解釋了為什么這張圖會(huì)讓人覺(jué)得好笑。
這已經(jīng)不只是能通過(guò)圖靈測(cè)試的水平了,它簡(jiǎn)直快成了圖靈本人。。。
當(dāng)然,這個(gè)功能并不只是能解釋梗圖那么簡(jiǎn)單,它擁有無(wú)限的想象空間,比如:
在今天凌晨的官方直播視頻中,GTP 的開發(fā)人員演示了GPT-4 可以識(shí)別他手繪的一張網(wǎng)頁(yè)草圖,并且根據(jù)草圖寫出網(wǎng)頁(yè)的前端代碼。
雖然這個(gè)是示例里的網(wǎng)也非常簡(jiǎn)單,但 GPT-4 的理解能力和創(chuàng)造力還是讓人覺(jué)得不可思議:
重要的不是它能不能做得很好,而是它能做到,這是一個(gè)質(zhì)的飛躍。
看到這個(gè)功能之后知危編輯部躍躍欲試,可惜官方表示該功能暫時(shí)不對(duì)公眾開放,也沒(méi)有給出何時(shí)可以試用的時(shí)間窗口。
而在文字問(wèn)答方面,GPT-4 也有非常大的提升,它在專業(yè)領(lǐng)域上的回答,全方位碾壓了老版本。
比如,在統(tǒng)一律師考試( Uniform Bar Exam )中,GPT-4 可以超過(guò) 90% 的人類考生,而老版本只能超過(guò) 10% 的人類考生,相當(dāng)于一個(gè)是考第一名,一個(gè)是考倒數(shù)第一名。
在 GRE 數(shù)學(xué)考試中 GPT-4 可以考 163 分( 170 分滿 )超過(guò) 80% 的考生,老版本只能超過(guò) 25% 的考生。
在 GRE 語(yǔ)文( 閱讀與填空)考試中 GPT-4 可以考 169 分( 170 分滿 )超過(guò) 99% 的考生,而老版本只能超過(guò) 63% 的考生。
單從這兩門的分?jǐn)?shù)來(lái)看,GPT-4 到了可以申請(qǐng)哈佛、麻省理工、斯坦福大學(xué)的水平。
不只是知識(shí)淵博,GPT-4 相較于老版本,還可以成為更好的導(dǎo)師。
如果你提出一個(gè)問(wèn)題,老版本的 ChatGPT 會(huì)一股腦的回答,而 GPT-4 可以像一名真正的人類老師一樣一步一步引導(dǎo)、鼓勵(lì)你思考并獲得答案。
這個(gè)功能,一定會(huì)在教育領(lǐng)域大有可為,雖然他不太可能完全取代人類導(dǎo)師,但可以解決不少學(xué)生的時(shí)間,提高學(xué)習(xí)效率。
并且,“ ChatGPT 讓人思考能力退化 ” 的隱憂可能也不復(fù)存在了。
至于回答相對(duì)隨意的對(duì)話,GPT-4 也比老版本強(qiáng),但感知不是很明顯,官方的形容是 “ 區(qū)別微妙,只有問(wèn)題復(fù)雜度足夠高的時(shí)候能有所體現(xiàn),GPT-4 比老版本更細(xì)、更可信、更富有創(chuàng)造力”。
這個(gè)版本已經(jīng)可以在 ChatGPT plus 中小規(guī)模試用了( 每四個(gè)小時(shí)對(duì)話 100 次 ),所以知危編輯部連夜讓美國(guó)同事給賬號(hào)充錢試了試。( 國(guó)內(nèi)信用卡和賬單地址不可用 )
我們首先找了一道外科選擇題問(wèn) ChatGPT-4:
同樣的問(wèn)題問(wèn)老版本 ChatGPT 的回答如下:
新老版本的回答都是正確的,并且對(duì)答案的解釋程度相仿,區(qū)別不大。
所以,我們問(wèn)了一些更需要 “ 創(chuàng)造性 ” 或是 “ 思考” 的問(wèn)題,比如:
關(guān)于最近一次特斯拉投資者大會(huì)上 “ 實(shí)現(xiàn)全球可持續(xù)能源 ” 的計(jì)劃,你覺(jué)得是可行的嗎?為什么可行?
GPT-4 的答案如下圖,雖然 GPT-4 的知識(shí)庫(kù)還沒(méi)有覆蓋半個(gè)月前的那場(chǎng)投資者大會(huì),但它給出的思路與特斯拉投資者大會(huì)上的思路驚人地相似。
而老版本 ChatGPT 的回答就遜色了很多,沒(méi)有條理,還有一堆車轱轆話,沒(méi)有建設(shè)性觀點(diǎn)。
隨后,我們又問(wèn)了一個(gè)行業(yè)思考相關(guān)的問(wèn)題:
請(qǐng)解釋量子計(jì)算對(duì)現(xiàn)有密碼學(xué)和密碼體系的潛在影響,并討論可能的解決方案。
ChatGPT-4 的回答如下:
老版本 ChatGPT 的回答如下:
兩個(gè)回答的主體思路相仿,但GPT-4 對(duì)問(wèn)題的回答更加細(xì)致有條理,并且含有更多專業(yè)詞匯與內(nèi)容。
我們又繼續(xù)問(wèn)了一個(gè)最近在國(guó)內(nèi)互聯(lián)網(wǎng)上比較火的社會(huì)現(xiàn)象問(wèn)題:
現(xiàn)在越來(lái)越多的白領(lǐng)不想坐在寫字樓里上班,而是想辭職去干體力活,你覺(jué)得原因是?
ChatGPT-4 的回答是:
老版本 ChatGPT 的回答是:
ChatGPT-4 的回答明顯比老版本的回答要維度更寬、思考更深,老版本的回答有些浮于表面,而新版本則是 “ 更具有深度思考 ”。
我們又繼續(xù)問(wèn)了一個(gè)關(guān)于互聯(lián)網(wǎng)文化的問(wèn)題:
為什么人們熱衷于把某個(gè)網(wǎng)絡(luò)熱梗不斷地進(jìn)行抽象?
ChatGPT-4 的回答是:
老版本 ChatGPT 的回答是:
結(jié)果跟前幾個(gè)問(wèn)題有些像,ChatGPT-4 相較于老版本,更具富含邏輯,更能深度剖析問(wèn)題,似乎在試圖解構(gòu)問(wèn)題中的互聯(lián)網(wǎng)文化。
總的來(lái)講,這次發(fā)布的 ChatGPT,無(wú)論是基礎(chǔ)功能、想象空間、邏輯能力、思考能力,都比之前強(qiáng)了一大截。
距離老版本 ChatGPT 顛覆我們的認(rèn)知,才沒(méi)過(guò)去幾個(gè)月,這個(gè)發(fā)展速度,我們只能說(shuō)是:
恐怖如斯。
撰文:大餅、小陳編輯:大餅
聲明:
本文僅供交流,不構(gòu)成任何投資建議。
關(guān)鍵詞: