GPT-4正式推出，能使用幾乎所有編程語言，將陸續(xù)對開發(fā)者開放API，已接入微軟New Bing收費版

2023-03-15 10:46:35 來源：手機網(wǎng)易網(wǎng)

當?shù)貢r間3月14日，OpenAI 宣布正式發(fā)布 GPT-4，它擁有圖像識別功能、高級推理技能、以及處理25000個單詞的能力，在單詞處理能力上是 ChatGPT 的八倍，并可以用所有流行的編程語言寫代碼。OpenAI 還表示 GPT-4大大優(yōu)于現(xiàn)有的大型語言模型、以及大多數(shù)下一代（SOTA，State Of The Arts）模型。

【資料圖】

（來源：資料圖）

據(jù)介紹，GPT-4在模擬律師考試中的成績超出90% 的人類考生，在 SAT（Scholastic Aptitude Test，俗稱“美國高考”）的閱讀考試中超出93% 的人類考生，在 SAT 數(shù)學考試中超出89% 的人類考生。

而同樣面對律師資格考試，GPT-4的上一版 GPT-3.5的得分，僅僅超出10% 左右的人類應(yīng)試者。在現(xiàn)場演示中，GPT-4還生成了關(guān)于復雜稅務(wù)查詢的答案，盡管無法驗證其答案。

在美國，每個州的律師考試都不一樣，但一般包括選擇題和作文兩部分，涉及合同、刑法、家庭法等知識。GPT-4參加的律師考試，對于人類來說即艱苦又漫長，需要兩天才能完成。而 GPT-4卻能在專業(yè)律師考試中脫穎而出。

通過律師考試并不意味著它已準備好取代真正的律師。畢竟通過司法考試的人大有人在，因此 GPT-4不能成為真正的律師，但它確實展示了一定的本領(lǐng)，也能快速啟動一些法律任務(wù)。

（來源：資料圖）

圖像識別、高級推理、龐大的單詞掌握能力，是 GPT-4的三大特點。

就圖像識別功能來說，GPT-4可以分析圖像并提供相關(guān)信息，例如它可以根據(jù)食材照片來推薦食譜，為圖片生成圖像描述和圖注等。但是，出于對潛在濫用的擔憂，OpenAI 推遲了圖像描述功能的發(fā)布。也就是說，GPT-4的圖像輸入功能還處于尚未公開的預覽階段，目前僅能在 OpenAI 的直播中觀看效果。

就高級推理功能來說，GPT-4能夠針對3個日程做出會議時間安排，回答存在上下文關(guān)聯(lián)性的復雜問題。

就詞匯量來說，由于最多可以處理25000個單詞，因此在理解和生成長篇內(nèi)容上，GPT-4的能力更強。

GPT-4和上一代就有哪些區(qū)別？

OpenAI 聲稱 GPT-4是其“最先進的人工智能系統(tǒng)”，是該公司在擴展深度學習系統(tǒng)上的最新里程碑，并表示該模型比以往任何時候都更具有創(chuàng)造性和協(xié)作性，因為它可以更準確地解決復雜問題。

OpenAI 表示其花費了六個月的時間，來讓 GPT-4比上一代更安全。該公司通過改進監(jiān)控框架，并與醫(yī)學、地緣政治等敏感領(lǐng)域的專家進行合作，以確保 GPT-4所給答案的準確性和安全性。

GPT-4的參數(shù)量更多，這意味著它將比上一版更接近人類的認知表現(xiàn)。 GPT-4還接受了各種多模態(tài)信息的訓練，這讓它不僅可以理解和解釋輸入數(shù)據(jù)，還可以理解輸入數(shù)據(jù)所在的上下文。此外，當同時執(zhí)行多任務(wù)時，GPT-4的表現(xiàn)也更加出色。

與舊版本一樣，GPT-4由深度學習技術(shù)開發(fā)而來，是在公開可用和已被許可數(shù)據(jù)上進行的訓練，并使用強化學習和人工反饋進行微調(diào)。不過，GPT-4是在全新的深度學習堆棧上訓練的，并由 OpenAI 和微軟 Azure 團隊一起構(gòu)建。毫無疑問的是，GPT-4比上一代模型接受了更多數(shù)據(jù)訓練和計算訓練。

如果你使用過 ChatGPT 就會發(fā)現(xiàn)，它的輸入類型是純文本，輸出則是語言文本和代碼。而 GPT-4的多模態(tài)，意味著用戶可以輸入不同類型的信息，例如視頻、聲音、圖像和文本。同樣的，具備多模態(tài)能力的 GPT-4可以根據(jù)用戶提供的信息，來生成視頻、音頻、圖片和文本。哪怕你同時將文本和圖片發(fā)給 GPT-4，它也能根據(jù)這兩種不同類型的信息生出文本。

（來源：資料圖）

OpenAI 表示 GPT-4“離經(jīng)叛道”的可能性要小得多，對于不被允許的內(nèi)容請求，GPT-4的響應(yīng)可能性降低了82%。在 OpenAI 的內(nèi)部對抗性真實性評估中，GPT-4得分比 GPT-3.5高40%。

當任務(wù)復雜性達到足夠的閾值時，兩代模型之間的差異就會出現(xiàn)。整體來看，GPT-4比 GPT-3.5更可靠、更有創(chuàng)意，并且能夠處理更細微的指令。

百奧幾何公司創(chuàng)始人[1]、加拿大魁北克省人工智能研究中心（Mila）副教授、加拿大高等研究院（CIFAR）人工智能講席教授唐建表示：“GPT-4最重要的是做了 multi-modality training（多模態(tài)訓練），之前主要用的是文本和代碼數(shù)據(jù)，現(xiàn)在還利用了圖像數(shù)據(jù)；另外，GPT-4還用了 ChatGPT 收集到的一些數(shù)據(jù)。”

可以確定的是，GPT-4的穩(wěn)健性已經(jīng)得到保障，而 OpenAI 的主要挑戰(zhàn)是確保它可以準確地解決所遇到的每個問題。

此外，OpenAI 表示將把 GPT-4的文本輸入功能加入 ChatGPT 中，由付費用戶優(yōu)先使用，并通過等候名單發(fā)布 API。其將允許開發(fā)者把 AI 集成到自己的應(yīng)用程序中，同時 OpenAI 將對約750個單詞的提示收取約3美分，對約750個單詞的回復收取6美分。

此外，OpenAI 使用了 Azure Translate 來訓練 GPT-4，從而實現(xiàn)用多語種回答問題。

然而，OpenAI 以“競爭”為由，沒有公布有關(guān)具體模型大小、以及訓練 GPT-4的硬件詳細信息。而有了這些信息，對手們就可以重新創(chuàng)建模型，這也是 OpenAI 不公開的主要原因。

微軟：新 Bing 正在 GPT-4上運行

在 OpenAI 推出 GPT-4之后，其合作伙伴兼投資股東微軟也立馬有所回應(yīng)。微軟表示：“新的 Bing 正在 GPT-4上運行，這是我們?yōu)樗阉鞫ㄖ频??！?/p>

如果你在過去五周的任何時間里使用過新 Bing 的預覽版，那么就已經(jīng)體驗過這個強大模型的早期版本。隨著 OpenAI 對 GPT-4以及更高版本進行更新，Bing 也從這些改進中受益。所以 Bing 搜索引擎早已經(jīng)用上 GPT-4了，因此用戶可以使用 Bing 編寫文本、回復消息等。

目前來看，GPT-4將專門開放給 ChatGPT Plus 用戶，每月支付20美元之后可以獲得高級訪問權(quán)限，總而言之目前暫不支持免費使用。

對于 ChatGPT，美國伊利諾伊大學香檳分校計算機系教授李博表示，短期來看她覺得 ChatGPT 作為文章寫作、代碼生成的輔助查錯工具還不錯，但是還不能完全依賴 ChatGPT 來做回答和搜索，因為它的回答不能保證正確性。長期來看，她認為 ChatGPT 可以和不同的 AI 模型工具結(jié)合，做更友好的自動問答系統(tǒng)、學習工具等輔助性工具。此外李博認為，如果要長久發(fā)展并用于重要領(lǐng)域中，ChatGPT 的可信賴性保證、糾錯能力等非常重要。

另據(jù)悉，OpenAI 還宣布與語言學習應(yīng)用程序 Duolingo 、以及專為視障人士設(shè)計的應(yīng)用程序 Be My Eyes 的背后公司建立合作，以便為殘障人士提供支持。

美國非營利教育機構(gòu)可汗學院，將使用 GPT-4為學生創(chuàng)建人工智能導師（名為“Khanmigo”）；冰島政府將用其幫助維護冰島本土語言；金融公司摩根士丹利，則使用 GPT-4來管理、搜索和組織其龐大的內(nèi)容庫。

概括來說在具體應(yīng)用上，GPT-4的高級推理技能，可以為用戶提供更準確、更詳細的回答；鑒于 GPT-4具備更強大的語言能力和圖像識別能力，因此可以簡化市場營銷、新聞和社交媒體內(nèi)容的創(chuàng)建過程；在教育領(lǐng)域，GPT-4可以通過生成內(nèi)容、以及以類似人類的方式來回答問題，故能在一定程度上幫助學生和教育工作者。不過，對于將 GPT-4用于學術(shù)目的，人們的看法并不一致，因為學生可能會在沒有完全理解相關(guān)知識的情況下依靠它來完成作業(yè)，而這和我們接受教育的目的是相悖的。

OpenAI 創(chuàng)始人 Sam Altman 也表示，盡管 GPT-4的未來非常令人期待，但是仍然存在缺陷，所生成的內(nèi)容仍然存在一定的偏見性，也仍然存在一定的“幻覺”，也就是 GPT-4會創(chuàng)建“不正確但聽起來似是而非”的虛構(gòu)信息。

事實上，Sam Altman 一直對于 GPT-4持有相對務(wù)實的評價，在1月份接受關(guān)于 GPT-4的采訪時他說：“人們的期望越高，失望就越大，”“現(xiàn)在有很多炒作...... 我們沒有實現(xiàn)真正的 AGI，但這似乎是對我們的期望?！?/p>

（來源：資料圖）

“狂潮”與隱憂相伴相生

回顧歷史，最早描述 GPT 的論文發(fā)表于2018年，GPT-2于2019年公布、GPT-3則于2020年公布。這些模型基于巨大的文本數(shù)據(jù)集訓練而來，其中大部分是從互聯(lián)網(wǎng)上抓取的數(shù)據(jù)。

事實上，OpenAI 原本推遲了 GPT-4的發(fā)布，因為擔心會被用于惡意目的，例如生成垃圾郵件和錯誤信息。但在2022年底，該公司推出了 ChatGPT——一種基于 GPT-3.5的對話式聊天機器人，并可以被任何人免費試用。

ChatGPT 的推出在科技界引發(fā)了一場狂潮，谷歌也緊隨其后。

在大模型上，對手們一直在積極回應(yīng) OpenAI。幾乎在同一時間，OpenAI 的競爭對手——一家名為 Anthropic 的初創(chuàng)公司推出了一款名為 Claude 的聊天機器人。Anthropic 最近從谷歌籌集了3億美元。與 GPT-4一樣，名為 Claude 的聊天機器人支持廣泛的文本處理。它可以匯總文檔、生成新文本、回答搜索查詢和編寫代碼，以及執(zhí)行其他任務(wù)。Anthropic 表示其已將這款聊天機器人提供給許多早期客戶。同時在視頻生成大模型上，Meta 有 Make-A-Video，谷歌則有 Imagen Video，它們都能根據(jù)用戶輸入來制作視頻。而在北京時間3月16日，百度也將推出文心一言大模型。

隨著 AI 語言模型的日益突出，對其潛在濫用的擔憂也有所增加。批評者認為，OpenAI 等公司正急于利用未經(jīng)測試、不受監(jiān)管和不可預測的技術(shù)，這些技術(shù)可能會欺騙人們、威脅藝術(shù)家的作品并造成現(xiàn)實世界的傷害。盡管存在這些擔憂，但 GPT-4和類似的 AI 模型，確實提供了巨大的經(jīng)濟潛力。

支持：Ren

排版：羅以

參考資料：

1. https://www.biogeom.com/

https://voonze.com/discover-openais-revolutionary-ai-gpt-4-the-most-advanced-model-yet/

https://www.gizmochina.com/2023/03/14/gpt-4-aces-professional-exams/

https://siliconangle.com/2023/03/14/openai-debuts-gpt-4-rival-anthropic-rolls-new-claude-chatbot/

https://www.theverge.com/2023/3/14/23638033/openai-gpt-4-chatgpt-multimodal-deep-learning

https://openai.com/

關(guān)鍵詞：

GPT-4正式推出，能使用幾乎所有編程語言，將陸續(xù)對開發(fā)者開放API，已接入微軟New Bing收費版

GPT-4正式推出，能使用幾乎所有編程語言，將陸續(xù)對開發(fā)者開放API，已接入微軟New Bing收費版